文件夹信息统计及数据分析教程

来自NoteExpress知识库
2020年1月10日 (五) 18:40Admin讨论 | 贡献的版本

跳转至: 导航搜索

按照一定检索式收集的文献,其元数据本身隐含了很多该研究方向的信息。

例如年份分布展示了研究的热度趋势;关键词分布展示了研究切入点的情况;来源分布展示了哪些刊物更关注这类研究的进展;作者的频次分布展示了该研究领域的牛人;通过计算关键词的共现频次矩阵,可以得到相关系数矩阵,进一步进行聚类分析及可视化展示各要素之间的相关关系,这些都对明晰我们所关注的科学问题提供了帮助。




针对单一元数据字段的频次分布可以使用文件夹信息统计功能。

1、在目标文件夹上点击鼠标右键 2、在右键菜单中选择【文件夹信息统计】针对当前文件夹内所有题录进行统计

数据分析1.png

3、选择要统计的字段 4、点击统计 5、展示选中字段的使用频次分布 6、点击【另存为】,可以导出为Excel文件,可供进一步使用。

数据分析2.png




针对多值字段的共现频次矩阵、相关系数和相异系数矩阵计算,以及词云图和路径关系图的绘制可以使用数据分析功能。

1、在题录列表中选中需要分析的题录。 2、点击工具栏里的【数据分析】

数据分析3.png

3、选择分析字段 4、选择分析字段的所有值或者按出现频次倒序前**个的值进行分析 5、展示左侧当前选中题录中题录的详细字段值可以双击进行编辑,标题分词可以通过“|”进行调整 6、参与分析的题录可以单独储存为一个扩展名为xml的文件,下次可以通过【打开】,载入之前保存的xml文件 7、点击下一步

数据分析4.png

8、双击可以对同义词进行词规范化 9、左侧查看规范化后的词频统计结果 10、点击下一步

数据分析5.png

11、选择分析方法 12、点击下一步

数据分析6.png

词云图

数据分析7.png

词共现关系图

数据分析8.png

共现次数矩阵、相关系数矩阵、相异系数矩阵 图

数据分析9.png


所有的统计图表都支持导出,以供进一步使用。