CiteSpace 是一款非常强大的可视化文献计量学软件,由美国德雷塞尔大学的陈超美教授团队开发,它通过分析大量文献数据,帮助我们直观地发现一个研究领域的研究热点、研究前沿、以及它们随时间演进的脉络。

CiteSpace 分析研究热点的核心逻辑
CiteSpace 分析热点主要基于以下三个核心概念,它们构成了分析的基础:
-
关键词共现
- 逻辑:在一个研究领域中,如果两个或多个关键词频繁地出现在同一篇文献中,那么这些关键词之间就存在紧密的联系,联系越紧密,通常意味着它们代表的研究主题或方向越重要、越受关注。
- 作用:通过分析所有文献中出现频率最高的关键词,并构建它们之间的共现网络,我们就可以识别出该领域的核心研究主题和热点,网络中的节点代表关键词,节点的大小代表该关键词出现的频率(即中心性),节点之间的连线代表共现关系。
-
突现词检测
- 逻辑:研究领域是动态发展的,新的热点会不断涌现,旧的热点会逐渐消退,CiteSpace 可以检测出在特定时间段内,出现频率突然显著增加的关键词,这些被称为“突现词”。
- 作用:突现词代表了研究前沿,也就是正在兴起或受到学术界高度关注的新方向,通过分析突现词的强度和持续时间,我们可以把握领域的发展趋势和未来的研究动向。
-
聚类分析
(图片来源网络,侵删)- 逻辑:关键词共现网络可能非常复杂,包含成百上千个节点,聚类分析可以将网络中联系紧密的关键词自动分组,形成几个大的“主题簇”。
- 作用:聚类结果可以帮助我们更清晰地理解领域的宏观结构,识别出几个主要的、相对独立的研究方向,每个聚类代表一个子领域或研究热点主题,高质量的聚类(通常用 Silhouette 值衡量)意味着这个主题内部非常聚焦,而与其他主题区分度很高。
使用 CiteSpace 进行研究热点分析的详细步骤
第一步:数据准备
- 确定研究主题:明确你想分析哪个领域,人工智能在教育领域的应用”、“新冠疫情下的心理健康研究”等。
- 选择数据库:根据你的研究领域选择合适的文献数据库,如 Web of Science (WoS)、Scopus、CNKI (中国知网)、CSSCI 等,WoS 和 Scopus 是国际主流,CNKI 适合中文领域分析。
- 检索文献:在数据库中进行检索,为了提高分析结果的准确性,建议使用
TS=(主题词)或TI=(标题)这样的字段进行检索,这样可以确保关键词出现在最能代表文献核心内容的位置。 - 导出数据:将检索到的文献记录导出为 CiteSpace 可识别的格式,最常用的是
Plain Text格式。- WoS: 导出记录时,选择
Full Record and Cited References格式,然后另存为.txt文件。 - CNKI: 选择
Refworks格式,然后另存为.txt文件。
- WoS: 导出记录时,选择
第二步:数据导入与参数设置
- 打开 CiteSpace,进入主界面。
- 创建新项目:
File->New Project...,选择一个文件夹并命名。 - 导入数据:点击
Data->Import/Export->Import...,选择你刚才保存的.txt文件。 - 关键参数设置:这是最核心的一步,在右侧的
Time Slicing和Network面板中进行设置。- Time Slicing (时间切片):
- 选择一个合适的时间范围,
2010-2025,CiteSpace 会将这个时间段分成若干个切片(默认为一年一个切片)。
- 选择一个合适的时间范围,
- Term Source (术语来源):
Title(标题)、Abstract(、Author Keywords(作者关键词)、Keywords Plus(增补关键词),建议全选,这样可以获取最全面的关键词信息。
- Node Types (节点类型):
- 勾选
Keyword,因为我们分析的是研究热点,所以关键词是核心节点。
- 勾选
- Pruning (裁剪):
- 非常重要! 为了让网络图更清晰、更具可读性,必须进行裁剪,建议选择以下两种:
Pathfinder(寻径网络算法):简化网络,保留最重要的连接路径。Pruning the merged network(裁剪合并后的网络):在生成最终网络图前进行裁剪,效果通常更好。
- 非常重要! 为了让网络图更清晰、更具可读性,必须进行裁剪,建议选择以下两种:
- 其他关键参数:
Minimum Spanning Tree (MST)(最小生成树):勾选此项,可以避免网络中出现过多冗余的连线,使网络结构更清晰。g-index(g指数):设置一个合理的值,如g-index = 50,这可以过滤掉出现次数太少的节点(关键词),让网络聚焦于最重要的部分。
- Time Slicing (时间切片):
第三步:运行分析并生成图谱
- 点击工具栏上的绿色
GO按钮,开始运行分析。 - 等待程序运行完成,运行结束后,会自动生成一个关键词共现网络图谱。
第四步:结果解读
这是将图谱信息转化为知识的关键一步。
-
分析关键词共现网络图
- 节点大小:节点越大,代表该关键词出现的频次越高,是研究领域的核心热点,在“人工智能”领域,“深度学习”、“机器学习”、“神经网络”等节点会非常大。
- 节点颜色:节点的颜色代表其首次出现的时间,通过颜色,你可以看出哪些是老牌热点,哪些是新近出现的。
- 连线粗细:两个节点之间的连线越粗,代表它们的共现频次越高,关系越紧密。“深度学习”和“图像识别”之间很可能有很粗的连线。
- 中心性:这是衡量一个节点在网络中“中介”或“桥梁”作用的重要指标。
- 中心性 > 0.1 的节点被称为关键节点或转折点,这些词虽然不一定出现频次最高,但连接了不同的研究子领域,是知识结构中不可或缺的枢纽,在某个研究中,“算法”可能就是这样一个高中心性的词。
-
查看突现词
- 在 CiteSpace 界面,点击菜单栏的
Burst->Find Burst Keywords。 - 软件会生成一个列表,按突现强度对关键词进行排序。
- 解读:列表顶部的关键词是近年来突现最明显的研究前沿,你可以关注它们的突现开始年份和持续时间,从而判断这个新热点的兴起速度和生命力。
- 在 CiteSpace 界面,点击菜单栏的
-
分析聚类结果
(图片来源网络,侵删)- CiteSpace 会自动对网络进行聚类,每个聚类都有一个编号和标签(通常是该聚类中出现频率最高的关键词)。
- 聚类质量:在图谱的左下角,通常会有一个
Modularity Q = ...和Mean Silhouette = ...的值。Q > 0.3:说明聚类结构显著,网络是清晰可分的。Silhouette > 0.5:说明聚类是合理的,内部同质性好,异质性高。
- 解读:每个聚类代表一个独立的研究热点方向,在“数字人文”研究中,可能会出现“文本挖掘”、“GIS空间分析”、“社会网络分析”等几个大的聚类,分别代表了该领域的不同研究路径。
一个综合实例分析
假设我们分析了 2025-2025 年关于“可持续城市” 的文献。
-
关键词共现图显示:
- 最大的节点是 “可持续发展”,频次最高,是永恒的核心。
- 第二大节点是 “气候变化”,表明其与可持续城市研究的紧密联系。
- 节点 “智慧城市” 和 “绿色基础设施” 也非常大,是近年的热点。
- “气候变化”和“绿色基础设施”之间有粗线,说明研究者常将两者结合。
- 中心性最高的节点可能是 “治理”,说明“城市治理”是连接技术、环境、社会等不同子领域的关键议题。
-
突现词分析显示:
- “韧性城市” 从 2025 年开始突现,强度很高,至今仍在持续,这说明“城市应对风险和冲击的能力”是当前最前沿的研究方向。
- “碳中和” 从 2025 年开始突
