CiteSpace常见使用问题汇总
CiteSpace的用户在科学网的留言板上提问已经超过3,000多条。许多问题其实是非常类似甚至是完全相同而且前面已经回答过,只是留言板上好像不能有效地搜索前面的问题和答案。
我计划把用户常见问题和解答分类组织归纳为这篇博客,至少各位都可以在同一页上搜索。问题和答案将按流程中的步骤分类, 如关于问题8.23就应该是个聚类方面的问题。CiteSpace用户提问之前可以先在本页搜索一下相关问题。 如果没有找到现有答案,再去留言板提问。如果现有问题不完全适用,提问时标明现有问题的编号,以便我进一步更新完善。
由于这个归纳整理将花费很多时间,我只能采用蚂蚁搬家的办法,不定期地更新本页。欢迎提供问题和解答。
问题分类
学习资料
安装,启动,运行
数据格式(英文)
数据格式(中文)
参数设置与调整
节点类型和选择标准
图谱
聚类
Burstness
地图叠加
网络叠加
双图叠加
网络分析
文本分析
数据库接口
报告输出
问题和解答
1. 学习资料
Q1.1 最新的学习视频在哪?
网络上分享了若干,或关注 科学知识图谱学习社区公众号
t
2. 安装,启动, 运行
Q2.1 下载的安装包都解压不了会是啥问题呢?
A2.1:用7z.
Q2.2 mac上不能运行.bat批处理文件,那么有没有针对mac的citespace优化启动方案呢?直接点jar启动,是无法修改内存的。
A2.2:mac上的批处理文件可以用shell script.
Q2.2 电脑是32位系统,安装了32位的java。还能用CiteSpace吗?
A2.2:能。32位系统在内存使用上有限制。文本编辑一下StartCiteSpace.bat: 把里面的12g换成4g或更小的2g 或1g。
Q2.3 导入数据时候,节点类型选择cited reference,数据加载不成功,到某一年度就停止了。
A2.3: 1) 内存不足 2)数据格式有问题。如果是2),查看命令行里显示的文件名和行号,可在数据文件中直接修正格式问题,同时把具体问题反馈给我。
3. 数据格式(英文)
Q3.1 我在wos搜索到一共2183篇文献,分了五次下载,进行合并,然后发现虽然合并后的文档是完整的(每个年份的文献数量都与网上相符合,也有参考文献之类的词条),但是放入软件运行后,软件只能显示出合并时放在第一位的文档里的文献,其余的文献都显示不出来,我尝试把要合并的文档调整顺序,还是只能显示放在第一位的文档里的文献,请问这是合并时出现的问题还是软件的问题。
A3.1: 这种情况不需要合并。也不需要去重。
6. 节点类型和选择标准
Q6.1 项目参数设置页面的e是什么参数?这个参数修改一下对分析结果的影响很大,但不知是什么含义。
A6.1 参数e是对TopN所选节点的被引次数的附加条件,满足这一条件的节点才能入选后续分析。例如,TopN=30, e=2组合起来的意思是在每个时间切片中选取被引次数最高的30阶层。如果有多个记录具有相同的被引次数,这些记录都视为满足条件。 参数e的作用是进一步要求每条选中的记录至少被引了e次。 如果TopN所选的所有记录的被引次数都大于或等于e,这是参数e没有影响。如果TopN所选的记录中有些没有达到e,这些记录就会被过滤于掉。
Q6.2 在做引文分析时,对阈值(Thresholds)进行参数设定时,默认参数值有三组(2,2,20)(4,3,20)(4,3,20),请问您这其中的一组参数如(2,2,20)代表一个时期中c,cc,ccv,的参数,还是这一组参数代表c的前中后三个时期的参数呢?我设置years Per Slice为1,那么上面阈值的前中后期是代表一年中的前中后吗?因为我发现改变阈值参数对节点数据有很大的影响。
A6.2 三组数值各对应于整个时间区的第一段(年),最中间一段(年),和最后一段(年),其余各段(年)用线性插值设置。最后一组如果是近年的考虑采用相对低一些的数值。
7. 图谱
Q7.1 成图之后标签重叠,为什么移动节点标签不动是因为什么原因呢?
我调整节点位置之后,节点名称没有跟着一起移动,怎么解决这个问题?
A7.1 右下脚有个Avoid Overlapping Node Labels,重选一次就可以了。
Q7.2 有一个节点名称乱码了,能修改名称吗?如果可以的话,请问怎么修改?
A7.2 用citespace.alias文件替换。 新名称 tab 乱码名称。
Q7.3 centrality都显示为0怎么办?
A7.3 见主界面菜单:Preferences > Defer the calculation of centrality
8. 聚类
Q8.1 我在进行聚类分析的时候,为什么界面右上方显示cluster个数为9个,而聚类图像实际显示只有0-7?
A8.1 系统自动显示含有10个成员以上的聚类。而不满足这个条件的聚类则不显示。
用户可以调整这个限制:
1。Display > Clusters > Set the Minimum Visible Cluster Size => 1 2。Filters > Show the Largest Connected Component Only => off
Q8.2 聚类后有两个聚类标签是一样的?这该怎么处理呢?
A8.2 用LLR. Clusters > 2. Label Clusters > Cast by Top N% Citers => 100%.
13. 网络分析
Q13.1 哪些数据可以做引文分析?
A13.1 有引文数据的包括:Web of Science, Scopus, CSCD, CSSCI. 没有的包括:CNKI, PubMed
其他补充:
第1期:CiteSpace问答:https://zhuanlan.zhihu.com/p/111075396
第2期:CiteSpace问答:https://zhuanlan.zhihu.com/p/117467950
第3期:CiteSpace问答:https://zhuanlan.zhihu.com/p/128905254
关于CiteSpace问答的说明:https://zhuanlan.zhihu.com/p/114523205