基于时间加权关键词词频分析的学科热点研究
奉国和, 孔泳欣
华南师范大学经济与管理学院信息管理系,广州510006
Subject Hotspot Research Based on Word Frequency Analysis of Time-Weighted Keywords
Feng Guohe, Kong Yongxin
The Department of Information Management, School of Economics & Management, South China Normal University, Guangzhou 510006
摘要 基于生命周期理论和词频分析方法,对学科领域发展过程进行客观合理的动态跟踪与分析。构建时间—关键词频次矩阵,结合相对词频、词频变化率,引入逻辑斯谛(Logistic)函数赋予词频按时间递减的权重,设计时间加权关键词词频分析模型,计算关键词综合值,揭示学科研究热点及变化趋势;并以CNKI和CSSCI收录的18种图情领域核心期刊2013—2017年所刊载的文献关键词作为实验对象,从高频词、中频词、低频词三个方面验证模型的有效性和准确性。模型计算结果显示,上升型高频词排名上浮,下降型高频词排名下沉,可快速识别上升型高频词;同时排名靠前的低频词具有发展潜能,为学者把握未来研究趋势提供科学判断依据。
关键词 :
词频分析 ,
时间加权 ,
逻辑斯谛函数 ,
研究热点 ,
趋势分析
收稿日期: 2018-04-17
基金资助: 国家社会科学基金项目“基于文本挖掘的科技文献知识发现研究”(16BTQ071)。
作者简介 : 奉国和,男,1971年生,博士,教授,硕士生导师,主要研究领域为数据挖掘、数字图书馆/数字档案馆,E-mail:ghfeng@163.com;孔泳欣,女,1995 年生,在读本科生。
1 刘自强, 王效岳, 白如江. 基于时间序列模型的研究热点分析预测方法研究[J]. 情报理论与实践, 2016, 39(5): 27-33. 2 魏瑞斌. 基于关键词的情报学研究主题分析[J]. 情报科学, 2006, 24(9): 1400-1404, 1434. 3 邱均平, 丁敬达. 1999—2008年我国图书馆学研究的实证分析(下)[J]. 中国图书馆学报, 2009, 35(6): 79-87, 118. 4 李文兰, 杨祖国. 从关键词的变化看中国图书馆学研究主题的发展[J]. 图书情报工作, 2004, 48(12): 115-118. 5 Zhao J,Yu G Y,Cai M X, et al. Bibliometric analysis of global scientific activity on umbilical cord mesenchymal stem cells: a swiftly expanding and shifting focus[J].Stem Cell Research & Therapy, 2018, 9: 32. 6 谢靖, 章鑫鑫. 基于CSSCI(2000—2011年)的中国文学研究热点知识图谱分析[J]. 西南民族大学学报(人文社会科学版), 2014, 35(5): 227-234. 7 郑彦宁, 许晓阳, 刘志辉. 基于关键词共现的研究前沿识别方法研究[J]. 图书情报工作, 2016, 60(4): 85-92. 8 周鑫, 陈媛媛. 关键词词频变化视角下学科研究发展趋势分析——以国内情报学研究为例[J]. 情报杂志, 2016, 35(5): 133-140, 112. 9 Atlam E S,Okada M,Shishibori M, et al. An evaluation method of words tendency depending on time-series variation and its improvements[J]. Information Processing & Management, 2002, 38(2): 157-171. 10 Li J,Wang Y,Yan B B.The hotspots of life cycle assessment for bioenergy: A review by social network analysis[J]. Science of the Total Environment, 2018, 625: 1301-1308. 11 Luo R,Li J,Zhao Y M, et al. A critical review on the research topic system of soil heavy metal pollution bioremediation based on dynamic co-words network measures[J]. Geoderma, 2017, 305: 281-292. 12 李长玲, 郭凤娇, 魏绪秋. 基于时序关键词的学科交叉研究主题分析——以情报学与计算机科学为例[J]. 情报资料工作, 2014(6): 44-48. 13 蒋永新, 詹华清. 基于共现关键词统计的图书馆学情报学学科研究趋势分析[J]. 图书情报工作, 2008, 52(9): 28-31. 14 李树青, 孙颖. 基于加权关键词共现时间元的个性化学术研究时序路径发现及其可视化呈现方法[J]. 情报学报, 2014, 33(1): 55-67. 15 张一楠, 黄国彬, 王亚男, 等. 近十年我国非图情领域科学计量可视化的应用研究剖析[J]. 图书馆杂志, 2015, 34(5): 32-40. 16 Choi J,Yi S,Lee K C. Analysis of keyword networks in MIS research and implications for predicting knowledge evolution[J]. Information & Management, 2011, 48(8): 371-381. 17 安宁, 滕广青, 白淑春, 等. 基于网络Hub的领域核心知识涌现研究[J]. 图书情报工作, 2017, 61(18): 98-106. 18 张敏, 朱明星, 夏宇. 关键词-时序视域下国际大数据研究主题演化分析[J]. 图书馆工作与研究, 2017(2): 66-73. 19 刘自强, 王效岳, 白如江. 多维度视角下学科主题演化可视化分析方法研究——以我国图书情报领域大数据研究为例[J]. 中国图书馆学报, 2016, 42(6): 67-84. 20 滕广青, 贺德方, 彭洁, 等. 基于网络中心性的领域知识动态演化研究[J]. 图书情报工作, 2016, 60(14): 128-134, 141. 21 Alvarez P,Pulgarin A. The Rasch model. Measuring information from keywords: The diabetes field[J]. Journal of the American Society for Information Science, 1996, 47(6): 468-476. 22 牟冬梅, 琚沅红, 郑晓月, 等. 基于时间-关键词共现分析的学科动态知识结构研究——以国外图书情报学为例[J]. 图书情报工作, 2017, 61(12): 21-31. 23 滕广青, 贺德方, 彭洁, 等. 基于网络演化的领域知识群落生长机制研究[J]. 情报理论与实践, 2016, 39(10): 16-20, 15. 24 马费成, 陈锐. 科学信息离散分布规律的研究——从文献单元到内容单元的实证分析(VII): 比较与总结[J]. 情报学报, 2000, 19(1): 82-92. 25 巩永强, 刘莉. 基于词频分析法的情报学研究热点透析[J]. 图书馆学研究, 2011(13): 9-13.
[1]
张俐, 马敏象, 杜军, 谭鹏, 普康晶, 吴斌. 基于文献计量与标引统计的医疗领域区块链技术应用发展趋势研究 [J]. 情报学报, 2021, 40(9): 962-973.
[2]
王康, 陈悦, 苏成, 赵筱媛. 多维视角下科学主题演化分析框架 [J]. 情报学报, 2021, 40(3): 297-307.
[3]
于晶. 基于社会化问答社区涌现模式分析的领域热点识别研究 [J]. 情报学报, 2021, 40(2): 213-222.
[4]
叶光辉, 毕崇武. 知识交流视域下的跨地域科研协作发展态势及趋势分析 [J]. 情报学报, 2020, 39(5): 500-510.
[5]
黄晓斌, 吴高. 学科领域研究前沿探测方法研究述评 [J]. 情报学报, 2019, 38(8): 872-880.
[6]
谭章禄, 彭胜男, 王兆刚. 基于聚类分析的国内文本挖掘热点与趋势研究 [J]. 情报学报, 2019, 38(6): 578-585.
[7]
陈晓玲, 刘东亮. 基于科学知识图谱的东北三省区域研究热点分析 [J]. 情报学报, 2018, 37(12): 1224-1231.