情报学报  2020, Vol. 39 Issue (9): 979-988    DOI: 10.3772/j.issn.1000-0135.2020.09.009
  情报分析方法与技术 本期目录 | 过刊浏览 | 高级检索 |
基于PWLR模型的领域新兴趋势识别及其可视化研究
刘自强1, 胡正银2,3, 许海云2,3, 方曙2,3
1.南京师范大学新闻与传播学院,南京 210097
2.中国科学院成都文献情报中心,成都 610041
3.中国科学院大学经济与管理学院图书情报与档案管理系,北京 100190
Identifying and Visualizing Emerging Trends in Domain Based on PWLR Model
Liu Ziqiang1, Hu Zhengyin2,3, Xu Haiyun2,3, Fang Shu2,3
1.School of Journalism and Communication, Nanjing Normal University, Nanjing 210097
2.Chengdu Library and Information Center, Chinese Academy of Sciences, Chengdu 610041
3.Department of Library Information and Archives Management, School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100190
全文: PDF (3541 KB)   HTML (129 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 探索构建准确、有效的领域新兴趋势分析框架,对于新兴趋势研判、舆情监测等情报工作具有一定的意义。首先,基于N-Gram模型抽取蕴含时间标签的科技文献文本数据中的多元词汇特征Bi-Gram与Tri-Gram;其次,利用分段线性回归(piecewise linear regression,PWLR)模型对Bi-Gram、Tri-Gram进行分段拟合,探测多元词汇在近期时间线上的新兴特征,准确识别有发展潜力的新兴词汇;最后,基于上一步的新兴词汇判别结果利用层次聚类算法识别领域新兴趋势并进行可视化分析。通过对基因编辑领域进行实证研究,识别出基因编辑领域的主要新兴趋势有CRISPR-Cas9技术、基因治疗、动植物基因编辑,验证了本研究提出方法的可行性和有效性。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
刘自强
胡正银
许海云
方曙
关键词 PWLR模型新兴趋势层次聚类可视化    
收稿日期: 2019-10-20     
基金资助:中国科学院“十三五”科研信息化专项“面向干细胞领域知识发现的科研信息化应用”(XXH13506-203);国家自然科学基金项目“基于科学—技术主题关联分析的创新演化路径识别方法研究”(71704170)。
作者简介: 刘自强,男,1990年生,博士,讲师,研究方向为情报分析技术与方法,E-mail:1224615932@qq.com。胡正银,男,1979年生,博士,副研究员,研究方向为数据挖掘与知识图谱构建。许海云,女,1982年生,博士,副研究员,研究方向为情报计量学的理论与实践。方曙,男,1957年生,博士,研究员,博士生导师,研究方向为科技情报分析与研究。
引用本文:   
刘自强, 胡正银, 许海云, 方曙. 基于PWLR模型的领域新兴趋势识别及其可视化研究[J]. 情报学报, 2020, 39(9): 979-988.
Liu Ziqiang, Hu Zhengyin, Xu Haiyun, Fang Shu. Identifying and Visualizing Emerging Trends in Domain Based on PWLR Model. 情报学报, 2020, 39(9): 979-988.
链接本文:  
https://qbxb.istic.ac.cn/CN/10.3772/j.issn.1000-0135.2020.09.009     或     https://qbxb.istic.ac.cn/CN/Y2020/V39/I9/979