情报学报  2024, Vol. 43 Issue (10): 1199-1212    DOI: 10.3772/j.issn.1000-0135.2024.10.006
  情报技术与应用 本期目录 | 过刊浏览 | 高级检索 |
全文本视角下的核心引文测度:概念界定、指标体系与识别模型
林歌歌1, 侯海燕1, 潘宇馨1, 梁国强2, 胡志刚3
1.大连理工大学公共管理学院,大连 116024
2.北京工业大学经济与管理学院,北京 100124
3.华南师范大学科学技术与社会研究院,广州 510006
Essential Reference Measurements from the Perspective of Full-Text: Concept Definition, Index System, and Identification Model
Lin Gege1, Hou Haiyan1, Pan Yuxin1, Liang Guoqiang2, Hu Zhigang3
1.School of Public Administration and Policy, Dalian University of Technology, Dalian 116024
2.College of Economics and Management, Beijing University of Technology, Beijing 100124
3.Institute for Science, Technology and Society, South China Normal University, Guangzhou 510006
全文: PDF (4269 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 识别施引文献中的核心引文是深入开展科技成果评价的重要基础。为此,本文探讨了全文本视角下的核心引文测度,包括概念界定、指标体系构建及识别模型的优化,从而提供一个更为精准的科学评价工具。首先,明确核心引文的定义,构建包含题录信息和引用信息2个维度、8个子维度及33个引文特征指标的核心引文识别指标体系。其次,通过多种机器学习模型(如随机森林、支持向量机、逻辑回归)对引文特征指标进行遴选与优化,分析其相关性及信息增益,保留21个重要的引文特征指标,并验证识别模型的有效性。研究结果表明,基于引用信息的引文特征指标在识别核心引文时具有更高的重要性和贡献度。机器学习模型在核心引文识别中的表现优异,特别是随机森林、支持向量机、逻辑回归等模型,其ROC(receiver operating characteristic)曲线的AUC(area under curve)值均大于0.85,证明了模型的高效性和鲁棒性。核心引文测度方法及识别模型不仅为科学评价体系提供了更精准的工具,也为深入研究引文分析奠定了坚实的基础。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
林歌歌
侯海燕
潘宇馨
梁国强
胡志刚
关键词 核心引文引用信息题录信息机器学习全文引文分析    
收稿日期: 2023-12-22     
基金资助:教育部哲学社会科学研究重大课题攻关项目“基础研究领域颠覆性科研成果识别与我国基础研究能力提升研究”(22JZD021);国家自然科学基金项目“基于引用行为的学术评价体系的构建与实证研究”(71974030);中央高校基本科研业务费专项资金资助项目“我国基础研究领域颠覆性科研能力评估”(DUT23RW302)。
作者简介: 林歌歌,女,1992年生,博士,主要研究方向为引文分析与信息计量;侯海燕,女,1971年生,博士,教授,博士生导师,主要研究领域为高科技前沿监测、科学计量学与科技政策;潘宇馨,女,1996年生,博士研究生,主要研究方向为科学计量学与颠覆性创新;梁国强,男,1988年生,博士,副教授,硕士生导师,主要研究领域为知识图谱、复杂网络、科学计量学;胡志刚,通信作者,男,1984年生,博士,教授,博士生导师,主要研究领域为科学计量学、信息可视化、科学学原理,E-mail:huzhigang@scnu.edu.cn;
引用本文:   
林歌歌, 侯海燕, 潘宇馨, 梁国强, 胡志刚. 全文本视角下的核心引文测度:概念界定、指标体系与识别模型[J]. 情报学报, 2024, 43(10): 1199-1212.
Lin Gege, Hou Haiyan, Pan Yuxin, Liang Guoqiang, Hu Zhigang. Essential Reference Measurements from the Perspective of Full-Text: Concept Definition, Index System, and Identification Model. 情报学报, 2024, 43(10): 1199-1212.
链接本文:  
https://qbxb.istic.ac.cn/CN/10.3772/j.issn.1000-0135.2024.10.006     或     https://qbxb.istic.ac.cn/CN/Y2024/V43/I10/1199