情报学报  2021, Vol. 40 Issue (8): 869-878    DOI: 10.3772/j.issn.1000-0135.2021.08.007
  情报分析方法与技术 本期目录 | 过刊浏览 | 高级检索 |
文献集规模对科技领域情报分析的影响:多种任务场景下的实证分析
陈果1,2, 王盼停1, 王曰芬1
1.南京理工大学经济管理学院信息管理系,南京 210094
2.江苏省社会公共安全科技协同创新中心,南京 210094
Towards an Appropriate Scale of Datasets for Domain Bibliometrics: Empirical Study under Multiple Tasks
Chen Guo1,2, Wang Panting1, Wang Yuefen1
1.Department of Information Management, School of Economics and Management, Nanjing University of Science and Technology, Nanjing 210094
2.Jiangsu Science and Technology Collaborative Innovation Center of Social Public Safety, Nanjing 210094
全文: PDF (2404 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 面向特定领域开展科技情报分析时,由于文献的集中与离散分布规律,难以有效构造全量文献集。那么多大规模的领域文献集是可靠的?这一问题在不同的情报分析任务场景下,有不同答案。本文综合考虑待分析领域大小、待分析对象(学科分类、国家、机构、关键词、引文、作者,及其各自共现关系)、待分析对象的Top值截取(如高频词)数量、结果是否考虑排序等常见的多种任务场景,设计相应的实验方案。以“人工智能”领域WoS(Web of Science)数据为例,开展多种规模的数据抽样,并计算得出抽样子文献集对全量文献集的拟合指标值为4800个,以量化结果揭示科技情报分析中不同任务场景对文献集规模的要求。研究结果表明,涉及学科与国家分类的分析任务,以极小规模文献集便可得到较为可靠的结果;涉及作者的分析任务,对于文献集规模的要求极高,有必要采用全量数据;涉及机构、关键词、引文的分析任务,文献集达到一定规模可得到较为可靠的结果,但相应规模受不同因素的影响,尤其是共现分析、截取较多Top对象和结果要求排序这三种任务场景对文献集规模要求更高。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陈果
王盼停
王曰芬
关键词 领域知识分析科技情报分析文献计量文献集规模    
收稿日期: 2019-07-21     
基金资助:国家社会科学基金重大项目“面向知识创新服务的数据科学理论与方法研究”(16DZA224)。
作者简介: 陈果,男,1986年生,博士,副教授,硕士生导师,研究方向为领域知识分析、知识服务,E-mail:delphi1987@qq.com;王盼停,女,1994年生,硕士研究生,研究方向为领域知识分析、文本挖掘;王曰芬,女,1963年生,教授,博士生导师,研究方向为知识服务与数据挖;
引用本文:   
陈果, 王盼停, 王曰芬. 文献集规模对科技领域情报分析的影响:多种任务场景下的实证分析[J]. 情报学报, 2021, 40(8): 869-878.
Chen Guo, Wang Panting, Wang Yuefen. Towards an Appropriate Scale of Datasets for Domain Bibliometrics: Empirical Study under Multiple Tasks. 情报学报, 2021, 40(8): 869-878.
链接本文:  
https://qbxb.istic.ac.cn/CN/10.3772/j.issn.1000-0135.2021.08.007     或     https://qbxb.istic.ac.cn/CN/Y2021/V40/I8/869