带摘要目录

2021年 第40卷 第10期
刊出日期:2021-10-24

情报理论与应用
情报分析方法与技术
情报学科研究与趋势
情报理论与应用
1015 基于深度交互的文本匹配模型研究 Hot!
余传明, 薛浩东, 江一帆
DOI: 10.3772/j.issn.1000-0135.2021.10.001
针对文本匹配在信息检索、文本挖掘等领域的广泛应用,本文提出一种具有良好泛化能力的深度交互文本匹配(deep interaction text matching,DITM)模型。基于匹配-聚合框架,DITM模型以编码层、共注意力层和融合层为交互模块,多次循环交互模块获取深层次的交互信息,经过多角度池化提取信息以预测文本对之间的关系。相比于基线方法,针对观点检索、答案挑选、释义识别和自然语言推理四个文本匹配任务,DITM模型在相应的数据集上均取得了最好的效果。本研究结果对于促进文本匹配模型在情报领域的实践具有重要意义。
2021 Vol. 40 (10): 1015-1026 [摘要] ( 97 ) HTML (160 KB)  PDF (1493 KB)  ( 550 )
情报分析方法与技术
1027 一种基于知识元迁移的ESI研究前沿知识演进分析方法 Hot!
孙震, 冷伏海
DOI: 10.3772/j.issn.1000-0135.2021.10.002
在前期研究的基础之上,本文提出了一种基于知识元迁移的ESI(essential science indicators)研究前沿知识演进分析方法,通过对研究前沿中的知识元迁移现象,进行定量分析和迁移程度计算,从语义分析和知识计算的角度,进一步探索研究前沿的演进机理。借助命名实体识别、词袋模型、PLDA(parallel latent Dirichlet allocation)主题模型、信息熵算法等文本语义挖掘和自然语言处理技术,通过设计贡献度指数CVI(contribution value index)和迁移度指数MVI(migration value index)两种计量指标,探究知识元的迁移规律。研究结果表明,以前沿主题中的个体知识元作为分析对象,可以从最为直接、最为细粒度的视角,对研究前沿随时间变化时内在知识结构特征的变迁规律进行挖掘,揭示领域知识要素在不同时期的演化状态,能够更为深入地回答研究前沿的追踪发展变迁问题,为面向学科前沿的科技情报工作提供方法论参考。
2021 Vol. 40 (10): 1027-1042 [摘要] ( 66 ) HTML (229 KB)  PDF (2156 KB)  ( 311 )
1043 企业潜在技术合作伙伴及竞争者预测研究——以燃料电池技术为例 Hot!
李冰, 丁堃, 孙晓玲
DOI: 10.3772/j.issn.1000-0135.2021.10.003
专利数量的快速增长,使得企业在大的行业范围内,对于潜在合作伙伴的评估和筛选以及竞争者辨识和防范变得更加耗时耗力,如何准确、快速地缩小查找范围,定位潜在关系对象变得十分重要且有意义。本文以二部图理论为基础构建了企业-专利异质性网络,研究方法选取了基于随机游走的SimRank指标的链路预测算法,对企业潜在技术合作伙伴和竞争对手进行预测分析。本文利用表示学习方法将专利文本进行语义向量化表示,通过计算专利表示向量的相似性来度量目标企业与竞合对象的技术差异判定竞合关系。最后,在燃料电池技术领域进行实证,证实研究理论和方法的有效性,为企业发展提供方法参考。
2021 Vol. 40 (10): 1043-1051 [摘要] ( 101 ) HTML (91 KB)  PDF (3070 KB)  ( 243 )
1052 知识发现视角下词汇历时语义挖掘与可视化研究 Hot!
潘俊, 吴宗大
DOI: 10.3772/j.issn.1000-0135.2021.10.004
针对中文词汇历时语义的知识挖掘问题,本研究设计了一个面向知识发现的可扩展框架,该框架基于松耦合的可配置服务式架构,底层提供数据清洗、数据规范化、历时词向量训练等服务,中间层通过XML(extensible markup language)配置来定制基础数据的抽取策略并实现界面映射,顶层通过对关键服务的组合调用,构建知识发现与可视化的应用模块。以《人民日报》词汇历时语义挖掘实践为例,给出了该框架的一个具体实现,展示了历时词向量在数字人文和社会计算研究中的可能应用模式。该方法框架及其实现具有较好的通用性,通过二次开发,能灵活构建各类面向知识发现的词汇历时语义挖掘应用,并可推广到对其他历时语料的知识挖掘。
2021 Vol. 40 (10): 1052-1064 [摘要] ( 69 ) HTML (120 KB)  PDF (5049 KB)  ( 260 )
1065 引文动态如何变化:文献内容特征的作用研究 Hot!
李凌英, 闵超, 严笑然
DOI: 10.3772/j.issn.1000-0135.2021.10.005
文献的被引情况受文献内部特征和外部环境的影响,外部环境往往难于把握,本文主要探究了文献内容特征对其被引表现的影响。引文波峰是文献被引过程中极大化的时刻,能够刻画文献动态被引特点,因此,除了传统的总被引次数外,本文还纳入引文波峰来衡量文献的被引表现,探究文献内容特征对引文波峰的影响。研究方法采用了回归分析方法,研究数据集为PubMed的生物医学文献,探究文献质量、创新类型和内容多样性三个新颖的内容特征,对被引表现(总被引次数、波峰数量、波峰到达时间、波峰高度)的贡献。其中文献质量利用同行评议数据库Faculty Opinions(F1000)的得分来衡量,创新类型依赖F1000中专家给予的标签,内容多样性用MeSH主题词的种类数和相似性来表示。研究结果表明,不同的文献特征在被引上具有不同的表现,文献获得的总被引次数受文献质量、文献创新类型和文献内容多样性的影响;波峰数量受文献内容多样性的影响,内容越丰富越可能获取较多的波峰;波峰到达时间与文献质量和内容多样性有关;波峰高度受文献质量的影响,文献质量越高,逐年被引数量变化更为平稳。
2021 Vol. 40 (10): 1065-1078 [摘要] ( 86 ) HTML (174 KB)  PDF (1309 KB)  ( 240 )
1079 学术成果的脸书提及量分布特征研究 Hot!
余厚强, 章玮, 曹雪婷
DOI: 10.3772/j.issn.1000-0135.2021.10.006
通过对2018年7月至2019年6月一年时间窗口的42.8万条脸书数据记录进行统计分析,旨在揭示脸书提及量的数值分布特征。研究结果发现,脸书提及的相对覆盖率为8.1%,处于一个相对较低的水平;脸书提及量的及时率为74%,优于新闻指标、推特指标、新浪微博指标以及政策文件指标,这表明脸书用户更为关注最新成果;成果层次的脸书提及量分布相对比较均匀,基于独立用户数计算,20%的学术成果仅获得37%的脸书提及;来源层次的脸书提及量分布基本符合布拉德福定律,识别出140个核心来源,其中,最核心的来源为The ConservationNatureScience;学科层次的分布中,脸书提及量最高的学术成果来自医学与健康科学,所占比例高达61%,生物学、心理学与认知科学也获得相对较高的提及量。这些结论为脸书替代计量指标的进一步应用提供参考。
2021 Vol. 40 (10): 1079-1091 [摘要] ( 54 ) HTML (149 KB)  PDF (1885 KB)  ( 226 )
情报学科研究与趋势
1092 面向战略决策制定的情报流程 Hot!
李品, 杨建林
DOI: 10.3772/j.issn.1000-0135.2021.10.007
情报学与情报工作一直强调支持决策,情报流程是实现情报支持决策功能的重要路径。虽然目前的绝大部分情报流程均是应满足决策需求而建立的,但忽略了多类型决策制定中对情报需求特征的差异性,专门针对战略决策支持的情报流程尚未引起重视。本文对战略决策制定的影响因素进行了系统分析,探究了情报在其中的功能,并基于系统论等经典理论,提出了面向战略决策制定的情报流程模型,试图克服传统情报流程的缺陷、解决情报流程在战略决策支持中针对性弱和应用有效性低等问题。
2021 Vol. 40 (10): 1092-1107 [摘要] ( 64 ) HTML (139 KB)  PDF (1856 KB)  ( 252 )
1108 国外过滤气泡研究:基础、脉络与展望 Hot!
姜婷婷, 许艳闰
DOI: 10.3772/j.issn.1000-0135.2021.10.008
个性化的信息推荐促使网络世界中形成了一个个无形的过滤气泡,令用户局限于狭窄的信息接收范围。本研究采用系统性综述方法,广泛收集了发表于2010—2020年的61篇与过滤气泡相关的文献,对过滤气泡的理论、技术基础以及研究脉络进行了细致的梳理与分析。研究结果发现,①过滤气泡存在与否,在很大程度上取决于研究的角度及判断的标准;②过滤气泡在大多数情况下是一种不利的存在,可能阻碍个人及社会的正常发展;③为了应对过滤气泡,研究人员一方面通过信息过滤可视化来降低过滤气泡的影响,另一方面通过对个性化推荐算法进行优化,来破除过滤气泡或阻断其形成。本研究首次对“过滤气泡”的概念特征进行了全面的解读,强调了其与个性化推荐算法的密切关联,并指出其本质在于内部信息多样性低。
2021 Vol. 40 (10): 1108-1117 [摘要] ( 88 ) HTML (133 KB)  PDF (1215 KB)  ( 294 )
1118 信息计量领域网络分析方法应用研究综述 Hot!
吴江, 王凯利, 董克, 杨玉洁, 易梦馨
DOI: 10.3772/j.issn.1000-0135.2021.10.009
网络分析方法在信息计量领域中的应用研究取得了许多重要成果,目前,相关研究已经进入调整阶段,本文总结梳理了目前的研究现状,能够为该领域的可持续发展提供借鉴。从信息计量领域中网络分析方法应用的发展历程出发,本文提出了信息计量领域网络分析方法应用的研究框架,论述了网络分析方法的本质,进一步从宏观、中观和微观三个层面系统梳理了现有应用的研究成果,最后,总结了不同层面上网络分析方法未来应用研究的方向。
2021 Vol. 40 (10): 1118-1128 [摘要] ( 103 ) HTML (178 KB)  PDF (928 KB)  ( 341 )