带摘要目录

2019年 第38卷 第11期
刊出日期:2019-11-28

情报理论与应用
情报分析方法与技术
研究进展与文献综述
情报理论与应用
1129 基于自然指数刊文数据对全球医学研究领域热点的探析 Hot!
杨颖, 许丹, 陈斯斯, 韩爽, 徐爽
DOI: 10.3772/j.issn.1000-0135.2019.11.001
自然指数从2014年提出以来,针对既有指标开展的研究如火如荼,但基于其基础数据的科学计量学分析相对匮乏。本文选择全球医学研究领域自然指数期刊为研究对象展开科学计量分析。基于共词分析和社会复杂网络理论,利用科学计量工具BICOMB及Ucinet分析近两年间发文热点的社会网络结构;同时,利用gCLUTO软件对其词篇矩阵进行双向聚类,探索其研究前沿结构构成。研究揭示了全球医学研究领域的热点前沿,为该领域发展方向提供参考,并分析自然指数在评估科研时的优缺点。
2019 Vol. 38 (11): 1129-1137 [摘要] ( 241 ) HTML (95 KB)  PDF (7240 KB)  ( 359 )
1138 社会互动对推荐系统用户感知及信息采纳的影响研究 Hot!
李治, 孙锐
DOI: 10.3772/j.issn.1000-0135.2019.11.002
个性化推荐系统(personalized recommendation system,PRS)通过考虑目标用户和相似用户的偏好生成推荐信息。基于情境实验分析,通过改变社会互动(社会参照和自我参照)的水平,使用六个针对应用程序(App)的PRS建立Web下的操作实验,获得参与者对基于社会互动的PRS评价,利用SPSS 23.0和Smart PLS 2.0软件对实验数据进行分析和处理。研究表明,社会互动环境显著提高了用户对PRS的感知精确性和新颖性,并且,研究结果证实了感知精确性和新颖性对用户满意度的正向影响,以及满意度和感知新颖性对信息采纳的正向影响。此外,研究还验证了感知精确性、感知新颖性和满意度的中介作用。本研究旨在探明社会互动因素如何影响感知精确性和新颖性,进而影响满意度和信息采纳。通过整合PRS和社会互动的功能,有助于提高对PRS用户感知有关的社会认知过程的理解。
2019 Vol. 38 (11): 1138-1149 [摘要] ( 219 ) HTML (155 KB)  PDF (1083 KB)  ( 673 )
1150 基于GBDT的学术会议替代计量学评价模型研究 Hot!
张洋, 叶月, 张宗翔, 佘芳, 陈析宇
DOI: 10.3772/j.issn.1000-0135.2019.11.003
学术会议作为科学评价的重要研究对象,同时也是传播学术成果的重要载体,它是某个学科发展到一定阶段的必然产物。在某些学科领域,学术会议因其知识传播的时效性,得到了众多学者的青睐。本文收集替代计量学指标Altmetrics.com和PlumX关于人工智能领域国际会议2007—2014年的相关数据,借助描述性统计与梯度提升决策树。通过指标筛选、数据不平衡问题处理、模型优化等步骤,形成一个基于梯度提升决策树的会议评价模型。本文使用新兴的替代计量学指标作为评价指标,同时结合当前热门的机器学习模型,有效地弥补传统文献计量学指标的不足,提升会议评价模型的准确率,丰富会议评价体系的相关研究并可作为后续研究的参考。
2019 Vol. 38 (11): 1150-1159 [摘要] ( 229 ) HTML (115 KB)  PDF (1935 KB)  ( 534 )
情报分析方法与技术
1160 基于文档关系的扩展信念网络检索模型 Hot!
徐建民, 何丹丹, 吴树芳
DOI: 10.3772/j.issn.1000-0135.2019.11.004
合理利用文档关系可以提高模型的检索性能。针对基本信念网络检索模型未考虑文档关系的不足,通过在基本模型上增加一层文档节点,提出一种具有两层文档节点的扩展信念网络检索模型,给出了模型的拓扑结构和概率推导。在拓扑结构中,术语与查询的关系、术语与文档的关系和两层文档之间的关系都用弧来表示,其中文档关系依据文档相似度确定。在概率推导中,利用文档相似度及文档节点的父文档个数对原模型的概率推导做出修正,使得检索概率更为准确。实验采用折损累积增益值和查准率-查全率曲线来评价扩展模型的性能,结果表明,扩展模型使得相关文档排名更合理,并且在保证查全率的条件下提高了查准率。
2019 Vol. 38 (11): 1160-1165 [摘要] ( 158 ) HTML (149 KB)  PDF (1064 KB)  ( 404 )
1166 多源信息融合用于新兴技术发展趋势识别——以区块链为例 Hot!
张维冲, 王芳, 赵洪
DOI: 10.3772/j.issn.1000-0135.2019.11.005
科技文献不断丰富,成为十分有价值的计量分析数据。对不同来源、不同类型科技文献的信息融合分析,能为全面揭示新兴技术的发展现状及趋势提供有力的情报支撑。从多源异构数据中有效获取主题是多源信息融合中解决“主题”计量实体问题的一项技术难点。本文面向专利、期刊论文、学位论文、会议论文、图书、基金项目、行业报告共7种不同的科技文献类型,提出了基于摘要的主题解析方法,从多源异构文本中获取主题词,并进行数据融合与主题关联分析,在处理效果和效率上都取得不错的效果,为该问题的解决提供了参考。实验部分以区块链为例,在数据融合的基础上分别进行时序性关联分析和主题关联分析,以揭示区块链技术的发展情况。结果显示,本文所提方法有效地揭示了区块链技术创新在科技文献中的产生过程、主题扩散和演化轨迹。
2019 Vol. 38 (11): 1166-1176 [摘要] ( 226 ) HTML (95 KB)  PDF (3129 KB)  ( 1311 )
1177 基于语境概念核心词提取算法研究 Hot!
石进, 韩进, 赵小柯, 刘千里
DOI: 10.3772/j.issn.1000-0135.2019.11.006
当前国内外对于语境核心词提取算法的研究较少,更多的是对于关键词提取算法的研究,本文提出了一种基于语境的依存句法分析算法。首先本文证明了依存句法分析问题可以等价为如何拆分句子得到最小尺度的语境,以及求出最小尺度语境中的核心词这两个问题。为了解决这两个问题,本文提出了两种语境核心词求解方法,分别是基于熵比较与基于入度和比较的语境核心词提取算法,并基于此进一步提出了最小语境求解算法来构建依存句法树。通过采集《情报学报》2007—2018年1152篇有效的论文数据并进行测试,分别与经典的关键词提取算法TF/IDF、Text-Rank、LDA提取的关键词进行了对比,实验结果表明,本文提出的基于语境的依存句法分析算法对于关键词的提取效果良好。
2019 Vol. 38 (11): 1177-1186 [摘要] ( 211 ) HTML (150 KB)  PDF (1079 KB)  ( 539 )
1187 大科学装置“预期-实际-扩展应用”链式模型及其实证研究——以日本SACLA装置为例 Hot!
郭世杰, 王学昭, 韩涛, 魏韧, 董璐, 李宜展, 李泽霞
DOI: 10.3772/j.issn.1000-0135.2019.11.007
为揭示大科学装置的潜在应用方向,综合采用自然语言处理、共现聚类技术和文献耦合原理,分别从3类数据源(实验研究提案、科学成果、成果施引文献)入手,提出在3个层次(设想应用情况、实际应用情况、扩展应用情况)上对大科学装置的应用主题进行分析的方法;在此基础上总结了大科学装置“预期-实际-扩展应用”链式分析模型,并以日本硬X射线自由电子激光装置——“SPring-8紧凑型自由电子激光”(SACLA)为例进行了实证研究;对硬X射线自由电子激光装置在不同学科领域的潜在应用方向进行了讨论。
2019 Vol. 38 (11): 1187-1199 [摘要] ( 237 ) HTML (91 KB)  PDF (9096 KB)  ( 479 )
1200 小规模知识库指导下的细分领域实体关系发现研究 Hot!
陈果, 许天祥
DOI: 10.3772/j.issn.1000-0135.2019.11.008
细分领域实体关系的获取是知识工程深化与泛化应用的关键问题,当前面临对人工标注语料严重依赖这一核心难题,一种自然的解决思路是利用细分领域已有的(或可低成本获取的)知识库作为指导。与通用型知识库不同,细分领域知识库往往规模较小,因此不仅要利用其中的现成知识内容,还有必要充分发掘蕴含于领域知识库中规律性的“领域元知识”。本文提出一种融合领域元知识和词嵌入向量类比的细分领域实体关系发现方案:首先,根据已有知识库抽象出特定细分领域的实体关系约束条件,如症状表征关系由<疾病,症状>实体对构成;其次,依据相应领域语料计算领域实体的词嵌入向量;随后,针对知识库中少量高质实体关系学习各类关系词嵌入类比的正负例向量基准,以此为基础训练实体关系分类器;最后,针对给定的领域实体,综合关系约束、词嵌入相似度、词嵌入类比结果分类,得到与其构成不同类型关系的实体。以心血管领域数据为例,仅用少量从百科抽取的领域知识,即可取得较好的实体关系识别效果。
2019 Vol. 38 (11): 1200-1211 [摘要] ( 172 ) HTML (132 KB)  PDF (2432 KB)  ( 544 )
研究进展与文献综述
1212 情报学基本原理的再认识 Hot!
杨建林
DOI: 10.3772/j.issn.1000-0135.2019.11.009
现有情报学基本原理的应用频次普遍偏低。本文对现有情报学基本原理进行回顾与深入解析,对一些基本原理的合理性与不足进行深入分析,发现现有情报学基本原理体系的不合理之处主要体现在5个方面:对部分基本原理的阐述过于简单,部分基本原理将情报过程中的某些现象或处理步骤直接当作原理,部分基本原理缺乏配套解释或者解释不够透彻,对数透视原理缺乏足够的科学依据与实践案例,缺乏以情报为核心概念的基本原理。在此基础上,本文提出重建情报学基本原理体系的4点建议:以情报过程为着眼点提出一组基本原理,以情报过程中的一组情报行为为着眼点提出一组基本原理,从情报学范式的相关论述中汲取有价值的思想,剔除有定律对应的基本原理。
2019 Vol. 38 (11): 1212-1221 [摘要] ( 262 ) HTML (78 KB)  PDF (695 KB)  ( 781 )
1222 词汇表示学习研究进展 Hot!
潘俊, 吴宗大
DOI: 10.3772/j.issn.1000-0135.2019.11.010
词汇语义表示是自然语言理解的基础。传统的基于语义词典的编码表示构建成本高昂,而独热表示又存在高维稀疏等缺点。词汇的分布式表示将词汇映射为低维稠密的实值向量,能有效捕捉词汇间的语义关联,是当前主流的表示技术。本文从数据特征、学习目标和优化算法三个方面,对现有的词汇表示学习方法进行了全面深入的分析,重点介绍了这些方法的理论基础、关键技术、评价指标及应用领域。此外,本文还总结了该方向面临的主要挑战以及最新研究进展,并对词汇表示学习未来的发展方向做了展望。
2019 Vol. 38 (11): 1222-1240 [摘要] ( 172 ) HTML (402 KB)  PDF (2532 KB)  ( 1000 )