带摘要目录

2019年 第38卷 第6期
刊出日期:2019-06-28

情报理论与应用
情报分析方法与技术
情报用户与行为研究
情报理论与应用
557 中文学术图书引文量与Altmetrics指标探索性分析及其启示 Hot!
李明, 李江, 陈铭, 石进
DOI: 10.3772/j.issn.1000-0135.2019.06.001
对中文学术图书被引频次及其altmetrics指标间关系进行探索性分析,可为新型学术交流环境下中文学术图书影响力综合评价指标体系的合理构建提供事实参考依据。研究选取《中文学术图书引文索引》统计报告公布的三大类被引排名前十位图书为样本,在“豆瓣读书”平台搜集可获取altmetrics数据,采用相关性及主成分分析等统计方法进行分析检验。研究发现,样本图书的被引频次与其altmetrics指标映射影响力侧重点不同、相互独立与补充;从数据内在关联和聚类角度,对altmetrics指标进行进一步的成分因子提取非常必要;中文学术图书影响力综合评价横向可从学术维度和社会维度两个方面来进行,纵向则应区分传播交流与价值评判的层级高低,澄清altmetrics与传统评价方法间的关系可令整体研究更为系统化;引入altmetrics对完善中文学术图书影响力评价体系有其独特价值。
2019 Vol. 38 (6): 557-567 [摘要] ( 230 ) HTML (164 KB)  PDF (809 KB)  ( 802 )
568 文献元数据集成管理研究 Hot!
丁遒劲, 曾建勋
DOI: 10.3772/j.issn.1000-0135.2019.06.002
数字出版模式的变革使图书情报机构原有以采访编目为核心的书目数据集成优势逐步丧失,其在数据规模、数据深度、数据应用等方面均已滞后于出版商、集成商,出版商、集成商正在通过细粒度数据加工、语义关联、规模化存储等方式强化文献元数据集成管理与知识服务,现代文献信息服务业格局发生重大变化。在元数据管理体系滞后和全文资源服务版权受限的双重挑战下,图书情报机构在全文资源建设基础上,需要更加重视文献元数据资源的本地化积累与应用,通过文献元数据多来源采集获取、集成管理和语义化组织支撑现代文献信息服务体系拓展,基于海量文献元数据资源开展知识发现服务,全面释放文献资源价值,践行元数据发展战略。
2019 Vol. 38 (6): 568-577 [摘要] ( 177 ) HTML (75 KB)  PDF (1050 KB)  ( 807 )
578 基于聚类分析的国内文本挖掘热点与趋势研究 Hot!
谭章禄, 彭胜男, 王兆刚
DOI: 10.3772/j.issn.1000-0135.2019.06.003
了解国内文本挖掘领域的研究热点和趋势,对于掌握领域内容的发展变化及促进相关研究的进一步发展具有重要意义。首先,本文以CNKI数据库中1998—2017年的1155篇文本挖掘相关主题的研究文献为样本,以文章关键词的词频矩阵为数据,利用SPSS软件对其进行聚类分析。然后采用卡方统计抽取高关联度关键词对聚类结果进行解读,根据聚类结果将文本挖掘领域的文献从宏观上划分为13类,从而把握国内文本挖掘的研究热点与趋势。分析结果表明,国内关于文本挖掘的基础研究、文本大数据预处理、文本挖掘应用领域的研究是热点,有关关联规则、文本聚类、文本分类相关的应用研究文献数量较少,未来关于文本主题分析、文本大数据预处理、网络文本挖掘的研究可能成为新的趋势。
2019 Vol. 38 (6): 578-585 [摘要] ( 668 ) HTML (109 KB)  PDF (946 KB)  ( 1717 )
586 危险化学品事故情报资源的情景要素提取研究 Hot!
杨峰, 姚乐野
DOI: 10.3772/j.issn.1000-0135.2019.06.004
突发事件应急管理需要以已有情景作为风险实例,情景要素的提取能够全面剖析情景的构成和演变,对于突发事件的客观分析和科学决策都具有基础性意义。从已有的危险化学品事故情报资源集合中提取情景要素,能为形成未来事件进展的可能性组合提供基本素材,有效驱动敏感情报资源。本文选取120个危险化学品事故案例作为基础情报资源,应用扎根理论方法对危险化学品事故的情景要素进行提取,在原始编码资料质性分析得出的209个概念基础上,确定了37个范畴、13个主范畴、3个核心范畴,形成了危险化学品事故的情景要素构成,为后续危险化学品事故的情景表示和情景构建提供了参考依据。
2019 Vol. 38 (6): 586-594 [摘要] ( 302 ) HTML (114 KB)  PDF (798 KB)  ( 802 )
595 基于深度挖掘的学术论文关联数据构建与可视化分析 Hot!
曲佳彬, 欧石燕, 凌洪飞
DOI: 10.3772/j.issn.1000-0135.2019.06.005
自关联数据被提出以来,其已成为在网络上发布结构化数据的主流方式,随着关联数据集的急速增多,如何有效地消费和利用关联数据正成为研究人员关注的焦点。本研究对关联数据的深度挖掘和可视化分析进行了探索。首先,采用文本挖掘技术,深入挖掘地质领域学术论文元数据中的隐含信息;接下来,基于设计的“学术论文-学者”本体模型对学术论文元数据和挖掘出的信息进行语义化表示,以构建RDF关联数据。在此基础上,利用不同的可视化分析方法,从多个维度对学术论文关联数据中蕴含的宏观和微观知识进行可视化展示。结果表明:①基于深度挖掘的学术论文关联数据能够更加深入和全面地展示学术论文元数据中蕴涵的知识;②关联数据可视化分析能够以直观的图形展示关联数据中的宏观和微观知识,帮助用户快速对关联数据进行消费和利用。
2019 Vol. 38 (6): 595-611 [摘要] ( 243 ) HTML (110 KB)  PDF (6299 KB)  ( 718 )
情报分析方法与技术
612 中文比较关系的识别: 基于注意力机制的深度学习模型 Hot!
朱茂然, 王奕磊, 高松, 王洪伟, 郑丽娟
DOI: 10.3772/j.issn.1000-0135.2019.06.006
商品在线评论中存在着大量的比较语句,其中蕴涵着用户对不同商品或服务的体验及评价。通过挖掘评论文本中的比较信息,能够帮助企业洞察产品的市场竞争力。本文关注中文评论中的比较句识别任务,摒弃了先前研究中经常采用的模式识别方法,提出基于深度学习方法的层次多注意力网络模型。该模型获得了较好的识别精度,优于传统的分类模型和常见的深度学习文本分类模型,F1分数达到81%。本文提出的层次多注意力网络模型是端到端的,缩减了大量人工干预,有效简化了比较评论识别的工作量。
2019 Vol. 38 (6): 612-621 [摘要] ( 190 ) HTML (107 KB)  PDF (1198 KB)  ( 1546 )
622 基于二值相似度计算的异构本体融合方法 Hot!
楼雯, 王慧, 鞠源
DOI: 10.3772/j.issn.1000-0135.2019.06.007
异构本体的存在带来了知识检索的冗余,基于异构本体的知识融合是十分必要的。大量的语义相似度计算容量与复杂的计算过程使得知识融合变得困难,本文提出二值相似度计算的异构本体融合方法,将语义相似度的计算提前至原始本体的构建过程,融合时只进行概念和关系的二值匹配,从而简化融合过程再次计算语义相似度的过程。文章从实体图书元数据、小样本本体和大样本本体三个角度组织了三个实验,利用武汉大学图书馆书目数据的实验一显示本文方法可以完成本体融合的过程,实验二和实验三显示本文方法可以提高本体融合的准确性,并显著提高运行反馈时间,综合反映本体融合效果良好,但需要在召回率上进行改进。本文方法有望在扩展专家本体、减少本体构建开销等方面体现应用价值。
2019 Vol. 38 (6): 622-631 [摘要] ( 185 ) HTML (122 KB)  PDF (1205 KB)  ( 591 )
632 融合语义和社交特征的电子文献资源推荐方法研究 Hot!
杨辰, 刘婷婷, 刘雷, 牛奔, 孙见山
DOI: 10.3772/j.issn.1000-0135.2019.06.008
随着知识爆炸时代的到来,电子文献数据库的负荷将急剧扩大,用户在库中搜寻所需资源也将越发困难。因此,开发电子文献资源推荐系统从而辅助电子数据库的管理受到研究者的广泛重视。协同过滤作为时下数据库的常用推荐技术,由于仅仅考虑了用户对于文章的历史评分的相似度,忽略了用户在语义层面和社交关系的距离等重要因素因而推荐效果有限。为了在推荐系统中融入这些影响因素,本文在基于用户的协同过滤的方法基础上引入了基于主题模型的文本相似度和两种社会化的用户相似度(用户标签相似度与用户群组相似度),运用非监督的融合策略对这些相似度进行了整合。本文提出的融合文本特征与社会化指标的方法在真实数据集上展示了多源信息对于推荐准确度的增强和提升效应,对于电子文献资源的管理和传播具有较强的启示意义。
2019 Vol. 38 (6): 632-640 [摘要] ( 202 ) HTML (109 KB)  PDF (1020 KB)  ( 725 )
641 基于深度学习的领域知识对齐模型研究:知识图谱视角 Hot!
余传明, 王峰, 安璐
DOI: 10.3772/j.issn.1000-0135.2019.06.009
为了解决领域知识融合过程中所带来的冗余和不一致问题,本文从知识图谱视角研究领域知识对齐。在知识图谱深度表示学习的基础上,提出了一种新的知识图谱对齐(knowledge graph alignment,KGA)模型。为验证模型的有效性,在异构知识图谱和跨语言知识图谱的相关数据集上进行对比实验。在异构数据集上,相比于传统的MTransE和IPTransE,KGA模型的Hits@1指标值最高提升了6.40%,MRR指标值最高提升了6.30%;在跨语言数据集上,模型的Hits@1指标值最高提升了9.66%,MRR指标值最高提升了9.60%。实验结果表明,KGA模型在领域知识对齐上的效果优于传统领域知识对齐方法。研究结果对于改进知识图谱实体对齐效果,提升领域知识的覆盖率和正确率,促进知识图谱在情报学领域的应用具有重要意义。
2019 Vol. 38 (6): 641-654 [摘要] ( 219 ) HTML (166 KB)  PDF (1289 KB)  ( 1790 )
情报用户与行为研究
655 学习型搜索中用户信息源选择和使用策略研究 Hot!
宋筱璇, 刘畅
DOI: 10.3772/j.issn.1000-0135.2019.06.010
网络信息体量的激增,信息质量的参差不齐使用户利用搜索系统获取信息、增长知识面临巨大的挑战。在用户开展搜索的过程中,对于信息的选择和使用,很大程度上依赖于该信息的来源。本研究采用实验法,围绕不同的学习层面设计搜索任务,重点关注用户在信息源选择和使用过程中,类型分布上发生的变化,从而识别不同用户所采取的信息源策略的本质,并探索用户的策略与学习效果间的关系。研究发现,用户对自身选择阅读的信息源的依赖程度要高于对系统提供的用户可获得的信息源的依赖程度。根据对可获得的和自身选择的信息源的依赖程度不同,用户存在四种不同的信息源策略:全依赖型、非依赖型、选择依赖性和使用依赖型。并且,用户的信息源策略对学习效果有一定的影响,在接受性学习任务中采取非依赖型策略的用户,与在评价性学习任务中采取全依赖型策略的用户,搜索后能够获得更好的学习效果。这一发现有助于深入理解用户在信息源选择和使用过程中的相关特征,以便优化搜索系统能够在用户搜索过程的信息源获取、选择或使用阶段所存在的问题提供精准高效的帮助,实现学习效果的提升。
2019 Vol. 38 (6): 655-666 [摘要] ( 186 ) HTML (118 KB)  PDF (1276 KB)  ( 788 )