带摘要目录

2020年 第39卷 第10期
刊出日期:2020-10-28

情报理论与应用
情报分析方法与技术
研究进展与文献综述
情报理论与应用
1011 Altmetrics视角下的交叉学科研究前沿探测——以医学信息学领域为例 Hot!
王菲菲, 刘明
DOI: 10.3772/j.issn.1000-0135.2020.10.001
本文引入了基于网络社交平台的Altmetrics数据,与传统前沿探测的方法相结合,来弥补传统方法时间滞后的缺点。选取Web of Science(WoS)数据库与Altmetric.com平台,获取医学信息学的传统计量指标与社交网络Mention数据。构建出5个用于前沿探测的评价指标:即时性、增长性、影响力、关注度、交叉性。通过LDA算法提炼出55个该学科研究主题,计算出所有主题的前沿探测指标得分。之后分别使用主成分分析法、熵权法和灰色关联度法对各个主题的前沿属性进行综合评测;进而通过肯德尔和谐系数验证了3种方法下的探测结果具有一致性;利用天际线法评选出在3种评测方法中皆有较优表现的4个主题,并将其确定为前沿主题。整体研究表明,引入Altmetrics数据的前沿探测方法可以对传统前沿探测方法起到辅助补充作用,提升前沿探测的时效性,最终提取出的结果较为理想,实验结果证明该方法符合实际科研发展需求。
2020 Vol. 39 (10): 1011-1020 [摘要] ( 221 ) HTML (129 KB)  PDF (1741 KB)  ( 889 )
1021 基于引文网络重叠社团发现的图书情报领域学科主题结构分析 Hot!
王伟, 杨建林
DOI: 10.3772/j.issn.1000-0135.2020.10.002
描绘学科主题结构能促进学科理论和方法研究,助力学科创新发展。本文提出基于重叠社团发现算法可视化学科主题结构,利用有向h度测度学科主题间知识流动,以拓扑结构和内容揭示重叠节点角色,并以图书馆学和情报学为研究对象检验了方法的有效性。结果表明,这一方法能够挖掘出细粒度的研究主题,展现学科主题结构。情报学和图书馆学理论研究、知识管理、引文分析、智慧图书馆、图书馆学科服务等主题与其他研究主题连接紧密。重叠节点分化为具有高介数中心性和度的核心节点,以及低介数中心性和度的边缘节点。情报学和图书馆学学科界限模糊,研究主题呈现同质和分野的特点,在深化学科理论研究的基础上促进学科深度融合将有助于学科发展。
2020 Vol. 39 (10): 1021-1033 [摘要] ( 213 ) HTML (116 KB)  PDF (4942 KB)  ( 553 )
1034 科技领域情报分析中文献集构造方式比较研究:一致性与可靠性问题 Hot!
陈果, 邵雨, 王曰芬
DOI: 10.3772/j.issn.1000-0135.2020.10.003
科技领域情报分析中,文献集构造有多种方式,但目前尚不清楚这些方式间的差别及可靠性。推动科技情报分析方法科学化的第一步,是探索能保证分析结果可靠性的领域文献集构造方法。因此,本文旨在通过实证分析量化地解答这一问题。以“人工智能”领域为例,本文在充分考虑科技情报分析多种任务场景(包括不同分析元素、不同元素数量、排序与否等)的前提下,设计了3个递进式的实验,分别为:①当前几种主流文献集构造方式间,所得结果差异性如何?②这些文献集构造方式所得结果的可靠性如何?③对这些文献集进行组合是否能提高最终分析结果的可靠性?实验结果表明,粗粒度元素(如国家)情报分析任务上,现有文献集构造方式结果差异不大,可靠性较高;但在细粒度元素(特别是作者)情报分析任务上,现有文献集构造方式结果差异明显,可靠性较低。不同情报分析任务上可以相应地挑选最合适的文献集构造方式。对现有文献集构造方式所得文献集进行组合,可靠性提升并不明显。总之,优化文献集构造方式是当前科技情报分析中必须重点关注的问题。最后,基于量化指标,本文给出了科技情报分析中在文献集构造层面上提高可靠性的一些建议,以及未来研究的一些思路。
2020 Vol. 39 (10): 1034-1045 [摘要] ( 227 ) HTML (106 KB)  PDF (3768 KB)  ( 472 )
情报分析方法与技术
1046 基于深度预训练语言模型的文献学科自动分类研究 Hot!
罗鹏程, 王一博, 王继民
DOI: 10.3772/j.issn.1000-0135.2020.10.004
为了支撑“一流学科”相关的情报和文献服务,本文探索利用深度预训练语言模型实现文献的教育部一级学科自动分类。通过构建基于BERT和ERNIE的文献学科分类模型,在21个人文社科一级学科近10万条期刊文献数据集上进行实验验证,并与传统机器学习方法(朴素贝叶斯、支持向量机等)、典型深度学习方法(卷积神经网络、循环神经网络)进行对比分析。结果显示,基于深度预训练语言模型的方法效果最好,其中ERNIE在测试集上的Top 1和Top 2准确率分别可达到75.56%、89.35%;同时使用标题、关键词和摘要作为输入的分类模型效果最优;一些学科的学科独立性强,分类效果好,如体育学F1值高达0.98;另一些学科间交叉性高,分类效果欠佳,如理论经济学和应用经济学的F1值在0.6左右。此外,本文还对学科交叉融合、模型应用场景、分类效果优化做了进一步的探讨。
2020 Vol. 39 (10): 1046-1059 [摘要] ( 225 ) HTML (163 KB)  PDF (2961 KB)  ( 1170 )
1060 网络问答社区信息生产者分布规律研究——基于MetaFilter music版块的实证分析 Hot!
杨金庆, 叶光辉
DOI: 10.3772/j.issn.1000-0135.2020.10.005
为探究UGC(user-generated content)模式下的信息生产者分布规律,本文以网络问答社区为研究对象,首先获取MetaFilter网络问答社区music版块的comment(回答)、post(提问)、user(用户)、timestamp(时间戳)数据项作为实验数据。然后,从信息生产力与社交关联强度两个层面验证了洛特卡定律对网络问答社区评论频次-用户数量分布的适用性,探索了用户社交网络中用户分布规律的新特征。最后,结合信息生产力和社交关系两个角度分析信息生产者幂律分布现象,引申探索了用户社交关联强度与信息生产力间的关系。实验结果表明,洛特卡定律对UGC模式的网络问答社区仍具有适用性;网络问答社区的用户社交网络属于无标度网络,用户度分布呈现“富者愈富”的现象;社交关联强的用户未必信息生产量高,但用户社交关联强度与信息生产量之间呈正相关,可为网络问答社区的管理策略的制定提供参考。
2020 Vol. 39 (10): 1060-1068 [摘要] ( 213 ) HTML (100 KB)  PDF (2388 KB)  ( 670 )
1069 基于元路径的机构名称归一化研究 Hot!
杨昭
DOI: 10.3772/j.issn.1000-0135.2020.10.006
面向大数据环境下的数据治理和名称规范建设,针对机构名称数据多样性和复杂性特征,尝试采用共现视角和异质网络挖掘方法,探究数据驱动的机构名称归一化,可提高文献网络构建、挖掘和应用质量。从共现视角的机构识别方法层面上,构建一级机构-二级机构-三级机构三重异质共现网络模型;将机构名称归一化问题转化为异质共现网络挖掘问题,构建基于元路径的机构名称归一化框架模型;系统化地设计基于元路径的拓扑特征和识别工具,通过异质共现网络的文本属性、地理属性和关系属性挖掘,识别隐性语义关系。以2008—2018年上海交通大学WoS(Web of Science)文献题录数据机构名称归一化为例,实验结果验证了该方法的有效性。
2020 Vol. 39 (10): 1069-1080 [摘要] ( 132 ) HTML (193 KB)  PDF (2164 KB)  ( 687 )
1081 新闻替代计量指标的分布特征研究 Hot!
余厚强, 曹雪婷, 王曰芬
DOI: 10.3772/j.issn.1000-0135.2020.10.007
学术成果在新闻中的传播痕迹形成了新闻替代计量指标。最新研究表明,该指标能够反映学术成果的社会影响力。本文基于427万余条新闻替代计量数据的统计分析和对比分析,较为系统地揭示了其分布特征。研究发现,综合类和医学类的新闻来源平台提及学术成果的新闻量最多,其中The ConversationEurekAlert!MedicalXpress位居三甲;新闻指标的及时率为56%,优于政策文件指标,弱于新浪微博指标和推特指标;论文层次分布呈集中态势,以独立用户数观察,20%的学术成果拥有65%的新闻提及数,篇均指标值为3.5;来源层次分布基本符合布拉德福定律,测定出了76个核心来源,最核心的来源是The ConversationNaturePLoS ONE;学科层次分布中,医学与保健科学“一家独大”,其次是生物科学、心理与认知科学。这些结论将为进一步理解和应用新闻替代计量指标提供参考。
2020 Vol. 39 (10): 1081-1092 [摘要] ( 161 ) HTML (134 KB)  PDF (2390 KB)  ( 554 )
1093 基于专利挖掘的关键共性技术识别研究 Hot!
马永红, 孔令凯, 林超然, 杨晓萌
DOI: 10.3772/j.issn.1000-0135.2020.10.008
关键共性技术识别影响政府在不确定性市场环境中的资源投入及企业研发方向,制约制造业发展。如何准确识别关键共性技术是政府和企业急需解决的问题。本研究基于专利数据及LDA主题模型,提取隐含技术主题,选取高强度技术主题为研究对象,以技术共现率评估技术主题通用性,结合技术主题活跃度、效益性及关联性,识别共性技术。在此基础上,借鉴社会网络分析方法,以技术主题为节点,技术主题共现强度为边权,量化技术主题权利,筛选关键节点,识别关键共性技术。并以新材料领域为例进行研究,结果显示高性能铝合金制备、纳米粉末及其薄膜制备工艺、金属粉末的制备及应用、高强度高硬度陶瓷模具制备是新材料领域的关键共性技术。
2020 Vol. 39 (10): 1093-1103 [摘要] ( 184 ) HTML (152 KB)  PDF (2830 KB)  ( 721 )
研究进展与文献综述
1104 多学科视域网络舆情知识图谱研究的现状和展望 Hot!
王兰成
DOI: 10.3772/j.issn.1000-0135.2020.10.009
网络舆情与知识图谱的结合涉及人工智能和社会科学的多个学科门类,多学科视域下对网络舆情知识图谱研究,需要把握知识图谱与网络舆情研究的现状,积累知识图谱和网络舆情研究所取得的基础成果,加强多学科协同网络舆情知识图谱的研究。事件知识图谱基于知识图谱的发展而提出,更适用于发现事件的演化规律和预测后续事件。构建舆情事理图谱凸显多学科研究的优势,情报学能显著提高舆情研判的客观性,管理学能更加科学地指导舆情研究,传播学分析演化路径能实现对热点舆情的精准引导,智能信息学能在事件追踪中有力提升智能系统的可解释性。多学科协同开展网络舆情知识图谱研究,将形成相互补充和相互验证的有机整体成果,具有重要的理论价值和现实意义。
2020 Vol. 39 (10): 1104-1113 [摘要] ( 282 ) HTML (91 KB)  PDF (1832 KB)  ( 843 )
1114 科学研究的社会影响力评价:研究与实践进展 Hot!
苏娜
DOI: 10.3772/j.issn.1000-0135.2020.10.010
科学研究的社会影响力评价是当前科技评价和科学计量学研究中的一个前沿性问题。本文系统梳理了国内外对科学研究社会影响力评价的理论研究与实践进展,重点对社会影响力的内涵、评价模型、评价指标、评价方法等内容进行了总结,并介绍了国外开展的国家层面社会影响力评价的实践。
2020 Vol. 39 (10): 1114-1119 [摘要] ( 190 ) HTML (81 KB)  PDF (907 KB)  ( 704 )
1120 知识流动研究述评 Hot!
董坤, 许海云, 崔斌
DOI: 10.3772/j.issn.1000-0135.2020.10.011
知识流动是促进创新产生和扩散的关键,及时跟踪和预测知识流动研究进展与动向,是深入剖析知识流动机理、促进知识创新价值充分发挥的重要前提。本文围绕知识流动研究展开述评,从知识流动及相关概念辨析、知识流动形式与过程、知识流动模型、知识流动影响因素及效果评价、社会网络分析在知识流动中的应用5个方面综述当前研究现状,并对未来研究做出展望。分析发现,未来需要立足于知识流动的复杂性,进一步优化知识流动模型,在充分认识隐性知识功能和价值的基础上进一步促进隐性知识流动,加强社会网络方法、科学计量方法与传统组织管理方法的有机结合与应用,并探索融合多元关系的知识流动网络构建方法,同时更加注重知识流动理论的实践应用。
2020 Vol. 39 (10): 1120-1132 [摘要] ( 456 ) HTML (185 KB)  PDF (2032 KB)  ( 846 )