带摘要目录

2020年 第39卷 第9期
刊出日期:2020-09-28

情报分析方法与技术
研究进展与文献综述
情报分析方法与技术
885 科学论文论证本体设计与标注实验 Hot!
王晓光, 周慧敏, 宋宁远
DOI: 10.3772/j.issn.1000-0135.2020.09.001
作为科学论文内容的组成部分,论证结构揭示了科学论文内的重要观点、结论及其论证过程,是论文内蕴含的一类重要隐性知识。规范描述和准确表征论文内的论证结构,对于科学论文的语义增强、语义检索和基于文献的知识发现具有重要意义。本文针对科学论文的论证结构,基于通用的论证理论,在复用多个出版物相关本体的基础上,构建了一个新颖的论证本体(scientific paper argumentation ontology,SAO),包括7个核心类、13个扩展类和15种关系。为了评估SAO本体的可用性,本研究选择图书情报与生物医学领域的40篇科学论文进行了语义标注应用实验。统计结果表明,SAO本体具有较强的论证单元和论证结构的表达能力,不同领域的科学论文的论证结构相似,但存在一定差异。
2020 Vol. 39 (9): 885-895 [摘要] ( 193 ) HTML (115 KB)  PDF (1714 KB)  ( 639 )
896 Altmetrics视角下的人文社会科学学术专著影响力评价研究——基于BkCIAmazonGoodreads的比较分析 Hot!
李江波, 张梁, 姜春林
DOI: 10.3772/j.issn.1000-0135.2020.09.002
Altmetrics自提出以来发展迅速,极大地拓宽了文献计量学评价学术成果的研究范围。目前绝大多数的Altmetrics研究集中在对论文学术成果的评价上,学术专著或其他类型学术成果的评价似乎不够受重视。然而,专著是社会科学和人文学科学术成果的重要形式,本研究将着重研究专著学术成果的评价。本文通过对出版时间标准化构建学术专著在数据库中的日均被引次数(daily average times cited,DATC)指标。此外,本文使用递归神经网络(recurrent neural network,RNN)的方法对专著的在线评论进行情感分类,并使用情感词典对评论文本进行细粒度情感分析,得到情感分析值指标。研究结果发现,部分学术图书在BkCI数据库中的被引次数较少,但其DATC指标较高,原因是这些学术专著的出版时间较晚,还没有足够的时间积累引文。这说明专著的被引次数少并不意味着它们的学术影响力一定低,仅利用引文索引数据库中的被引次数来评价学术专著的学术影响力是有缺陷的。另一个结果表明,学术专著在在线评论方面的Altmetric指标与引文相关性很小,特别是在情感分析均值指标和引文指标之间。低相关性意味着在线评论方面的Altmetric指标在评价学术专著学术影响力方面几乎没有可行性,只能用于评价学术专著的社会影响力。
2020 Vol. 39 (9): 896-905 [摘要] ( 260 ) HTML (122 KB)  PDF (3116 KB)  ( 546 )
906 基于二模网络链路预测的合作者识别方法研究 Hot!
黄璐, 倪兴兴, 程坷飞, 贾翔
DOI: 10.3772/j.issn.1000-0135.2020.09.003
随着科学研究复杂性和学科交叉性的不断提高,科研工作者通过开展高水平的科研合作形成了大批高质量研究成果。本文基于Web of Science数据库,构建了基于二模网络链路预测的潜在科研合作伙伴识别新方法,综合考量了研究内容的文本信息和合作网络的结构信息,并体现了研究者研究兴趣和研究方向的动态变化,以期帮助科研工作者从海量科技文献中快速识别潜在的合作对象。在实证研究部分,本文以“图书情报学”领域的学者为例,为其推荐合作伙伴。
2020 Vol. 39 (9): 906-913 [摘要] ( 200 ) HTML (160 KB)  PDF (1453 KB)  ( 736 )
914 面向火灾应急管理的本体构建研究 Hot!
王芳, 杨京, 徐路路
DOI: 10.3772/j.issn.1000-0135.2020.09.004
火灾是威胁人民生命财产安全的多发性突发事件之一。大数据时代火灾突发事件报道数量呈指数增长,如何在海量的火灾报道中对知识进行获取、抽取与表示,形成火灾应急知识库,以此来指导火灾应急管理工作智能化的开展,成为影响我国应急管理能力提升的关键因素之一。本文在文本挖掘的基础上构建了面向火灾应急管理的本体模型FEO(fire emergency ontology)。首先,基于领域专家指导,构建火灾应急上位本体FE-SUMO;然后,从火灾突发事件、燃烧要素、燃烧结果、火灾应急组织、火灾应急资源、火灾应急角色等方面建立FEO概念、关系、函数、公理和实例的五元组,选择Protégé对火灾应急本体进行实现;最后,通过定性评价和OntoQA定量评价两种方法对所构建的火灾应急本体的有效性和完整性进行了验证。
2020 Vol. 39 (9): 914-925 [摘要] ( 229 ) HTML (112 KB)  PDF (2710 KB)  ( 731 )
926 视频检索相关性判断的影响因素:基于PLS路径分析的实证研究 Hot!
王志红, 曹树金
DOI: 10.3772/j.issn.1000-0135.2020.09.005
相关性判断是用户视频检索与查寻中的关键一环,调查视频检索情境下相关性判断的影响因素,对视频检索系统的设计与开发具有重要意义。以现有理论为基础,结合视频检索的特性,本文构建了影响视频检索相关性判断的因素模型,利用实验与问卷相结合的方式收集数据,并采用PLS路径分析方法进行了数据分析和模型检验。结果显示,测量模型满足信度和效度检验;结构模型表明,主题性、范围和权威性依次是影响视频检索中相关性判断的显著因素,而可理解性、可获取性和视频特性均未发现具有统计学上的显著影响。同时,范围对主题性也具有显著影响,并通过主题性对相关性产生间接影响。此外,调节变量分析发现,性别、信息搜索能力和主题熟悉度会显著调节部分影响因素对相关性的影响。研究表明,相关性判断影响因素在不同情境以及不同类型信息之间具有一定的稳定性,同时也具有一定的差异性。本研究建议,除了主题性之外,视频信息检索系统的设计应该考虑到其他因素的影响,从而帮助用户快速有效地查找和获取所需的视频。
2020 Vol. 39 (9): 926-937 [摘要] ( 174 ) HTML (156 KB)  PDF (1620 KB)  ( 884 )
938 大规模异构的政府统计报表信息抽取与集成融合研究 Hot!
赵洪, 王芳
DOI: 10.3772/j.issn.1000-0135.2020.09.006
政府统计数据作为国家的“战略金矿”,充分挖掘其内在价值,使之更好地服务于政府及公众,已成为当前智慧政务和新型智库发展中大数据系统建设的必然要求。但政府统计报表的半结构化和大规模异构特点,使得统计数据之间无法直接关联及聚合,影响了统计数据资源的深度挖掘与开发。鉴于此,本文针对已有研究的不足,在分析政府统计报表语义构成要素的基础上,结合其信息抽取与集成融合的应用目标,将处理任务分解为表格语义结构解析、表头语义关系识别、数值信息抽取表示、指标术语消冗转换及不一致统计数据消歧等五个逻辑过程,并定义了各过程的作用与主要任务,且研究构建了面向该任务的总体技术框架及其处理流程。大规模真实数据集上的应用结果表明,本研究方法能够较为有效地实现异构型政府统计报表的抽取与集成融合,具备较好的实际价值,同时也为其他基于半结构化表格的大数据建设与应用研究提供参考借鉴。
2020 Vol. 39 (9): 938-948 [摘要] ( 175 ) HTML (104 KB)  PDF (4270 KB)  ( 660 )
949 基于累积引文的科学睡美人识别方法研究 Hot!
侯剑华, 张雪雯
DOI: 10.3772/j.issn.1000-0135.2020.09.007
从文献的累积引文视角出发,以Logistic曲线为原型,拟合累积引文曲线模型,通过累积引文的曲线特征给出文献生命周期的三个阶段:沉睡期、苏醒期、衰老期。从沉睡强度和苏醒强度两个维度构建累积引文睡美人指数(cumulative citation sleeping beauty index,Cc index),提出了一种识别睡美人文献的无参数指标方法。对Web of Science平台在2008—2014年出版的超弦领域中的睡美人文献进行检验,结果表明Cc指数识别结果能很好地满足参数指标定义的睡美人文献,且对浅睡眠(假寐)文献、睡眠时间相对较短但苏醒强度大的睡美人文献具有较好的识别效果,同时能识别出全要素睡美人文献,更符合睡美人文献的本质特征。累积引文睡美人指数识别方法对其他研究领域的有效性有待进一步验证。
2020 Vol. 39 (9): 949-962 [摘要] ( 147 ) HTML (153 KB)  PDF (3030 KB)  ( 524 )
963 社交媒体用户不持续使用行为模型构建及实证研究 Hot!
程慧平, 苏超, 王建亚
DOI: 10.3772/j.issn.1000-0135.2020.09.008
厘清社交媒体用户不持续使用行为影响因素,对于社交媒体运营商优化服务、减少社交媒体使用对用户带来的消极影响具有重要意义。以认知情绪理论的“认知→情感→行为意向”为模型框架,基于期望不一致理论与社会比较理论下的负面情绪(嫉妒、后悔、沮丧)构建社交媒体用户不持续使用行为模型。通过网络问卷收集了541份用户的数据,采用偏最小二乘结构方程模型(PLS-SEM)进行实证分析。研究结果显示,期望不一致会引起用户使用社交媒体后产生不满意,不满意是用户形成不持续使用意向的主要因素,进而影响社交媒体用户产生不持续使用行为。用户在社交媒体中的社会比较产生的嫉妒会引发沮丧、后悔负面情绪。嫉妒、后悔、沮丧均会引起社交媒体用户使用不满意;后悔对不持续使用意向的直接影响显著,但沮丧的直接影响不显著。期望不一致会让用户使用社交媒体而感到后悔。后悔在期望不一致、嫉妒对不满意的影响中起部分中介作用,沮丧在嫉妒与不满意之间起部分中介作用。不满意在后悔对不持续使用意向影响中起部分中介作用,在沮丧、嫉妒与不持续使用意向之间起完全中介作用。社交媒体使用年限、社交媒体中朋友的数量对社交媒体用户不持续使用行为的影响不显著,而每天使用社交媒体时间长度的影响显著。本研究丰富与拓展了社交媒体不持续使用的理论研究,为社交媒体运营商理解用户不持续使用行为规律提供了参考。
2020 Vol. 39 (9): 963-978 [摘要] ( 228 ) HTML (197 KB)  PDF (1880 KB)  ( 758 )
979 基于PWLR模型的领域新兴趋势识别及其可视化研究 Hot!
刘自强, 胡正银, 许海云, 方曙
DOI: 10.3772/j.issn.1000-0135.2020.09.009
探索构建准确、有效的领域新兴趋势分析框架,对于新兴趋势研判、舆情监测等情报工作具有一定的意义。首先,基于N-Gram模型抽取蕴含时间标签的科技文献文本数据中的多元词汇特征Bi-Gram与Tri-Gram;其次,利用分段线性回归(piecewise linear regression,PWLR)模型对Bi-Gram、Tri-Gram进行分段拟合,探测多元词汇在近期时间线上的新兴特征,准确识别有发展潜力的新兴词汇;最后,基于上一步的新兴词汇判别结果利用层次聚类算法识别领域新兴趋势并进行可视化分析。通过对基因编辑领域进行实证研究,识别出基因编辑领域的主要新兴趋势有CRISPR-Cas9技术、基因治疗、动植物基因编辑,验证了本研究提出方法的可行性和有效性。
2020 Vol. 39 (9): 979-988 [摘要] ( 135 ) HTML (129 KB)  PDF (3541 KB)  ( 717 )
研究进展与文献综述
989 中外技术问答社区的实证对比研究与启示——以CSDNStack Overflow为例 Hot!
李胜利, 钟滢
DOI: 10.3772/j.issn.1000-0135.2020.09.010
社会化问答社区是当前网络用户进行知识交流的重要平台,而技术问答社区则是专注于技术知识交流的问答社区。本文选取国内外最具有代表性的两大技术问答社区进行对比研究,旨在指出国内技术问答社区的优势与不足,并为国内技术问答社区的进一步发展与优化提出针对性建议。本文分别从社区活跃度、社区主题、社区问题质量、用户体验和社交属性5个维度开展了对比分析,并利用相关性分析,分析并比较了在两个问答社区中影响问题被回答情况的相关因素。本文发现两大技术问答社区在活跃度、用户提问与回答情况等方面存在显著差异,并从优化问题质量评价机制、提高用户回答积极性、优化激励机制以及强化社交属性等方面为我国技术问答社区的进一步发展与完善给出了建议。
2020 Vol. 39 (9): 989-1000 [摘要] ( 174 ) HTML (107 KB)  PDF (3467 KB)  ( 511 )
1001 基于文献计量和主题探测方法的学科评价比较研究——以中、美、英、澳四国教育学学科为例 Hot!
王楠, 马千淳
DOI: 10.3772/j.issn.1000-0135.2020.09.011
伴随“双一流”建设进程的推进以及“建设一流大学的基础是一流学科”的观念得到学术界普遍认同,学科评价领域特别是针对评价方法与工具的研究备受关注。本研究综合运用文献计量学指标及研究主题探测方法,从学科科研产出总体情况和学科前沿研究主题分布情况两个维度,对中国(港澳台地区除外)、美国、英国、澳大利亚4个国家2013—2018年教育学学科开展评价与比较研究,力图以其为例探索和深化学科评价研究方法。研究发现,我国教育学学科的科研竞争力距离以美、英、澳为代表的世界一流学科水平仍存在一定的差距,科研生产力与影响力表现均不理想;研究领域相对较窄,但对全球热点主题均有密切关注和追踪;工程人才培养、随迁子女与留守儿童两个主题中的发文量在对标国家中占据主导优势。本研究提出需依据不同学科的特点,进一步结合并完善学科科研产出计量指标和研究主题遴选分析方法,以更好地评价和分析学科优势与短板,进而服务学科建设与发展。
2020 Vol. 39 (9): 1001-1010 [摘要] ( 123 ) HTML (120 KB)  PDF (1234 KB)  ( 548 )