带摘要目录

2021年 第40卷 第4期
刊出日期:2021-04-24

情报理论与应用
情报分析方法与技术
研究进展与文献综述
情报用户与行为研究
情报理论与应用
333 面向知识发现的模糊本体融合与推理模型研究 Hot!
陆泉, 刘婷, 张良韬, 陈静
DOI: 10.3772/j.issn.1000-0135.2021.04.001
现有知识发现研究难以兼顾不同领域知识的精准性与模糊性,也缺乏描述和定义模糊本体的语言工具,本文从知识模糊性角度出发,提出一种基于OWL(ontology web language)语言的模糊本体表现模型,通过SWRL(semantic web rule language)语言表示精确规则和模糊规则,并结合概念对和隶属度将模糊知识转换成精确知识实现本体融合推理,构建面向知识发现的模糊本体融合和推理模型。选取药物相互作用这一典型领域的Drugs与Drugbank数据库中肿瘤及精神卫生疾病相关的药物数据对模型进行验证,研究结果表明,可在保持准确率水平的情况下,将对药物相互作用知识发现尤为重要的召回率显著提高至89.94%。本文提出的模糊本体模型可以同时描述精确知识和模糊知识,简化了对模糊知识的表示和处理。
2021 Vol. 40 (4): 333-344 [摘要] ( 226 ) HTML (158 KB)  PDF (2104 KB)  ( 1287 )
345 推进代表作评价存在的问题与对策研究 Hot!
俞立平, 张矿伟, 蒋长兵
DOI: 10.3772/j.issn.1000-0135.2021.04.002
代表作制度作为科技评价中开始施行的一种新的制度,对其进行分析思考有助于代表作制度的完善,提高科技评价质量。本文首先对评价对象进行分析,然后从评价目的、评价对象、同行评议、评价技术等角度分析了代表作评价存在的问题,并对代表作的可靠性和通过率进行了数学证明。研究结果发现,代表作评价缺乏宏观评价视角、跨学科难以比较、作者难以选择、不同类型代表作不可比、学科异质性影响代表作评价、对不同学者评价存在适用问题、同行评议制度不够完善、评审专家难以满足需要、评价不同分组难以比较、评价成本高昂和评价可靠性不高等问题。最后本文提出政策建议:不宜扩大代表作的评审范围、明确代表作选取要求、进一步细化分类评价、采用传统方法对初中级学者评审、建立量化考核与代表作兼顾的评审制度、提高同行评审质量、给予高校科技评审的自主权、推广一些文献计量指标、完善科技评价机制。
2021 Vol. 40 (4): 345-353 [摘要] ( 167 ) HTML (96 KB)  PDF (1356 KB)  ( 407 )
情报分析方法与技术
354 施引文献视角下正面引用论文的影响力及其影响因素的研究——以自然语言处理领域为例 Hot!
徐琳宏, 丁堃, 孙晓玲, 杨阳
DOI: 10.3772/j.issn.1000-0135.2021.04.003
被引频次是科技论文的重要评价指标,但因为引用同一化的问题,需要矫正使用被引频次评估带来的偏差。本文以自然语言处理领域论文的引用极性为数据,从施引文献的角度出发,研究了正面引用和中性引用论文的影响力差别,以及不同引用原因下,正面引用论文的影响力差别。进一步探讨了影响作者引用极性的施引因素。利用非参数检验和逻辑回归等统计推断方法比较发现,正面引用论文的影响力明显高于中性引用论文的影响力,且正面引用的不同引用原因中,应用类型的论文影响力更大;施引位置和引用长度对引用极性有较大的影响,而引用强度和参考文献个数对极性没有影响。本文的研究结论为进一步丰富引文分析理论和细化科技质量评价策略提供了有益的改革思路。
2021 Vol. 40 (4): 354-363 [摘要] ( 96 ) HTML (99 KB)  PDF (1844 KB)  ( 580 )
364 发明人专利文献耦合与发明人德温特分类号耦合比较研究——以非专利实施主体为例 Hot!
宋艳辉, 邱均平
DOI: 10.3772/j.issn.1000-0135.2021.04.004
专利文献同科技论文一样,是重要的科技文献,将文献计量学的方法拓展到专利文献的计量具有重要的意义。本文以NPE(non-practicing entities)专利为样本,运用频次分析、相关分析、因子分析和可视化分析等方法分析比较发明人专利文献耦合分析与类号耦合分析这两种分析方法,并探析NPE专利结构。研究发现,发明人专利文献耦合与发明人类号耦合具有相关性;发明人专利文献耦合因子分析要优于发明人类号耦合分析;发明人专利文献耦合能比发明人类号耦合探测到更多研究主题;两者共同发现的NPE专利的核心研究领域有:数字计算机、通信数字信息传输和数据存储与传输,代表了NPE专利的结构。研究认为,二者结合起来进行学科结构探测与分析将更加有效,可获得更多有价值的结论。
2021 Vol. 40 (4): 364-374 [摘要] ( 131 ) HTML (109 KB)  PDF (3064 KB)  ( 427 )
375 通用语料的眼动数据对微博关键词抽取的性能提升探究 Hot!
章成志, 胡少虎, 张颖怡
DOI: 10.3772/j.issn.1000-0135.2021.04.005
眼动数据记录了浏览者在浏览信息时的眼球轨迹,已有研究依据眼动数据度量阅读者在不同单词上的注意力强弱,并进一步将该特征加入微博关键词抽取模型中,从而提高抽取模型的性能。然而,目前的微博关键词抽取模型仅考虑通用领域眼动数据的总注视时长这一特征,尚未全面探究眼动数据对微博关键词抽取任务性能的影响。因此,本文将从眼动特征的选择、眼动特征与文本特征的组合这两个方面,全面考察通用语料的眼动数据对微博关键词抽取任务性能的影响。同时,由于眼动数据集与测试数据集在数据规模上相差较大,使得眼动特征过于稀疏,进而影响其作用的发挥,本文提出了一个眼动数据的扩充方案用于解决这一问题。
2021 Vol. 40 (4): 375-386 [摘要] ( 269 ) HTML (139 KB)  PDF (2485 KB)  ( 504 )
387 基于智能化公文主题分析的我国政策层级扩散倾向性研究 Hot!
王芳, 徐路路
DOI: 10.3772/j.issn.1000-0135.2021.04.006
政策创新通过公文流转得以实施和扩散。在大数据背景下,运用政策文本挖掘分析我国不同层级政府间的政策扩散过程,对于了解政策实施效果,推进数字政府建设和提升政府治理能力具有重要意义。然而,当前面向我国政府公文智能处理和政策层级扩散的研究尚未广泛展开。因此,本文通过分析公文文本的结构和内容特征属性,从政策扩散主题维度和政策扩散倾向性两个方面展开研究,尝试分析政策发布时间、布局数量、政策主题强度、执行部门数量等多个维度,构建了一种基于多特征融合的政策扩散倾向性探测模型。同时,本文设计了一种新的针对我国政策层级扩散的可视化图谱,以清晰表达政策在中央、省级以及地市级的主题扩散与变迁。最后,本文以我国大数据政策为例进行了实验,通过大规模政府公文的智能处理与层级扩散倾向性探测,为政策制定者和执行者提供情报支撑和决策参考服务。
2021 Vol. 40 (4): 387-401 [摘要] ( 185 ) HTML (166 KB)  PDF (7209 KB)  ( 430 )
情报用户与行为研究
402 基于超网络的用户知识协同创新研究——以开放式创新社区“花粉俱乐部”为例 Hot!
张海涛, 任亮, 刘伟利, 周红磊
DOI: 10.3772/j.issn.1000-0135.2021.04.007
从超网络的视角深入研究用户间的知识协同演化问题,解析知识协同创新演变的内在过程机理。基于用户知识协同交互作用下形成的用户关系网络、知识进化过程中形成的以知识基因作为节点的进化网络以及知识的载体知识文本网络,应用超网络理论挖掘三种网络相互之间的映射关系并可视化分析,最终构建了用户知识协同创新的超网络模型,实现对用户及其创新知识的深入分析,展示三种网络之间的映射关系,从而实现挖掘高质量用户,识别具有创新价值的知识文本,剖析用户间知识协同创新的过程。
2021 Vol. 40 (4): 402-413 [摘要] ( 229 ) HTML (155 KB)  PDF (11156 KB)  ( 295 )
414 基于社会网络分析的社会化问答平台用户画像研究 Hot!
陈烨, 王乐, 陈天雨, 郭勇
DOI: 10.3772/j.issn.1000-0135.2021.04.008
本研究基于社会网络分析方法构建社会化问答平台用户画像,揭示用户社交行为特征,为用户分类管理和个性化服务提供决策依据。本研究利用网络爬虫技术获取Quora中高血压主题下的用户社交行为数据,构建不同类型用户社交网络,分析用户社交网络结构和用户社交类型的特征,进而生成面向高血压主题的用户画像。研究结果表明,将社会网络分析方法运用到用户画像研究中,能够有效地挖掘、组织和表示用户社交行为特征;基于节点特征值分布的用户分类方法可以实现用户细分;用户画像有助于平台管理人员对用户社交和分类管理形成更深层次的认知。本文为社会化问答平台用户画像实现提供了借鉴和参考,也为社会化问答平台用户画像的应用奠定了基础。
2021 Vol. 40 (4): 414-423 [摘要] ( 356 ) HTML (103 KB)  PDF (3345 KB)  ( 798 )
研究进展与文献综述
424 组态视角与定性比较分析方法:图书情报学实证研究的新道路 Hot!
池毛毛, 杜运周, 王伟军
DOI: 10.3772/j.issn.1000-0135.2021.04.009
本文对近期图书情报学领域主流的实证研究方法进行梳理,包括定性研究方法与定量研究方法两类。由于传统实证研究方法(特别是定量研究方法)基于还原论思想,难以分析自变量相互作用对于结果变量的复杂作用机理。本文将组态视角与定性比较分析方法(qualitative comparative analysis,QCA)引入图书情报学领域,组态视角和QCA是基于整体与系统的分析逻辑,从组态的角度来分析结果的“配方”原因,进而解决多维度、多变量诱因的因果复杂性问题。本文对组态视角与QCA的基本原理、QCA分析流程进行梳理,结合图书情报学的研究问题介绍QCA的具体应用。最后,本文对组态视角与QCA应用于图书情报学的五个研究机会进行展望,这是图书情报学实证研究的新道路。
2021 Vol. 40 (4): 424-434 [摘要] ( 241 ) HTML (135 KB)  PDF (1484 KB)  ( 1242 )