带摘要目录

2020年 第39卷 第4期
刊出日期:2020-04-28

情报理论与应用
情报分析方法与技术
情报用户与行为研究
情报理论与应用
345 面向重点领域科技前沿识别的情报体系构建研究 Hot!
刘琦岩, 曾文, 车尧
DOI: 10.3772/j.issn.1000-0135.2020.04.001
近年来,我国科学技术发展态势已进入“跟跑、并跑、领跑”三跑并存的阶段,为适应新的科技发展形势,开展重点领域的科技前沿识别,全面跟踪国外主要国家科技发展新动态,感知和研判未来技术发展趋势,需要更好地发挥情报体系的保障作用。本文在分析国内外研究现状的基础上,提出并阐述了面向重点领域科技前沿识别情报体系构建框架和方法,并对相关研究领域的情报研究实践进行了介绍。研究结果表明,运用多维数据实现情报感知,进行重点领域的科技前沿识别的情报体系和方法具有一定的可操作性。
2020 Vol. 39 (4): 345-356 [摘要] ( 368 ) HTML (92 KB)  PDF (4942 KB)  ( 873 )
357 基于科学交流过程的学术论文影响力评价研究 Hot!
郭凤娇, 赵蓉英, 孙劭敏
DOI: 10.3772/j.issn.1000-0135.2020.04.002
基于学术论文的科学交流过程,本文将学术论文影响力划分为原生影响力、线下影响力、Web 1.0影响力和Web 2.0影响力,并讨论了各类型影响力的产生过程。在此基础上,构建出学术论文影响力评价模型,并对中国社会科学国际学术论文的两组数据(包含1个对照组)进行实证研究。研究发现:①学术论文影响力得分与来源期刊相对影响因子及被引频次相关度最高;②中国研究机构学者同时作为第一作者和通信作者的学术论文(数据组1)影响力得分在整体水平上与对照组相比还有差距,且两组数据的学术论文影响力得分趋势线都呈右偏态势;③学术论文影响力总得分最高的50个研究机构的影响力得分按指数趋势递减,高校是中国社会科学国际研究的中坚力量;④在两个数据组共同覆盖的79个学科领域中,数据组1只在24个学科的平均得分大于对照组,并对学术论文覆盖的学科领域按影响力相对大小进行了分类。
2020 Vol. 39 (4): 357-366 [摘要] ( 200 ) HTML (141 KB)  PDF (1234 KB)  ( 657 )
367 网络表示学习在学者科研合作预测中的应用研究 Hot!
林原, 王凯巧, 刘海峰, 许侃, 丁堃, 孙晓玲
DOI: 10.3772/j.issn.1000-0135.2020.04.003
在大数据环境下,科研合作是提高科研水平、促进科研产出的重要途径。如何在浩如烟海的学者、机构、领域信息中准确地找到与自身研究方向相近的合作对象是近年来科研合作预测的研究重点。本文通过科学学领域科学文献的记录数据,构建作者-作者、机构-机构、作者-机构、作者-关键词、机构-关键词的共现网络,接着通过网络表示方法学习作者、机构、关键词在所处网络中的语境信息,将信息实体表示成相同空间的低维稠密向量,最后根据表示向量的相似度计算实现合作对象、合作领域挖掘。通过网络表示学习方法能实现多种异质信息融合,定量计算各信息实体间的关联强度,可以很好地捕捉科研网络中学者-学者、学者-机构、学者-关键词的关系,准确地为学者挖掘潜在合作者、合作机构和关键词。
2020 Vol. 39 (4): 367-373 [摘要] ( 181 ) HTML (71 KB)  PDF (2280 KB)  ( 734 )
情报分析方法与技术
374 面向查询的观点摘要模型研究:以Debatepedia为数据源 Hot!
余传明, 郑智梁, 朱星宇, 安璐
DOI: 10.3772/j.issn.1000-0135.2020.04.004
本文系统性地研究面向查询的观点摘要任务,旨在构建一种查询式观点摘要模型框架,探究不同的摘要方法对摘要效果的影响。通过综合考虑情感倾向与句子相似度,从待检文档中抽取出待摘要语句,再结合神经网络和词嵌入技术生成摘要,进而构建面向查询的观点摘要框架。从Debatepedia网站上爬取议题和论述内容构建观点摘要实验数据集,将本文方法应用到该数据集上,以检验不同模型的效果。实验结果表明,在该数据集上,仅使用基于抽取式的方法生成的观点摘要质量更高,取得了最高的平均ROUGE分数、深度语义相似度分数和情感分数,较生成式方法分别提高6.58%、1.79%和11.52%,而比组合式方法提高了8.33%、2.80%和13.86%;同时,本文提出的句子深度语义相似度和情感分数评估指标有助于更好地评估面向查询的观点摘要模型效果。研究结果对于提升面向查询的观点摘要效果,促进观点摘要模型在情报学领域的应用具有重要意义。
2020 Vol. 39 (4): 374-386 [摘要] ( 169 ) HTML (191 KB)  PDF (1580 KB)  ( 487 )
387 基于中文学术文献的领域本体概念层次关系抽取研究 Hot!
唐琳, 郭崇慧, 陈静锋, 孙磊磊
DOI: 10.3772/j.issn.1000-0135.2020.04.005
基于学术文献构建领域本体对促进领域学科发展具有重要的意义。本文提出了一种以中文学术文献为数据源,半自动化抽取领域本体层次关系的框架方法。首先,构建了一个通用的领域本体层次关系的细粒度研究框架。其次,设计了一种新的概念表示方法,融合了深度学习方法得到的概念语义特征和上下文的时间序列词频。进一步结合了AP聚类、Prim算法和Web搜索引擎的查询数据,提出了基于规则推理的本体概念层次关系抽取算法(RROCHE),实现了半自动化概念层次关系抽取。最后,基于中文分词领域的中文学术文献数据,通过数值实验方法讨论了方法的可行性和有效性。本文提出的框架方法也非常容易推广并应用到各领域本体层次关系任务中。
2020 Vol. 39 (4): 387-398 [摘要] ( 244 ) HTML (159 KB)  PDF (3549 KB)  ( 748 )
399 信息源对数字原住民健康信息可信度判断的启发式实验研究 Hot!
宋士杰, 赵宇翔, 宋小康, 朱庆华
DOI: 10.3772/j.issn.1000-0135.2020.04.006
互联网已成为消费者健康信息搜寻的重要渠道。Web 2.0环境下互联网信息传播的路径和形态嬗变使在线健康信息环境日趋多样与复杂,用户在异质信息源中选择恰当健康信息的难度显著提升。本文基于启发式信息处理视角,从理论层面梳理启发式与健康信息可信度判断之间的内在关联并构建概念模型。在此基础上,采用实验研究法,以受控健康信息文本与启发式信息线索网页框架构建实验材料,并招募高中生群体这一典型的数字原住民作为被试开展实验研究。实验结果表明,各类健康信息来源中的启发式信息线索对数字原住民的可信度判断具有显著影响,特别是机构信息源线索的出现会显著提高数字原住民的可信度评价。数字原住民对机构信息源的可信度评价显著高于商业信息源与社会化媒体信息源,而商业信息源与社会化媒体信息源之间没有显著差别。研究结论有助于进一步理解数字原住民的健康信息行为模式,并为政府部门和公共卫生机构更好地构建健康信息平台提供参考依据。
2020 Vol. 39 (4): 399-408 [摘要] ( 158 ) HTML (136 KB)  PDF (803 KB)  ( 1146 )
409 基于BERT嵌入BiLSTM-CRF模型的中文专业术语抽取研究 Hot!
吴俊, 程垚, 郝瀚, 艾力亚尔·艾则孜, 刘菲雪, 苏亦坡
DOI: 10.3772/j.issn.1000-0135.2020.04.007
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。
2020 Vol. 39 (4): 409-418 [摘要] ( 186 ) HTML (106 KB)  PDF (2255 KB)  ( 1566 )
情报用户与行为研究
419 基于时间特性的社交网络平台中用户消极使用行为规律分析 Hot!
卢新元, 黄梦梅, 卢泉, 王雪霖
DOI: 10.3772/j.issn.1000-0135.2020.04.008
本文选取知乎平台,采用Python技术获得用户信息行为中发表文章、回答问题、提问和参与live活动的使用行为数据,进行了使用时间特征、使用频次和时间间隔分析,探索用户在使用社交网络平台中产生消极行为的时间特征及规律。结果表明,部分用户在使用社交网络平台过程中会出现减少使用、间歇性中辍和中断等使用行为,呈现不同程度的消极行为特征。对于用户的消极使用行为,需要洞察背后的深层次原因并制定针对性的措施,引导用户继续使用和深度创作。
2020 Vol. 39 (4): 419-426 [摘要] ( 333 ) HTML (81 KB)  PDF (2115 KB)  ( 681 )
427 网络用户评论的情感分歧度量化算法研究 Hot!
徐健, 吴思洋
DOI: 10.3772/j.issn.1000-0135.2020.04.009
从情感分歧角度出发,为网络用户评论情感分析提供新的研究方法和视角。借鉴已有的5种差异度、离散度计算公式,融入情感元素,应用于情感分歧度计算场景,分别得到基于情感值差、标准差、变异系数、信息熵、情感分布概率的5种情感分歧度量化算法,并且基于情感的正负值特点,提出基于正负情感比值的情感分歧度量化方法。在网络用户评论情感分析的基础上,利用这6种情感分歧度量化算法对用户评论进行情感分歧度量化,并对各种情感分歧度算法量化结果进行对比分析。实验结果表明,情感分歧度量化算法可实现对网络用户评论情感分歧度的量化;不同分歧度量化算法在适用性和区分度等方面的特点存在差异。
2020 Vol. 39 (4): 427-435 [摘要] ( 217 ) HTML (157 KB)  PDF (2465 KB)  ( 679 )
436 结合本体与社会化标签的用户动态兴趣建模研究 Hot!
李媛媛, 李旭晖
DOI: 10.3772/j.issn.1000-0135.2020.04.010
以博客、即时通讯、社会网络、社群共享、社会化标注等为代表的Web 2.0应用技术,使用户、信息、资源构成关系紧密的web网络。目前将本体应用到社会化标签用户动态兴趣的研究资料极为稀少,尚无法满足平台对用户兴趣精准把控的需求。本研究从此角度出发,探讨兴趣模型的构建方法。在《中国分类主题词表》和《中国图书馆分类法》对词语的约束规则和关系定义的基础上,构建豆瓣读书用户的兴趣标签本体;并根据再现率、覆盖度、热度率指标对标签的兴趣强度、稳定性进行预测实验,确定兴趣的表示形式,以此构建初始兴趣模型,并提出相应的兴趣节点更新流程。本研究提出的基于本体的用户兴趣模型及更新流程在用户兴趣表示的深度及广度上有了一定程度的提升,在标签资源推荐、检索等实践应用上其适用性更强。
2020 Vol. 39 (4): 436-449 [摘要] ( 175 ) HTML (127 KB)  PDF (3965 KB)  ( 571 )
450 知乎问答社区回答者知识贡献行为受同伴效应影响研究 Hot!
陈小卉, 胡平, 周奕岑
DOI: 10.3772/j.issn.1000-0135.2020.04.011
社会化问答社区的出现改变了原有的问答模式并拓展了知识获取的途径。回答者作为知识的主要贡献者,是促进问答社区内知识传递的核心要素。现有关于问答社区用户的研究普遍以用户的属性数据为依据,较少考虑使用个体连接所形成的关系数据进行分析。本文以中文问答社区“知乎”为研究对象,爬取了“流行音乐”和“英语学习”两个话题下的大规模数据,通过构建回答者关注关系网络,定义和量化直接连接和间接连接两类同伴关系,使用网络自回归模型探究同伴效应对知识贡献行为的影响。研究发现,回答者的知识贡献行为会受到直接和间接连接同伴效应的正向影响,但是间接连接同伴效应会随着回答者网络密度的增加而逐渐减弱甚至消失,聚类系数对回答者的知识贡献行为有负向影响。
2020 Vol. 39 (4): 450-458 [摘要] ( 193 ) HTML (140 KB)  PDF (833 KB)  ( 916 )