带摘要目录

2019年 第38卷 第2期
刊出日期:2019-02-28

情报理论与应用
情报分析方法与技术
研究进展与文献综述
情报理论与应用
111 作为科技发展先行者的情报体系理论框架研究
李品, 杨建林, 杨国立
DOI: 10.3772/j.issn.1000-0135.2019.02.001
文章认为,新时代的科技发展处于赶超式、对抗性和不确定性等复杂环境中,科技发展的导向也呈现出由问题导向转变为目标与愿景导向的迹象,这就需要情报扮演先行者的角色,这是时代赋予情报的新使命。为此,文章构建了可满足新时代科技发展情报需求的情报体系理论框架,并分析了框架的基本要素构成及其之间的关系。特别强调,为有效支撑作为先导的这一新型情报功能,要将预测、预见型情报方法和情报流程中的“假定”环节放在突出重要的位置。最后以抓住国家重要战略机遇为视角,提出了情报体系实现的基本策略。
2019 Vol. 38 (2): 111-120 [摘要] ( 188 ) HTML (151 KB)  PDF (872 KB)  ( 1003 )
121 卓越大学联盟人文社会科学领域潜在合作机会发现研
林原, 李鲁莹, 许侃, 刘盛博
DOI: 10.3772/j.issn.1000-0135.2019.02.002
发展高水平的人文社科是理工科高校建设一流大学、世界知名高水平大学寻求突破的方向。通过统计分析理工科大学人文社科合作基础,实现高校潜在合作机会的发现。以我国9所“卓越大学联盟”高校为例,基于共同合作机构、学科分布、关键词三个合作基础指标,分析合作动机,挖掘出高校潜在合作方向。同时基于高校信息向量的相似度度量方式,对比分析高校信息差异,从而给出潜在合作的建议。定量分析与向量表示相结合挖掘出五对高校的潜在合作方向,为高校潜在合作机会的挖掘提供一种可行的信息表示模型,希望该方法可以为高校合作提供借鉴。
2019 Vol. 38 (2): 121-131 [摘要] ( 184 ) HTML (164 KB)  PDF (1114 KB)  ( 724 )
132 基于用户参与的在线健康平台信息服务质量研究
钱明辉, 徐志轩, 王珊
DOI: 10.3772/j.issn.1000-0135.2019.02.003
本文在E-SERQUAL评价模型的基础上,针对我国在线健康平台信息服务质量的主要特点,从信息服务效率、信息服务易用性、隐私信息保护性、信息服务全面性、平台可接触性和平台响应性六个维度构建起了针对我国在线健康平台信息服务质量的评价指标体系,搭建起了信息服务质量与用户参与度之间的关系模型并对其进行了验证。研究结果发现平台的信息服务质量对用户参与度有一定影响,其中信息服务的隐私保护性、全面性、可接触性和平台响应性均对提升用户参与度有显著的积极作用。
2019 Vol. 38 (2): 132-142 [摘要] ( 269 ) HTML (158 KB)  PDF (729 KB)  ( 1760 )
143 数字图书馆多粒度集成知识服务研究
王忠义, 黄容, 郑鑫, 黄京
DOI: 10.3772/j.issn.1000-0135.2019.02.004
为将数字图书馆知识服务的单位由文献单元深入到知识单元,并依据知识之间的逻辑关系建立知识单元之间的链接,进而提供多粒度的集成知识服务,本文在多粒度集成知识服务相关理论的指导下,提出了基于关联数据的数字图书馆多粒度集成知识服务方式,主要包括多粒度关联数据创建、多粒度关联数据索引、多粒度关联数据检索等步骤,以实现数字图书馆一站式的“检索即所得”的多粒度集成知识服务,从而提高数字图书馆的易用性,降低用户的认知负担和使用成本。
2019 Vol. 38 (2): 143-158 [摘要] ( 298 ) HTML (190 KB)  PDF (7569 KB)  ( 425 )
情报分析方法与技术
159 基于递归张量神经网络的微信公众号文章的新颖度评估方法
王平, 侯景瑞, 吴任力
DOI: 10.3772/j.issn.1000-0135.2019.02.005
自媒体平台内容同质化问题日益严重,导致用户难以从中获取新颖优质的信息,因此对其文章内容进行新颖度评估就显得尤为重要。本文以微信公众号文章为例,提出了一种自媒体平台文章的新颖度评估方法,该方法利用非监督的句级Doc2Vec语言模型构建文本向量,基于递归张量神经网络构建新颖度测度模型,进而通过模型训练求解并量化评估文章的新颖度。本文从微信公众平台自动采集4,628篇文章开展实证研究,首先设置不同的张量切片数量进行对照实验,综合新颖度分布特征和训练时间计算最优参数,然后通过计算文档相似度验证了文章的新颖度和相似度之间的线性回归关系。该实验结果证明了本方法具有较强的可行性和有效性,从深度学习的视角拓展和丰富了文本新颖度评估的研究,也为自媒体平台的新颖话题探测和前沿知识发现提供了支撑。
2019 Vol. 38 (2): 159-169 [摘要] ( 233 ) HTML (195 KB)  PDF (3058 KB)  ( 759 )
170 融入紧密度中心性与信用的社交网络用户影响力强度计算模型
琚春华, , 赵凯迪, 鲍福光,
DOI: 10.3772/j.issn.1000-0135.2019.02.006
在社交网络中意见领袖对信息传播有着巨大的促进作用,意见领袖往往能够影响群众以及引导网络舆论的走向。寻找网络中的意见领袖可以及时准确地掌握网络动态。本文提出一种融入紧密度中心性与信用的用户影响力强度计算模型,寻找电商化社交网络中的意见领袖。该模型首先根据用户间的好友关系获得关系邻接矩阵。然后用该邻接矩阵计算每个用户的紧密度中心性。提出SocialCreditRank算法计算用户影响力,该算法选择用户在网络中的紧密度中心性比重作为用户被随机选择的概率,用户与好友的信誉度之比对好友的贡献度进行修正。本文以支付宝的用户数据作为实验对象,实验结果表明该方法比一般的意见领袖识别方法效果更加精确。
2019 Vol. 38 (2): 170-177 [摘要] ( 236 ) HTML (123 KB)  PDF (1248 KB)  ( 751 )
178 突发事件信息传播网络中的关键节点动态识别研究
陈思菁, 李纲, 毛进, 巴志超
DOI: 10.3772/j.issn.1000-0135.2019.02.007
为有效识别突发事件信息传播在不同阶段中的关键节点及其演化特征,本文结合危机传播的生命周期,提出一种考虑用户行为特征、网络全局信息以及影响力衰退机制的关键节点动态识别方法。以“哈维”飓风事件为案例进行研究,利用Spearman相关分析和SIR传播模型检验了方法的合理性,并在不同演化阶段关键节点特征对比分析的基础上,提出针对不同阶段突发事件信息传播的舆情治理策略。实验结果表明:与PageRank方法相比,该方法识别出的关键节点在传播速度和传播范围方面表现出一定的优势;随着信息传播不同阶段的演化,关键节点的认证率呈现上升趋势,信息优势表现为先下降后上升,响应优势呈现出相反趋势,而结构优势差异并不显著;在突发事件舆情治理方面,可重点识别潜伏期中高原创、高信息优势和非认证的关键节点,注意搜集爆发期中普通型关键节点掌握的信息,强化蔓延期中各类型关键节点之间的协同,留意消散期中小范围群体的聚集现象。
2019 Vol. 38 (2): 178-190 [摘要] ( 334 ) HTML (189 KB)  PDF (1709 KB)  ( 1197 )
191 基于关联数据的命名实体识别
刘晓娟, 刘群, 余梦霞
DOI: 10.3772/j.issn.1000-0135.2019.02.008
命名实体识别是自然语言处理的基础性任务,其结果具有广泛的应用。关联数据由于具有丰富的语义知识,能够对现有命名实体识别进一步完善。本文实现了一个基于关联数据的可配置的中英文命名实体识别系统,在识别过程中对实体进行消歧并对识别结果进行扩展,为命名实体识别的进一步完善提供了新的思路。具体包括:基于DBpedia构造了跨领域的中英文命名实体词典;设计了一个基于Hive的分布式管理数据存储模型,基于该模型实现了对DBpedia数据集的组织、存储以及扩展;设计了一个基于图的命名实体识别算法,该算法能够充分利用关联数据的语义关系对命名实体进行消歧,并且基于DBpedia Spotlight NER Corpus对算法进行测试,并将算法结果与DBpedia Spotlight、NERSO以及Zwmanta三个系统进行对比评价,结果表明本文实现的算法在查全率、查准率、F值上具有更好的表现。
2019 Vol. 38 (2): 191-200 [摘要] ( 190 ) HTML (91 KB)  PDF (12056 KB)  ( 403 )
201 技术扩散主路径及核心企业的识别研究——以手机芯片专利引文网络为例
孙冰, 徐晓菲, 苏晓
DOI: 10.3772/j.issn.1000-0135.2019.02.009
专利是世界上最大的技术信息源,专利引用数据的变化能比较客观地反映技术扩散现象。本文选择手机芯片技术为研究对象,根据其1990—2015年的专利数据构建了手机芯片技术专利引文网络,对该网络分别进行了整体网络特征、度分布特征的分析。在此基础上,依据网络拓扑参数确定了专利引文网络的核心专利,识别了手机芯片专利的技术扩散主路径,并进一步基于随机游走的中介中心度(BCRW)算法完成了对专利权人网络中核心企业的甄别研究。
2019 Vol. 38 (2): 201-208 [摘要] ( 201 ) HTML (132 KB)  PDF (2979 KB)  ( 811 )
209 可解释的实时图书信息推荐模型研究
余以胜, 韦锐, 刘鑫艳
DOI: 10.3772/j.issn.1000-0135.2019.02.010
本文通过在基于物品的协同过滤(ICF)算法中引入偏置,同时考虑图书与用户自身的因素,从而提升推荐算法的可解释性、准确性,并且保持较高的实时性。并且,通过对比分析与离线实验证明,本文的算法bas-ICF在推荐理由的合理性、丰富度方面,都比原有的ICF表现更优秀,同时推荐准确度也有略微提升,并保持了优秀的实时性。
2019 Vol. 38 (2): 209-216 [摘要] ( 213 ) HTML (133 KB)  PDF (999 KB)  ( 860 )
研究进展与文献综述
217 国内外大数据质量研究述评
刘冰, 庞琳
DOI: 10.3772/j.issn.1000-0135.2019.02.011
作为前沿性研究领域,大数据质量研究是大数据研究的核心内容之一,也是各界关注的焦点问题。本文以国内外大数据质量研究文献为对象,从基本内涵、质量管理、质量评价、应用实践等角度对相关研究进行梳理与综述,分析国内外相关研究进展。研究发现,大数据质量诸方面研究均是以大数据特征为基础,以大数据质量基本属性为核心,与其应用目标及适用情境相结合,形成有别于常规数据质量理论的、具有复杂性和多维度的理论体系。同时发现,大数据质量本质研究、与技术环境和人文环境相结合研究、基于宏观视角的国家层面和战略层面研究等将是大数据质量研究领域未来的研究趋势与研究重点。
2019 Vol. 38 (2): 217-226 [摘要] ( 154 ) HTML (188 KB)  PDF (693 KB)  ( 2002 )