带摘要目录

2019年 第38卷 第10期
刊出日期:2019-10-28

情报理论与应用
情报分析方法与技术
研究进展与文献综述
专题约稿
专题约稿
997 基于主题关联分析的科技互动模式识别方法研究 Hot!
刘自强, 许海云, 罗瑞, 董坤, 朱礼军
DOI: 10.3772/j.issn.1000-0135.2019.10.001
从微观层面深度剖析科技互动的内在机理,定量化、自动化、可视化识别科技互动模式,对于弥补当前科学与技术内在关系研究的不足,揭示科技与技术协同创新的发展规律与演化特征具有一定的意义。首先,通过构建多元关系融合的主题词共现矩阵,基于社区探测算法识别论文和专利中的研究主题;然后综合共词、作者与引用关联度构建科学与技术主题关联数据,利用主题演化可视化方法绘制科学与技术主题演化可视化图谱辅助科技互动模式分析。以基因工程疫苗领域的论文和专利数据进行了实证研究,研究结果发现,基因工程疫苗领域的科技互动模式主要有S模式、T模式、S-T模式和T-S模式,其中S模式、T模式随着时间的推移协同增长(呈现明显的协同关联特征),T-S模式、S-T模式随着时间的推移交叉增长(呈现一定的反馈特征,科学与技术双螺旋式推进发展)。
2019 Vol. 38 (10): 997-1011 [摘要] ( 280 ) HTML (142 KB)  PDF (4981 KB)  ( 770 )
1012 考虑全局和局部信息的科研人员科研行为立体精准画像构建方法 Hot!
张亚楠, 黄晶丽, 王刚
DOI: 10.3772/j.issn.1000-0135.2019.10.002
通过为科研人员构建科研行为画像,科研人员能够便捷地使用各种个性化科研服务,促进科研人员提高科研效率。已有的研究往往将画像问题简单地抽象为多分类问题,没有考虑到信息的充分利用和画像更新问题。为此,本研究提出了一种考虑全局和局部信息的科研人员科研行为画像方法,引入深度学习方法,借助深度学习自动从数据中提取高度抽象特征的特点,提取科研人员局部画像,结合全局信息构建科研人员的立体精准画像。最后,使用科研社交平台科研之友上的科研人员科研行为数据,对本研究提出的方法进行验证,证明了本研究提出方法的有效性。
2019 Vol. 38 (10): 1012-1021 [摘要] ( 281 ) HTML (103 KB)  PDF (2622 KB)  ( 641 )
情报理论与应用
1022 基于改进的h指数的学者评价研究 Hot!
熊回香, 叶佳鑫, 丁玲, 曾婷
DOI: 10.3772/j.issn.1000-0135.2019.10.003
h指数是目前常用的科学计量指标之一,其通常被用来衡量学者的学术能力。针对h指数忽略高被引论文等问题,本文对不同h指数时论文的被引情况进行了深入分析,计算出了h指数一定时的论文平均被引数。在此基础上,提出了一个新的指标:hc指数。该指标由hc1指数与hc2指数构成,hc1指数用来衡量学者的学术能力是否超出或低于当前h指数下的平均数值,hc2指数用来衡量作者近年来的学术活跃程度。以数字图书馆、数字档案馆与数字博物馆领域的学者为对象进行的实证研究表明,hc指数能够较好地衡量作者的学术能力,缓解了h指数忽略高被引论文等问题,可用来发现近年来的活跃学者,并能依据不同领域的实际情况来进行评价。
2019 Vol. 38 (10): 1022-1029 [摘要] ( 232 ) HTML (108 KB)  PDF (1019 KB)  ( 476 )
1030 学科交叉期刊的影响力评价方法研究 Hot!
张慧玲, 许海云, 岳增慧, 刘春江
DOI: 10.3772/j.issn.1000-0135.2019.10.004
当前关于学科交叉期刊影响力评价方法虽有诸多讨论,但尚未形成完善的可操作性的评价指标与评价体系。本文首先系统梳理国内外期刊影响力评价方法的研究进展,分析归纳出该领域研究现状,之后,针对学科交叉期刊特点,通过期刊评价指标引文分布的标准化与学科间引文归一化两方面,提出既考虑引文偏态又注重学科间引文多样性的学科交叉期刊评价指标——基于期刊论文篇均引用的CS系列指标,并构建了学科交叉期刊影响力评价的模型和可操作步骤。最后,考虑领域引文差异,本文选取“综合类”、“物理化学”以及“生命科学”三个学科交叉特征差异显著的领域期刊作为实证领域,论证CS系列指标的效用性和指标的适用性。实证表明,CS系列指标在三个学科领域都具有适用性,可整合运用JCR期刊评价指标的CS值,提升学科交叉期刊评价的精准度。
2019 Vol. 38 (10): 1030-1040 [摘要] ( 239 ) HTML (155 KB)  PDF (1391 KB)  ( 677 )
1041 基于时间序列聚类的主题发现与演化分析研究 Hot!
李海林, 邬先利
DOI: 10.3772/j.issn.1000-0135.2019.10.005
针对现有研究对文献主题发现和演化分析方法的单一性,本文提出了基于时间序列聚类的主题发现与演化分析方法。该方法首先通过共词分析找出文献数据集中高频关键词的共现矩阵,利用Ochiia系数计算方法将共现矩阵转换为相似性矩阵,然后使用近邻传播聚类算法发现文献主题。同时,再将主题在某段时间内的研究热度进行分析并转化为反映主题热度时间序列数据,结合时间序列聚类方法对各主题进行分类以及演化趋势的分析。实验结果表明,通过对中国知网中2000—2018年与创新管理相关的期刊文献进行数据处理与挖掘,提出的方法能有效地发现期刊的研究主题,并且能较好地分析这些主题的演化趋势。
2019 Vol. 38 (10): 1041-1050 [摘要] ( 311 ) HTML (152 KB)  PDF (3138 KB)  ( 990 )
情报分析方法与技术
1051 企业破产预测系统模型构建及实现研究 Hot!
唐晓波, 谭明亮, 李诗轩, 郑杜
DOI: 10.3772/j.issn.1000-0135.2019.10.006
作为经济金融与管理科学领域最为重要的研究课题之一,企业破产预测在投资风险预警与金融决策支持中扮演着十分重要的角色。本文从知识工程的研究视角出发,构建了企业破产预测系统模型;系统通过从领域专家处和相关文献中获取领域知识来构建领域本体,并利用情感分析和知识发现技术从定量和定性信息中挖掘出可解释的破产预测规则知识,从而实现企业破产预测本体知识库的半自动构建;系统利用推理引擎对本体知识库进行知识推理来实现对企业的破产预测,并对预测的结果进行解释。本文使用过去十年间美国破产的上市公司数据对构建的系统模型进行了验证,并实现了一个企业破产预测原型系统;该系统不仅能够提高破产预测的准确率,同时也使投资者、债权人和政府监管机构等企业利益相关者能够更加便捷有效地进行企业破产预测,从而辅助其做出合理的决策。
2019 Vol. 38 (10): 1051-1065 [摘要] ( 299 ) HTML (136 KB)  PDF (6236 KB)  ( 977 )
1066 基于深度学习的查询扩展研究 Hot!
余传明, 蔡林, 胡莎莎, 安璐
DOI: 10.3772/j.issn.1000-0135.2019.10.007
通过在查询扩展中引入深度学习框架,并结合局部和全局查询扩展模型,从而解决查询扩展中伪相关反馈引起的查询漂移问题。选择eBay于2017年发布的查询短语和商品名称作为实验数据,在伪相关反馈的基础上提出基于深度学习的查询扩展模型(deep learning based query expansion model,DLQEM),以实现更准确有效的查询扩展,并将其应用到信息检索任务中。实验结果表明,DLQEM的precision@10值在伪相关反馈(PRF)的基础上分别提高了3.5%和3.7%,验证了本文所提出假设(通过概念相关扩展词与反馈信息扩展词取交集能够有效地控制反馈相关扩展词造成的查询漂移)的有效性。深度学习能够解决监督学习在短文本集上难以获得好的分类效果的问题,将其与传统查询扩展模型进行结合,解决了传统查询扩展中需要用户参与和检索速度迟缓两大弊端,控制了查询漂移。
2019 Vol. 38 (10): 1066-1077 [摘要] ( 215 ) HTML (155 KB)  PDF (1388 KB)  ( 689 )
1078 面向学术资源的术语区分能力的测度方法研究 Hot!
王昊, 唐慧慧, 张海潮, 张进, 张紫玄
DOI: 10.3772/j.issn.1000-0135.2019.10.008
改进索引术语质量的衡量方法可以有效提高IR系统的检索效率,但术语的固有属性易受文档长度影响,难以全面衡量术语质量。对此,本文从术语内在的区分性出发,借鉴词袋模型的基本思想,提出了术语区分能力(term discriminative capacity,TDC)这一理论及3种不同的计算方法。本文还采集了Web of Science的3个子数据库中包含4个著录项的900条记录作为实验数据,来实现TDC的大规模计算,并观察3种算法在实践中的差异。经过实验分析得出,计算术语区分能力的最佳方法为TDC-T,该算法在多个方面表现稳定,且不受DF值的影响,可以作为衡量术语质量的全新指标,记为TDC。但是本研究所选取的A&HCI数据库的记录较少,这或许会造成另两个领域计算结果的失衡。
2019 Vol. 38 (10): 1078-1091 [摘要] ( 140 ) HTML (136 KB)  PDF (3077 KB)  ( 621 )
1092 新媒体环境下移动社交媒体倦怠用户画像实证研究 Hot!
张艳丰, 彭丽徽, 刘金承, 洪闯
DOI: 10.3772/j.issn.1000-0135.2019.10.009
探究移动社交媒体倦怠的原因要素和结果要素,构建移动社交媒体倦怠理论模型并进行用户画像分析,为企业深入了解移动社交媒体倦怠发展态势提供指导。挖掘不同类型移动社交媒体倦怠用户心理和行为特征,结合扎根理论和SSO理论提取移动社交媒体倦怠用户画像标签,以农民、学生和教师为调查对象,通过K-medoids聚类方法得出4个具有显著差异性的用户画像群体结构进行实证分析。根据用户画像标签特征,将移动社交媒体倦怠用户画像类型分为潜水忽略型、忍耐使用型、平台转移型和行为替代型4类,针对每个类型用户画像的关键特征进行具体分析,为移动社交媒体倦怠现象提供一个较为全面的用户画像标签类型解释。
2019 Vol. 38 (10): 1092-1101 [摘要] ( 192 ) HTML (106 KB)  PDF (1731 KB)  ( 1384 )
研究进展与文献综述
1102 基于序列到序列模型的生成式文本摘要研究综述 Hot!
石磊, 阮选敏, 魏瑞斌, 成颖
DOI: 10.3772/j.issn.1000-0135.2019.10.010
相较于早期的生成式摘要方法,基于序列到序列模型的文本摘要方法更接近人工摘要的生成过程,生成摘要的质量也有明显提高,越来越受到学界的关注。本文梳理了近年来基于序列到序列模型的生成式文本摘要的相关研究,根据模型的结构,分别综述了编码、解码、训练等方面的研究工作,并对这些工作进行了比较和讨论,在此基础上总结出该领域未来研究的若干技术路线和发展方向。
2019 Vol. 38 (10): 1102-1116 [摘要] ( 374 ) HTML (290 KB)  PDF (979 KB)  ( 1297 )
1117 基于信息级联的网络意见传播及扭曲效应国外研究进展 Hot!
魏建良, 朱庆华
DOI: 10.3772/j.issn.1000-0135.2019.10.011
当前,信息级联作为社交网络信息传播的重要形式越来越得到研究者的关注。大量个体的模仿行为使得社交网络中信息传播影响急剧放大,同时也带来了巨大的网络意见波动,意见扭曲日益频发。鉴于此,很多研究者对此展开了探讨,从最初的信息级联特征与结构分析,到基于真实数据的级联效应建模与优化,再到动态的级联预测与影响力最大化研究。尽管成果已较为丰富,但多是技术层面的分析,结合效应分析的成果较少,尤其对信息级联形成的网络意见扭曲等尚缺少代表性成果。鉴于此,本文从用户、信息及结构三个基本视角,提出了网络意见扭曲的若干可研究主题。
2019 Vol. 38 (10): 1117-1128 [摘要] ( 271 ) HTML (153 KB)  PDF (772 KB)  ( 1068 )