|
|
341 |
单篇论著的引文扩散 |
|
|
闵超, YingDing, 李江, 孙建军 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.04.001 |
|
|
引文是连接科学知识的重要线索,为我们提供了理解知识产生、交流、转化乃至创新规律的金钥匙。引文不只是静态的统计分布,同时也是处于复杂科学系统中的动态增长过程。本文将引文理解为一种扩散过程,从多个维度重新审视引文扩散过程及其基本要素、量化方式与增长机理。引文扩散体系中至少包含以下要素:时间环境、首次被引、引文高峰、最终引文数量、引文累积速度、引文生命周期、文献网络/生态系统,以及引文起飞。引文在微观结构上以引文级联为基本单元,从引文感染性与引文流行性两个维度进行扩散,有广播型与感染型两种典型扩散方式。引文扩散模式的巨大差异性源于其内在机理的作用,对于优先连接机制、老化机制与适应性机制以及创新机制与模仿机制的认识与进一步探索,将有助于对引文扩散进程的理解。对引文扩散的探讨对于科研评估、科学预测、科技政策制定等科技活动具有潜在价值。 |
|
|
2018 Vol. 37 (4): 341-350
[摘要]
(
241
)
HTML
(1 KB)
PDF
(2621 KB)
(
893
) |
|
|
|
351 |
基于文献关联属性的引文网络主路径识别——以合成生物学领域为例 |
|
|
隗玲, 刘春江, 许海云, 方曙 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.04.002 |
|
|
已有的引文网络主路径分析方法或者将所有的引文关系同等对待,或者基于文本内容计算引文之间的相关度,没有考虑引文节点之间的差异性和节点基于文献关联属性的相关性或相似性。本文利用元路径来描述和量化引文节点对基于文献关联属性的相关性,将此相关性作为主路径遍历权重的一部分,结合SPC(search path count)遍历权值构建了两个新的遍历权值指标,分析文献关联属性对于主路径识别的影响。研究结果显示,新的遍历权重指标可以识别具有关联属性特征的主路径,从不同角度揭示知识扩散的轨迹,提供更多的知识扩散信息,拓展了引文网络主路径分析方法的作用和应用场景。 |
|
|
2018 Vol. 37 (4): 351-361
[摘要]
(
365
)
HTML
(1 KB)
PDF
(822 KB)
(
848
) |
|
|
|
|
372 |
在线知识社区中团队异质性对知识序化效率的影响 |
|
|
裘江南, 王婧贤 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.04.004 |
|
|
Web 2.0时代,在线知识社区(OKC)成为生产、分享和获取知识的重要平台。如何更高效快速地完成知识序化,为人们及时提供高质量的信息和知识成为OKC平台关心的问题。本文基于互动团队认知理论(ITC),提出了OKC知识序化效率的影响因素模型,探究团队异质性和团队互动过程对知识序化效率的影响。本文以英文版维基百科为研究平台,使用其自带的“Random featured article”功能随机抽样100个特色词条,通过API爬取词条和编辑者客观真实数据,使用偏最小二乘(PLS)路径分析对模型进行了验证。研究发现,知识异质性和经验异质性对知识序化效率无显著直接影响。知识异质性对知识协作和认知冲突存在正向影响。经验异质性对认知冲突有负向影响。知识协作和认知冲突都正向影响沟通协调,而沟通协调对知识序化效率呈U形影响。本研究扩展了OKC序化相关研究和理论,同时也为OKC平台建设和管理提供了实践启示。 |
|
|
2018 Vol. 37 (4): 372-383
[摘要]
(
170
)
HTML
(1 KB)
PDF
(490 KB)
(
614
) |
|
|
|
384 |
移动环境下融合情境信息的群组推荐模型研究——基于用户APP行为数据的实证分析 |
|
|
夏立新, 杨金庆, 程秀峰 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.04.005 |
|
|
为了提高群组推荐模型中推荐结果的准确度问题,本文研究并提出了一种融合情境信息的群组推荐模型。首先,获取用户行为情境数据,同时发掘提取单个用户行为的偏好;其次,计算单个用户行为相似度,进行群组聚类发现;然后,融入情境信息挖掘群组行为特征,并构建群组行为偏好特征向量,最后结合协同推荐思想,将群组作为整体,和其他群组对项目的历史评分进行协同,形成预测评分。在实验中,我们通过分析用户的操作流,提取了主题序列特征,然后融入了经典情境信息,得出推荐结果。结果表明,使用该模型得出的排序靠前(6位)的推荐结果较之传统(非情境)的群组推荐方法具有更高的准确性。因此,该模型更适用于移动环境下的群组推荐。 |
|
|
2018 Vol. 37 (4): 384-393
[摘要]
(
149
)
HTML
(1 KB)
PDF
(1124 KB)
(
692
) |
|
|
|
394 |
突发公共卫生事件利益相关者在社交媒体中的关注点及演化模式 |
|
|
安璐, 杜廷尧, 李纲, 余传明 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.04.006 |
|
|
通过利益相关者理论构造突发公共卫生事件的利益相关者类型体系,共包含六大类13种类型,依据生命周期理论,将突发事件的生命周期划分为五个阶段,利用相关性公式改进的潜在狄利克雷分配(LDA)模型,比较分析了2015年中东呼吸综合征(MERS)病毒爆发时新浪微博和微信平台上各利益相关者在不同阶段的话题关注点,并揭示其话题演化模式的异同点。通过分主体、分阶段、分平台梳理网络信息传播过程中各利益相关者在不同阶段的主要关注点,归纳出热点话题的演化规律,其研究发现能够为政府研判突发公共卫生事件网络舆情态势提供信息支持,帮助突发事件管理部门针对特定人群采取对应的响应措施,减少突发事件带来的负面影响。 |
|
|
2018 Vol. 37 (4): 394-405
[摘要]
(
365
)
HTML
(1 KB)
PDF
(1991 KB)
(
2195
) |
|
|
|
|
406 |
国务院政府工作报告(1954—2017)文本挖掘及社会变迁研究 |
|
|
魏伟, 郭崇慧, 陈静锋 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.04.007 |
|
|
国务院政府工作报告是一类具有施政纲领性质的综合政策性文本。采用文本挖掘技术对历年工作报告进行多粒度、多层次的综合定量分析,对快速理解领域内容的发展变化以及发现社会变迁规律具有重要的指导意义。首先,利用中文文本分词工具并结合构建的三个词典对工作报告进行文本预处理。然后,一方面根据工作报告中的词统计信息,分别对频繁词、热词和新词进行概念上的界定并提出三种相应的特征筛选方法,基于新词提出了社会活力的计算方法,并对特征词时间序列进行聚类分析。另一方面根据文档信息,对1954—2017年整个时间段进行阶段划分,并结合特征词时间序列聚类结果进行特征词时间序列模式发现。最后,研究结果表明,抽取出的频繁词、热词以及新词能够反映出工作报告中探讨的共性问题、热点问题及其演化规律以及历年社会活力波动情况;根据特征词时间序列聚类结果和整个时间阶段合理的划分结果,发现了历年来国务院工作报告中存在的9种特征词时间序列模式。 |
|
|
2018 Vol. 37 (4): 406-421
[摘要]
(
307
)
HTML
(1 KB)
PDF
(2062 KB)
(
1117
) |
|
|
|
422 |
基于表示学习的跨模态检索模型与特征抽取研究综述 |
|
|
李志义, 黄子风, 许晓绵 |
|
|
DOI: 10.3772/j.issn.1000-0135.2018.04.008 |
|
|
以深度学习为代表的表示学习在语音识别、图像分析和自然语言处理领域获得了广泛关注与应用,它不仅推动了人工智能的深入研究和快速发展,而且促使企业思索新的运营与盈利模式。本文拟通过综述的形式对这些研究进行梳理,形成较为完整的综述。通过对国内外相关文献的调查和整理,从信息抽取与表示、跨模态系统建模两维度评述了基于表示学习的跨模态检索与特征抽取方面的研究成果。文章首先概括了自动编码器、稀疏编码、限制玻尔兹曼机、深度信念网络、卷积神经网络等五个经典的表示学习算法,然后从基于共享层建立各模态间的关联、表示空间中各模态间的关联、以深度学习为基础的跨模态建模算法等三方面归纳跨模态系统建模研究的现状,最后总结了跨模态检索的评价指标。研究发现:已有检索研究对于单模态信息检索较为丰富,查询和候选集的内容均属于同一模态;跨模态检索也仅限于对图像、文本两个模态对齐的语料。未来需要增加语音、视频、图像、文本等多模态数据的检索,改进深度学习算法构建多模态检索模型,实现三种或以上的跨模态检索。此外,尚需建立适合多模态检索系统的评价指标。 |
|
|
2018 Vol. 37 (4): 422-435
[摘要]
(
249
)
HTML
(1 KB)
PDF
(841 KB)
(
2705
) |
|
|
|