带摘要目录

2021年 第40卷 第3期
刊出日期:2021-03-24

情报分析方法与技术
研究进展与文献综述
专题约稿
情报用户与行为研究
专题约稿
223 新冠肺炎疫情微博用户情感与主题挖掘的协同模型研究 Hot!
王晰巍, 李玥琪, 刘婷艳, 张柳
DOI: 10.3772/j.issn.1000-0135.2021.03.001
本文主要研究针对新冠肺炎疫情期间的舆情事件,了解用户的情感及其关注主题,帮助相关舆情监管部门更好地提升舆情引导能力。本文基于认知情感评价模型,构建情感与主题挖掘协同分析模型,采用朴素贝叶斯模型(Naive Bayesian Model,NBM)对用户情感文本进行分类,并基于Relevance公式改进的LDA(Latent Dirichlet Allocation)主题模型进行主题提取。本文以新冠肺炎疫情期间“日本钻石公主号邮轮”典型舆情话题为例,进行网民情感及评论主题内容协同分析,并结合舆情事件周期和4种主题类型,对其情感特征及用户关注主题进行实证分析。研究结果表明,本文提出的情感与主题挖掘协同分析模型,能够在舆情事件发展生命周期内呈现网民情感及关注的主题特征;并且情感与主题协同分析的方法,可为舆情监管部门提高舆情引导效率,为实现网络生态治理起到一定的指导作用。
2021 Vol. 40 (3): 223-233 [摘要] ( 373 ) HTML (119 KB)  PDF (3691 KB)  ( 1199 )
234 基于LDA模型的新冠肺炎疫情微博用户主题聚类图谱及主题传播路径研究 Hot!
张柳, 王晰巍, 黄博, 刘婷艳
DOI: 10.3772/j.issn.1000-0135.2021.03.002
本文构建“日本钻石邮轮”舆情话题微博用户的主题聚类图谱和对网络社群间主题传播路径进行分析,可以更好地识别微博用户主题特征和意见领袖,从而帮助舆情监管部门对舆情进行更为有效的引导和监管。本文基于LDA(latent Dirichlet allocation)模型构建新冠肺炎疫情事件下微博用户的主题聚类图谱,利用困惑度评价指标来确定微博用户的最优主题数和主题分布;利用网络用户转发评论关系构建微博用户主题聚类图谱,提出网络社群间主题传播路径分析方法。本文结合“日本钻石公主号邮轮”这一全球新冠肺炎疫情期间的重要舆情话题,进行微博用户群体主题的确定、主题意见领袖的识别以及该话题下的网络社群间主题传播路径分析。研究结果表明,基于LDA模型可进行网络群体主题识别,并发现衍生的舆情话题,通过意见领袖识别可更好地进行舆情引导,利用网络社群的主题传播路径分析可进行话题推送,从而实现对舆情更好地引导及网络生态治理。
2021 Vol. 40 (3): 234-244 [摘要] ( 306 ) HTML (120 KB)  PDF (6331 KB)  ( 1000 )
245 新冠肺炎疫情事件信息传播主体特征分析方法及模型——以“钻石公主号邮轮”事件为例 Hot!
王晰巍, 贾若男, 刘婷艳, 张柳
DOI: 10.3772/j.issn.1000-0135.2021.03.003
新冠肺炎疫情被世界卫生组织(World Health Organization,WHO)定为国际关注的突发公共卫生事件(public health emergency of international concern,PHEIC),并受到全球的广泛关注,引发了全球社交媒体平台大量信息的传播。本文对突发公共卫生事件中信息传播主体特征进行分析,是政府舆情监管和引导部门在此次疫情互联网舆情引导及网络生态治理中关注的重要问题。本文构建了新冠肺炎事件信息传播主体的特征分析方法和传播主体特征分析过程的模型,结合新浪微博平台“钻石公主号”邮轮事件为全球疫情期间的典型话题,进行信息传播主体参与时间、信息传播主体影响力和信息传播主体发布内容特征的分析。研究结果发现,不同信息传播主体在参与时间上存在明显差异。网络官媒主体的总体影响力最高,且传播主体的影响力随时间动态变化;网络官媒和自媒传播内容主题鲜明,普通网民关注内容类型多、差异大。
2021 Vol. 40 (3): 245-255 [摘要] ( 325 ) HTML (104 KB)  PDF (9185 KB)  ( 301 )
情报分析方法与技术
256 基于三阶段DEA模型的学术虚拟社区知识交流效率评价研究 Hot!
杨瑞仙, 黄书瑞, 于政杰
DOI: 10.3772/j.issn.1000-0135.2021.03.004
针对目前学术虚拟社区知识交流效率研究均未剔除环境因素影响的问题,本文在分析环境因素对学术虚拟社区知识交流效率影响的基础上,剔除外生因素对学术虚拟社区知识交流效率的影响,为进一步客观评价学术虚拟社区的知识交流效率提供参考。本研究采用三阶段DEA(data envelopment analysis,DEA)模型,以“小木虫”论坛的有机交流、第一性原理、微米和纳米、金融投资4个版块为例,对比分析剔除外生因素前后学术虚拟社区知识交流效率的变化。研究结果发现,剔除外生因素的影响后,学术虚拟社区的知识交流效率有所提升,但仍未实现决策单元(decision making unit,DMU)有效;第一阶段和第三阶段的测算结果均显示第一性原理版块的知识交流效率最高;在环境变量对学术虚拟社区知识交流效率的影响中,散金数、用户总发帖、社区管理者参与度以及社区成员质量对学术虚拟社区知识交流效率有正向影响作用,而用户加入社区时长与用户在线时长等因素对社区知识交流效率有负向影响。
2021 Vol. 40 (3): 256-266 [摘要] ( 235 ) HTML (168 KB)  PDF (1715 KB)  ( 538 )
267 基于全代引证的专利累积影响力评价 ——一个诺奖得主专利的案例研究 Hot!
康旭东, 邓乐乐, 王宇开, 杨中楷
DOI: 10.3772/j.issn.1000-0135.2021.03.005
目前,学术界通常采用直接被引频次作为专利影响力的评价指标,然而,事实证明只考虑直接引用而忽略间接引用会降低对专利技术价值的衡量,因此,基于多代引证对专利影响力的评价逐渐兴起。本文以诺贝尔生理学或医学奖获得者悉尼·布伦纳在美国专利商标局申请的专利为例,基于影响力“累积”的思想,构建累积影响力指数,对专利的影响力扩散和引文网络进行深入研究。研究结果表明,累积影响力指数对专利影响力评价效力优于直接被引频次,能够挖掘“隐藏”的高影响力专利;专利的各代被引频次以及施引专利数近似呈“正态分布”,引证路径中的“关键专利”对目标专利影响力贡献较大;直接被引频次越高表示专利被引的潜力越大,短路径高被引型专利是潜在的高影响力专利。
2021 Vol. 40 (3): 267-277 [摘要] ( 307 ) HTML (139 KB)  PDF (4349 KB)  ( 483 )
278 基于加权网络改进的中文短文本相似性度量模型 Hot!
牛奉高, 高旭霞
DOI: 10.3772/j.issn.1000-0135.2021.03.006
随着文本信息的迅猛增长,数据挖掘已成为知识发现的重要方法。短文本相似性(short text similarity,STSim)度量是数据挖掘研究的重要技术。为了更好的提高短文本相似性度量精度,本文提出了基于加权网络改进的中文短文本相似性度量的一种新模型。首先,基于词语间的共现频次对语义网络进行加权,利用加权复杂网络表征短文本;其次,考虑短文本加权复杂网络权重识别度低的特点及每个词语节点的位置,计算短文本中每个词语的加权复杂网络综合特征值;最后,根据新模型计算短文本相似性,并通过聚类实验评价其优劣。实验结果表明,新提出的相似性度量模型优于STSim模型。
2021 Vol. 40 (3): 278-285 [摘要] ( 292 ) HTML (136 KB)  PDF (1678 KB)  ( 598 )
286 基于机器学习的人工智能技术专利数据集构建新策略 Hot!
陈悦, 宋凯, 刘安蓉, 曹晓阳
DOI: 10.3772/j.issn.1000-0135.2021.03.007
颠覆性技术是一个具有复杂的内在结构的技术群。从空间维度来看,颠覆性技术是包含了主导技术、辅助技术、支撑技术的复杂技术群,涉及多学科、多领域。在此背景下,运用科学计量的方法对颠覆性技术进行科技评价和科学技术演变规律探索面临挑战,实质表现为数据检索。本文探索了一种基于机器学习的专利数据集构建新策略,将专利检索任务作为机器学习的二分类任务,类似于信息检索中基于主动学习的查询分类思想,并提出了将F-measure特征最大化方法与CNN(convolutional neural networks)模型相结合的文本分类改进方法。本文以人工智能(artificial intelligence,AI)技术域为例进行训练实验,实验结果的准确率、召回率和F1值分别达到98.01%、97.04%和97.89%,这表明本文提出的策略能够精准地识别人工智能专利,提高了专利检索的准确率和召回率,以利于构建精、准、全的人工智能技术域专利数据集。
2021 Vol. 40 (3): 286-296 [摘要] ( 460 ) HTML (116 KB)  PDF (3947 KB)  ( 748 )
297 多维视角下科学主题演化分析框架 Hot!
王康, 陈悦, 苏成, 赵筱媛
DOI: 10.3772/j.issn.1000-0135.2021.03.008
本文以知识单元的游离与组合的知识计量理论为基础,以时间加权修正后提取的关键词为知识单元,从而在关键词、关键词关联和主题关联三个阶度进行科学主题演化分析的理论框架。其中,涉及时间加权词频测度、关键词关联的主题测度和主题关联的相似度测度。本文以图书情报领域大数据研究论文进行实证研究,研究结果表明,基于时间加权的关键词频数测度能够强化上升型关键词、弱化下降型关键词,快速探测出绝对高频词、突现词或新兴词;基于关键词关联的主题测度,可使研究者对图情领域大数据主题的发展趋势有整体的感知和预测;基于主题关联的相似度测度,能够展示各主题之间的融合、扩散、突现、消亡等复杂关系,有助于揭示领域研究热点和预测未来发展趋势。
2021 Vol. 40 (3): 297-307 [摘要] ( 247 ) HTML (137 KB)  PDF (5974 KB)  ( 542 )
情报用户与行为研究
308 在线健康社区中用户画像及主题特征分布下信息需求研究——以医享网结直肠癌圈数据为例 Hot!
盛姝, 黄奇, 郑姝雅, 杨洋, 解绮雯, 张戈, 秦新国
DOI: 10.3772/j.issn.1000-0135.2021.03.009
本文通过在线健康社区中对用户画像构建及主题特征挖掘,揭示不同用户角色群体下用户行为差异及特征,以了解社区内用户信息需求,为推动在线健康社区行业发展与完善提供建议。利用Python爬虫获取医享网中结直肠癌圈的用户数据,从用户角色属性、行为属性以及文本特征构建典型用户识别指标,利用典型用户识别指标与主题分类体系,将用户群体分为四类构建画像概念模型;再利用用户行为识别算法与主题聚类算法进一步挖掘不同角色下用户关注主题内容,实现用户信息需求的精准分析。本文通过挖掘分析四类用户角色在性别、年龄以及主题分布差异可以得出,不同用户群体信息需求具有显著差异。
2021 Vol. 40 (3): 308-320 [摘要] ( 428 ) HTML (157 KB)  PDF (3037 KB)  ( 975 )
研究进展与文献综述
321 人工智能时代的情报学发展与创新——基于情报交流理论的视角 Hot!
丁波涛
DOI: 10.3772/j.issn.1000-0135.2021.03.010
本文对人工智能时代情报学科的创新发展进行了较为全面系统的探讨。首先,本文基于情报交流理论,回顾了情报学的历史发展阶段:大科学时代、大信息时代、大知识时代、大数据时代和大智能时代;其次;本文分析了人工智能环境下情报交流理论的演进,包括交流主体虚拟化、交流内容智能化和交流过程非意识化;第三,本文从新情报观、新过程观和新方法论三个维度,分析了人工智能时代情报学科的发展;最后,本文分析了人工智能对情报工作的影响,包括情报分析的回归、情报工程化和开源情报的重要性提升。本文对情报交流理论、情报学科体系和情报工作的分析,既有助于对新技术环境中情报理论的创新发展提供思路,也可以为情报系统和情报服务的智能化创新提供参考。
2021 Vol. 40 (3): 321-332 [摘要] ( 472 ) HTML (119 KB)  PDF (1896 KB)  ( 1173 )