带摘要目录

2020年 第39卷 第1期
刊出日期:2020-01-28

情报理论与应用
情报分析方法与技术
研究进展与文献综述
情报用户与行为研究
情报理论与应用
1 多因素驱动下的领域知识网络演化模型:跟风、守旧与创新 Hot!
陈果, 赵以昕
DOI: 10.3772/j.issn.1000-0135.2020.01.001
当前几种经典的复杂网络模型尚不能有效拟合领域知识网络现实情况,表现为:①以边连线为增长单元难以有效拟合知识网络模块化增长的高聚集效应;②知识增长中除马太效应外,有其他重要因素(如守旧、创新)与之抗衡。因此,有必要根据领域知识自身增长特点探寻一种新的演化模型,以有效实现领域知识的量化分析和预测。本文以典型的领域共词网络为例,从微观的增长视角解析其生成过程、增长方式和多种影响因素,以前人研究结论为证据,提出一种由模块化增长单元组成,并融合跟风、守旧与创新三种影响因素的领域知识网络演化模型;随后,通过实验仿真证明了该模型能更好地拟合现实领域知识网络的整体和微观结构;最后,以此模型为基础,通过进一步的仿真实验揭示了相关因素在领域新知识增长、知识聚集中的影响力度和相互作用。本研究为领域知识增长规律和共现型知识网络结构规律的探索提供了更直接可靠的量化分析基础。
2020 Vol. 39 (1): 1-11 [摘要] ( 222 ) HTML (178 KB)  PDF (1376 KB)  ( 672 )
12 共被引分析方法迭代创新路径研究 Hot!
宋歌
DOI: 10.3772/j.issn.1000-0135.2020.01.002
科研领域的迭代创新是一项原始创新得以扩散和发展的主要创新形式。该研究以共被引分析方法为典型案例,探索科研领域迭代创新的基本特征。通过对共被引分析方法迭代创新的整体趋势、创新阶段、迭代路径和跨学科迭代创新的分析,发现其特征包括对原始创新核心内容的不断调用以及对相关知识的引进与整合;面向问题的反复调整迭代;微创新的累积促生原始创新;在迭代创新形成规模之前存在“沉寂期”;学科间的广泛扩散不仅促进迭代创新,而且不同学科在迭代创新中的“角色”不同,存在创新源发学科、创新助力学科和创新采纳学科;另外,持续的迭代创新有赖于外部环境的支撑。
2020 Vol. 39 (1): 12-24 [摘要] ( 212 ) HTML (135 KB)  PDF (5675 KB)  ( 558 )
25 中文文献引文情感语料库构建 Hot!
徐琳宏, 丁堃, 陈娜, 李冰
DOI: 10.3772/j.issn.1000-0135.2020.01.003
基于内容的引文情感分析克服了传统基于引用频次的引用同一化问题,是引文内容分析领域一个重要的研究热点。然而引文情感分析依赖于带标注的数据集,目前大规模高质量的引文情感语料资源匮乏,严重制约了该领域的研究。因此,本文在分析引文情感表达方式的基础上提出了一套适用于引文情感表示的标注体系,并详细阐述了语料库建设的技术和方法。采用人机结合的标注策略,借助完善的引文标注系统,构建了规模较大的中文文献的引文情感语料库。统计结果显示,在中文信息处理和科技管理领域情感褒义和贬义总的引用的占比分别为22%和6%,引文情感标注kappa值达到0.852,表明该语料库能够客观地反映作者的情感倾向性,可为论文评价、引文网络分析和情感分析等相关领域的研究提供数据支撑。
2020 Vol. 39 (1): 25-37 [摘要] ( 267 ) HTML (120 KB)  PDF (3548 KB)  ( 613 )
38 基于深度学习的期刊分群与科学知识结构测度方法研究 Hot!
逯万辉, 谭宗颖
DOI: 10.3772/j.issn.1000-0135.2020.01.004
准确地研究和测度科学知识之间的逻辑关系和结构体系,是进行科学政策研究和科研项目资助布局等科研管理活动的重要基础。学术期刊作为科学知识传播和交流的重要平台,是探测科学知识结构的一种有效载体,但是不同的学术期刊分类体系对科学知识结构的测度结构会产生直接而广泛的影响。文章从学术期刊分群的角度出发,考虑期刊在共被引过程中的距离因素,通过采用深度学习算法,来进行期刊的相似度计算与分群问题研究,在此基础上进行科学知识结构测度方法研究,并以中国人文社会科学期刊引文数据库为实验对象进行了实证研究。从实证结果来看,我国人文社会科学学科知识结构存在较为明显的结构划分,不同学科类别或不同研究领域的期刊都被分到了相应的群组,表明从期刊使用的角度来看,我国人文社会科学知识结构边界是相对较为清晰的。在此基础上重点对法学期刊的两个群组的科学研究主题进行了挖掘,从关键词的共现网络中可以明显看出,两个期刊群体内的研究主题虽有一定的交叉,但是两者在具体研究内容上也存在着显著区别。
2020 Vol. 39 (1): 38-46 [摘要] ( 177 ) HTML (80 KB)  PDF (2828 KB)  ( 564 )
情报分析方法与技术
47 我国智慧政府信息协同网络结构识别与分析 Hot!
胡漠, 马捷, 张云开, 武博
DOI: 10.3772/j.issn.1000-0135.2020.01.005
智慧政府是电子政务的下一代更迭,受到各国的广泛关注。智慧政府可以通过各部门间的信息协同提升城市运行管理的效率。当前对智慧政府信息协同的研究主要集中于研究智慧政府信息协同的机制,少有对智慧政府信息协同网络结构现状进行识别与分析的研究。本文采用命名实体识别的方法基于目标数据源(智慧政府相关政策文件)中识别出的中国智慧政府信息协同网络的节点(政府部门)数据及节点关系(各个政府部门间的信息协同关系)数据,得到中国智慧政府信息协同网络结构,并对这些数据进行可视化处理。在此基础上采用社会网络分析中的度中心性方法,把各个节点按其对整个网络影响力的强弱排序;采用k-plex分析方法,识别出对整个网络具有较强影响力的节点。研究结果显示,中国智慧政府信息协同网络共包含34个节点和355组节点关系。在节点中,国务院节点对整个网络的影响力最强,中国气象局节点对整个网络的影响力最弱。在节点关系中,国家发展和改革委员会节点与国务院节点间的节点关系对整个网络具有较强的影响力,像这样具有较强影响力的节点关系共28组。本研究得到的结果可用来指导今后中国智慧政府信息协同网络优化与发展的侧重方向。
2020 Vol. 39 (1): 47-56 [摘要] ( 179 ) HTML (134 KB)  PDF (4019 KB)  ( 700 )
57 基于异构信息网络嵌入的专利技术主体间交易推荐模型 Hot!
何喜军, 董艳波, 武玉英, 蒋国瑞, 马珊, 郑瑶
DOI: 10.3772/j.issn.1000-0135.2020.01.006
考虑专利技术主体间技术邻近、地理邻近、共申请关系、引证关系、经济圈效应、主体类型邻近、主体间从属关系这7种因素对交易的影响,构建由4类节点、10类关系组成的异构信息网络,设计基于元路径与元结构的异构关系遍历算法获取主体间关系序列。以关系序列为语料,构建基于网络嵌入的异构信息网络主体间交易推荐模型(PSR-vec),采用基于Huffman树的Skip-Gram方法进行网络嵌入训练,计算主体向量间相似度以实现交易推荐。通过2012—2018年电子信息领域专利数据的实证研究得出:第一,PSR-vec模型相比DeepWalk、node2vec与PathSim等方法,推荐精度大幅提高,达到82.4%;第二,融合多个元路径与元结构特征的推荐与单一特征相比,推荐精度大幅提高;第三,基于ρ2以及改进的元结构S4、S6、S8、S10、S12、S14的推荐结果均高于基于ρ1以及改进的元结构S3、S5、S7、S9、S11、S13的推荐精度,说明基于主体间转让技术邻近性的推荐精度更高;第四,在技术邻近元路径基础上分别融合主体间共申请、引证、从属、经济圈效应这4类邻近关系获得元结构并进行推荐,推荐精度均显著提高,而融合地理邻近、类型邻近2类关系后推荐精度有所降低,说明地理邻近、类型邻近对交易的促进作用不明显;第五,基于PSR-vec模型的推荐结果包括具有控股和供应等紧密关系的主体,也包括关系松散的主体,推荐结果具有多样性。本研究为专利技术主体间的有效对接提供了决策方法。
2020 Vol. 39 (1): 57-67 [摘要] ( 250 ) HTML (248 KB)  PDF (1325 KB)  ( 686 )
68 专业社交媒体中的主题图谱构建方法研究——以汽车论坛为例 Hot!
林杰, 苗润生
DOI: 10.3772/j.issn.1000-0135.2020.01.007
专业社交媒体中主题图谱的内容包括论坛中的主题及主题之间的关系,其具有挖掘专业产品创新方向、构建专业知识索引等重要应用价值。本文基于深度学习技术与文本挖掘技术,提出了专业社交媒体中的主题图谱构建方法。首先,使用专业社交媒体中的文本训练Skip-Gram模型,利用该模型的隐藏层权重与模型输出的预测结果,分别获取词语间的语义相似度与上下文关联度。其次,基于该语义相似度与上下文关联度,对已有领域种子本体词汇进行扩充,将语义相似或上下文相邻近的词汇纳入本体词汇,为主题抽取提供高质量的领域词汇。然后,基于扩充的专业本体词汇,使用结合本体词汇的LDA主题模型从专业社交媒体文本中抽取主题与主题词。最后,利用语义相似度与上下文关联度,定义关联度权重,通过图模型与谱聚类,获取主题间与主题词的关联关系与层次结构。本文使用汽车论坛语料进行主题图谱生成实验。实验结果表明,本文方法获取的主题词纯净度相比单独使用LDA模型提升了20.2%,且能够清晰合理地展现主题之间的关系。
2020 Vol. 39 (1): 68-80 [摘要] ( 318 ) HTML (133 KB)  PDF (2950 KB)  ( 844 )
81 基于OCC模型和LSTM模型的财经微博文本情感分类研究 Hot!
吴鹏, 李婷, 仝冲, 沈思
DOI: 10.3772/j.issn.1000-0135.2020.01.008
为了解决财经微博文本中网民情感状态转移的时序数据分析问题,本文提出一个基于认知情感评价模型(Ortony,Clore & Collins,OCC)和长短期记忆模型(long short term memory,LSTM)的财经微博文本情感分类模型(OCC-LSTM)。基于OCC模型从网民认知角度建立情感规则,对财经微博文本进行情感标注,并作为LSTM模型进行深度学习的训练集;基于LSTM模型,使用深度学习中的TensorFlow框架和Keras模块建立相应的实验模型,进行海量微博数据情感分类,并结合13家上市公司3年的微博文本数据进行实证研究和模型验证对比。实证研究结果发现本文提出的模型取得了89.45%的准确率,高于采用传统的机器学习方式的支持向量机方法(support vector machine,SVM)和基于深度学习的半监督RAE方法(semi-supervised recursive auto encoder)。
2020 Vol. 39 (1): 81-89 [摘要] ( 146 ) HTML (106 KB)  PDF (1157 KB)  ( 1101 )
情报用户与行为研究
90 眼动追踪实验法在信息行为领域的应用研究 Hot!
李晶, 陈志燕, 陈明红
DOI: 10.3772/j.issn.1000-0135.2020.01.009
在综合Wilson信息行为模型和信息旅程模型基础上构建研究框架,依次从确定需求阶段、搜寻信息阶段、判断和解释信息阶段、利用信息阶段系统展现最近十年眼动追踪实验法在信息行为领域的应用全景,提出眼动追踪实验法在研究弱势人群的信息行为、用户被动注视和被动搜索行为、信息回避行为等方面具有方法上的优势,在分析现有研究不足的基础上提出需要扩展眼动追踪实验法的应用领域,规范指标参数的选取并充分挖掘可供使用的指标参数,设计精良的实验最大限度排除非相关因素的干扰等若干研究建议,为推动眼动追踪实验法在信息行为领域的应用提供参考和启示。
2020 Vol. 39 (1): 90-99 [摘要] ( 205 ) HTML (128 KB)  PDF (872 KB)  ( 976 )
研究进展与文献综述
100 基于时间加权关键词词频分析的学科热点研究 Hot!
奉国和, 孔泳欣
DOI: 10.3772/j.issn.1000-0135.2020.01.010
基于生命周期理论和词频分析方法,对学科领域发展过程进行客观合理的动态跟踪与分析。构建时间—关键词频次矩阵,结合相对词频、词频变化率,引入逻辑斯谛(Logistic)函数赋予词频按时间递减的权重,设计时间加权关键词词频分析模型,计算关键词综合值,揭示学科研究热点及变化趋势;并以CNKI和CSSCI收录的18种图情领域核心期刊2013—2017年所刊载的文献关键词作为实验对象,从高频词、中频词、低频词三个方面验证模型的有效性和准确性。模型计算结果显示,上升型高频词排名上浮,下降型高频词排名下沉,可快速识别上升型高频词;同时排名靠前的低频词具有发展潜能,为学者把握未来研究趋势提供科学判断依据。
2020 Vol. 39 (1): 100-110 [摘要] ( 241 ) HTML (286 KB)  PDF (770 KB)  ( 727 )
111 情感分析研究的知识结构及热点前沿探析 Hot!
周建, 刘炎宝, 刘佳佳
DOI: 10.3772/j.issn.1000-0135.2020.01.011
为了解国内外情感分析领域的研究状况,揭示该领域的知识结构、研究热点与发展动态,本文采用共被引分析、聚类分析、共词分析、战略坐标分析等方法,借助CiteSpace、UCINET、BICOMB、SPSS等软件,对Web of Science数据库收录的以情感分析为主题的相关文献进行计量分析与知识图谱绘制。分析结果表明,情感分析的应用、深度学习与神经网络、电子商务下的产品评论、事物情感特征评分、社交网络下用户生成内容、语义定向广告技术以及文本语言属性分析构建了情感分析的知识结构,产品评论与口碑、数据挖掘与人工智能、无监督学习、Hadoop-MapReduce与支持向量机以及神经网络与深度学习为该领域的研究热点,而顾客评论、推荐系统、极性分类、主题模型、电影评论、推特数据将是未来该领域主要研究方向。
2020 Vol. 39 (1): 111-124 [摘要] ( 315 ) HTML (187 KB)  PDF (2783 KB)  ( 1599 )