带摘要目录

2018年 第37卷 第3期
刊出日期:2018-03-24

情报理论与应用
情报分析方法与技术
研究进展与文献综述
情报理论与应用
231 跨学科合作模式下的交叉科学测度研究——以ESI社会科学领域高被引学者为例
张琳, 孙蓓蓓, 黄颖
DOI: 10.3772/j.issn.1000-0135.2018.03.001
交叉科学作为当代科学发展的时代特征和提高科技创新能力的重要途径,其特有的复杂性决定了科学合作必然成为交叉科学研究主流的科学活动模式。本文探索性地提出了基于合著机构地址提取学科分类的方法,从而测度科学合作中的不同学科机构之间的学科交叉程度。以2014—2016年连续入选社会科学总领域的高被引学者研究成果为例,探索不同学科的机构合作是否有助于产生交叉科学成果。实证研究结果表明:跨学科的机构合作对交叉科学成果的产出具有一定的促进作用,但不同合作机构的跨学科程度产出的交叉科学研究成果之间存在差异。研究结果为学科交叉的管理机制和相关科技评价政策的制定提供了一种新的思路。
2018 Vol. 37 (3): 231-242 [摘要] ( 211 ) HTML (1 KB)  PDF (833 KB)  ( 932 )
243 图书情报学领域期刊论文零被引率的演变规律研究
胡泽文, 武夷山, 高继平
DOI: 10.3772/j.issn.1000-0135.2018.03.002
论文零被引率是指一个国家、机构、期刊或个人某年出版的文档集合中,在出版后的某个特定引用时间窗口中未被引文档的数量或比例。它是科学出版领域中普遍存在的一种现象,然而当前的引用分布研究文献过多地关注至少被引一次论文的引用分布情况,而对论文零被引率的演变规律关注甚少。为此,本文从国内外图书情报学领域期刊中,选取6本不同影响力期刊为研究样本,实证分析了6本期刊1990—1993各年出版的论文在出版后0~19年不同引用时间窗口中论文零被引率的时间演变规律,以及1990—2012各年论文出版后当年、三年和六年零被引率的年度变化规律。实证分析发现:①除日本多语言期刊《图书与情报》(LIS)之外,其他5本期刊论文零被引率的时间演化规律能够很好地被一个三参数负指数模型:P(Xt=0)=K+Ae-S×t拟合,拟合优度(R2)都达到96%以上;②除日本《图书与情报》(LIS)期刊外,其他5本期刊论文零被引率随引用时间窗口变大而形成一系列具有“开始下降较快,随后非常缓慢地下降,直至一个非常低且稳定的水平线”特征的凹形曲线;并且此5本期刊睡眠系数S区间值大小与它们的下降幅度区间值大小的方向一致,期刊的下降幅度越大,越易于较快达到一个稳定的、变化非常少的水平,从而导致一些未被引的文献在此后的长时间内处于睡眠状态;③6本期刊论文零被引率的年度变化规律显示,随着时代的发展,图书情报学领域期刊论文的传播与利用速度越来越快。除日本《图书与情报》(LIS)论文零被引率较高,且历年变化较小外,其他5本期刊论文零被引率,尽管历年变化较大,但总体呈现下降趋势。
2018 Vol. 37 (3): 243-253 [摘要] ( 157 ) HTML (1 KB)  PDF (692 KB)  ( 545 )
254 专利引用和投入产出结合的企业间技术关联和竞合态势分析——以苹果公司生态系统为例
王海龙, 王敏昱, 姜照华
DOI: 10.3772/j.issn.1000-0135.2018.03.003
将企业的施引专利视为投入,而将其授权专利视为产出,将投入产出与专利引文分析结合分析创新生态系统内企业间的技术关联及竞合态势。首先定义了直接引用系数、技术感应度、技术影响力系数等概念和分析框架,然后以苹果生态系统的11家企业1998—2014年的专利数据为样本建立了专利权人引用网络,据此测算了苹果公司的直接引用系数、各企业间的技术影响力系数和技术感应度系数,分析了各个企业间的技术关联特征,并评估了各企业的综合技术实力。研究发现,英特尔和AMD在移动智能终端产业中居于技术领导者地位;苹果公司具有较高的技术影响力,但其技术影响力逐步下降;三星电子具有较高的技术感应力,且其技术影响力在逐步提升。该方法可应用于区域、产业、企业间竞争态势、技术溢出及知识流动分析等多个领域。
2018 Vol. 37 (3): 254-261 [摘要] ( 253 ) HTML (1 KB)  PDF (390 KB)  ( 555 )
262 全球太阳能专利技术竞争格局与发展趋势研究
初钊鹏, 李扬, 刘昌新
DOI: 10.3772/j.issn.1000-0135.2018.03.004
面对日趋激烈的国际竞争和气候变化等全球性挑战,开展全球太阳能技术竞争情报分析具有重大的研究意义。本文采用Innography专利挖掘与数据分析技术,通过分析专利申请国别、专利技术应用国、专利申请IPC分布、专利申请权利人和专利强度等,研究了全球太阳能专利技术竞争格局与发展趋势;进一步对全球主要市场和核心专利在世界范围内进行挖掘,通过数据分析提取太阳能技术领域核心专利集中的国家和机构,并开展了中国市场本土研发者和全球研发者技术布局比较研究。基于以上研究结果,从竞争环境、竞争对手、技术竞争和国际化战略四个方面全面评价全球太阳能专利竞争态势和热点研发技术布局,进而提出中国加快技术创新和产业升级,提升太阳能产业国际市场竞争力的政策建议。
2018 Vol. 37 (3): 262-273 [摘要] ( 137 ) HTML (1 KB)  PDF (973 KB)  ( 777 )
情报分析方法与技术
274 基于网络叙词表的图情学科SKOS构建与可视化研究
石泽顺, 肖明
DOI: 10.3772/j.issn.1000-0135.2018.03.005
随着语义网与关联数据技术的兴起与发展,采用SKOS对网络叙词表进行语义化描述逐渐成为主流,这为叙词表的发布、共享以及应用提供了新的契机。本文首先抓取EBSCO公司LISTA数据库的图情学科网络叙词表构建数据集,共得到概念词11243个,其中正式叙词4255个,入口词6988个。接着,利用SKOS对叙词表中的语义关系进行规范化描述;利用qSKOS对语义化词表的完整性进行验证,为SKOS叙词表的正确性与合法性提供保证;利用Apache jena Fuseki将SKOS格式的叙词表发布关联数据,并构建Jena文本索引以支持Lucene全文本检索。最后,利用Graphviz进行叙词网络的绘制和可视化呈现,并利用Skosmos构建图情学科叙词表检索系统,实现了图情学科知识概念的中英文浏览、查询和检索。本文通过实验证明SKOS能较好地描述和揭示网络叙词之间的语义关系,图情学科SKOS的构建对领域概念查询、学术知识检索、领域本体构建等都具有重要意义。
2018 Vol. 37 (3): 274-284 [摘要] ( 199 ) HTML (1 KB)  PDF (1972 KB)  ( 816 )
285 混合需求驱动的文内视觉资源移动视觉搜索框架
胡蓉, 唐振贵, 朱庆华
DOI: 10.3772/j.issn.1000-0135.2018.03.006
文内视觉资源是学术文献中重要的可视知识单元,提供移动互联环境下文内视觉资源的搜索服务,将成为情报学领域学术知识服务的创新价值增长点。本文从文内视觉资源的“供给-需求-服务”三方视角出发,通过整合学术用户不同层次的需求,融合文内视觉资源的底层视觉特征、高层语义特征与上下文文本信息特征,探索文内视觉资源移动视觉搜索(VRAL-MVS)的实现框架。框架的资源描述与组织部分重点进行了VRAL-MVS系统的需求层次识别和VRAL本体构建,检索实现部分则侧重探讨了系统架构与检索流程,并开发了VRAL-MVS原型系统,以PLOS ONE数据集为例对框架效果进行了验证。总体上看,该框架能初步满足学术用户以图搜图、以图搜意与以图搜文的混合需求,本研究也是将移动视觉搜索技术引入学术情报服务,并深入到更细粒度的可视知识单元进行检索的探索型研究。
2018 Vol. 37 (3): 285-293 [摘要] ( 156 ) HTML (1 KB)  PDF (2623 KB)  ( 601 )
294 社交媒体健康信息质量研究:基于真伪健康信息特征的分析
李月琳, 张秀, 王姗姗
DOI: 10.3772/j.issn.1000-0135.2018.03.007
针对社交媒体中健康信息质量不高,国民健康信息素养水平整体偏低,缺少对健康信息的辨别机制等现状,本研究从微信朋友圈转发的健康信息中选取样本,分析真、伪健康信息的特征,构建伪健康信息特征列表,以帮助用户提高对健康信息的辨别能力,提升他们的健康信息素养。为此,本研究收集了482条健康信息作为样本,利用辟谣平台和邀请专家对其真伪进行判断。通过三轮真伪健康信息的辨别,将样本分为真、伪健康信息,进而基于信息质量评价框架,使用NVivo质性数据分析工具,通过开放编码分析真、伪信息的特征,并通过卡方检验,验证真伪健康信息特征的差异,尤其是伪健康信息的显著特征。研究发现,真伪健康信息的转发行为受转发者的性别、职业的影响。伪健康信息具有的显著特征体现在缺乏可信度、准确性、合理性及相关支持等方面,其中包括标点问题、不当空格、诱导性文字、文题不符、强烈的个人观点、内容重复、内容不完整、假借权威等中文语境下独有的特征。本研究据此构建伪健康信息列表,提供伪健康信息识别的工具。同时,本研究识别的伪健康信息特征有助于健康信息系统设计相应的机制,通过不同的技术手段,屏蔽或清除此类伪健康信息,从而从根本上提高网络健康信息的质量,净化网络健康信息环境。
2018 Vol. 37 (3): 294-304 [摘要] ( 304 ) HTML (1 KB)  PDF (539 KB)  ( 4030 )
305 共词网络LDA模型的中文短文本主题分析
蔡永明, 长青
DOI: 10.3772/j.issn.1000-0135.2018.03.008
由于短文本的特征稀疏性,传统的LDA或PLSA主题模型分析短文本的效果并不理想。结合社交网络社区发现技术,提出CA-LDA模型(Latent Dirichlet Allocation Model with Co-word network Analysis)。在传统LDA模型的基础上加入共词网络分析,考虑词汇在不同文档间的共现情况,构建词汇社交网络;利用词汇社交网络隐含空间降维的方法,以自同构等价规则,合并在网络中结构特征相同的词汇,在不损失信息的前提下,降低了词汇矩阵稀疏性;考虑词汇搭配关系(网络节点的邻接),以共词网络特征向量中心度调节主题模型中的词汇权重,通过递归累加,提高与重要词汇搭配的词汇的重要性;在传统LDA主题模型吉布斯采样(Gibbs Sampling)过程中,同时增加隐含位置聚类模型的社区发现算法,提高了具有相同搭配关系词汇划分在同一主题下的概率。实验证明该模型在短文本分析中有较好的效果。
2018 Vol. 37 (3): 305-317 [摘要] ( 271 ) HTML (1 KB)  PDF (1905 KB)  ( 1616 )
研究进展与文献综述
318 科学计量中多源数据融合方法研究述评
许海云, 董坤, 隗玲, 王超, 岳增慧
DOI: 10.3772/j.issn.1000-0135.2018.03.009
本文系统综述了科学计量学中多源数据融合的研究和应用现状,将科学计量中多源数据融合划分为前期融合、中期融合和后期融合,并重点分析了多数据类型关系的获取与融合实现方法。在此基础上,提出科学计量分析中多源数据融合的挑战和未来可能的突破方向,并借鉴数理领域的数据融合方法,构建了未来科学计量分析的多源数据融合流程和发展趋势。
2018 Vol. 37 (3): 318-328 [摘要] ( 276 ) HTML (1 KB)  PDF (596 KB)  ( 1174 )
329 命名实体识别研究综述
刘浏, 王东波
DOI: 10.3772/j.issn.1000-0135.2018.03.010
命名实体识别一直以来都是信息抽取、自然语言处理等领域中重要的研究任务,随着机器学习技术的新发展,数字人文研究的兴起,事件知识和实体知识变得越发重要,命名实体识别焕发出新的发展动力。本文详细梳理了命名实体识别从提出至今的发展脉络,从实体的定义、重要的评测会议、主流的研究方法研究的应用价值等角度,全面考察了该领域的研究现状,并分析了命名实体识别未来的发展趋势。
2018 Vol. 37 (3): 329-340 [摘要] ( 330 ) HTML (1 KB)  PDF (393 KB)  ( 4422 )