1 社会网络分析方法在情报分析中的应用概况
目前,在自然科学领域,网络研究的爱好者主要分布在物理学和生物学领域,在物理学领域,复杂网络早期研究的目标是揭示非随机网络的全面特征,如无标度特征、小世界现象等。近年来,刘宏鲲
等[4] 指出,复杂网络研究正在转向深入挖掘具有代表性的典型网络的特性上来,大量的研究开始关注一些有代表性的网络是否具有不同于其他网络的独特性质,如科学家合作网的富者俱乐部[5] 现象。同时,不同网络也因其在演化发展过程中会受到不同因素(如竞争、环境、学科领域、地理区域分布等)的影响而呈现出不同的演化特征[6] 。然而,自然科学领域的研究人员对网络科学方法在社会学领域的应用则知之甚少。在社会学领域,研究者倾向于研究不同组织或上下文之间的结构变化,并用这些变化解释其产出的不同,但两者共同关注的研究目标则是解释网络链接的形成机制,预测网络特
征[7] 。不过,随着近年来图书情报领域的研究人员对网络科学研究的持续增多,也引起了物理学领域研究人员的关注,他们也开展了不少有关科学计量学研究,包括研究论文的审稿周期与日后被引情况的相关性[8] 、研究引文数的对数正态分布对影响因子与引用成功指数之间关系的影响[9] 等。在情报分析领域,针对文献引文网络、合作网络、主题关联网络等的社团划分研究工作是社会网络分析方法在情报分析中应用的重要方面,甚至已成为图书情报领域的研究热点方向之一,在科学结构研究方面发挥着重要的作用。主要算法包括GN算
法[10] 、Newman贪婪算法[11] 、Louvain算法[12] 以及SLM算法[13] ,模块度函数Q常被用于测度社团划分的质量[14] 。下面章节主要从网络类型角度对合作网络、引文网络、主题关联网络的研究进展进行评述,同时对用于网络展示的可视化方法进行介绍。
2 合作网络
2.1 合作网络的类型
合作网络研究的对象主要包括宏观(国家、城市)、中观(机构)和微观(个人)三个层面。
国家合作网络呈现出世界各国在不同学科领域的国际地位,由于国家间合作网络节点有限,且通常以美国和欧洲的部分发达国家处于网络的核心,专门研究国家合作网络的工作并不多,通常仅是作为一项研究工作的一部分。例如,笔者在2013年研究了科学计量学领域的国家合作网络,揭示出美国、比利时和英格兰长期处于科学计量学国家合作网络的中
心[15] ;Khan等[16] 在2013年利用社会网络分析与三重螺旋指标进行混合的方法,研究了电子政务领域国家间合作网络的协作模式;Han等[17] 在2014年分析了图书与情报领域的国家合作网络,揭示了美国和英国在合作网络中的显著地位。近年来出现了空间科学计量学(spatial scientometrics)的概念,即明确考虑空间维度的科学计量学研究,研究引用的空间分布,合作、引用和流动中的空间偏见,国际合作与国内合作的影响等问
题[18] 。例如,Wu[19] 在2013年提出了一个基于空间多样性(SDCR)的城市和国家的引文排名,侧重于引文网络中“空间”方面的测量,以解决由引文的不同地理位置引起的引用偏见。近期,许多空间科学计量学的研究集中在利用各种科学计量指标来分析城市的科学产出方面,以城市为节点的城市间合作网络研究工作日益引起研究人员的关注。例如,Csomos[20] 在2018年以Scopus数据库索引的期刊文章为基础,分析了1986—2015年世界范围内城市的科学产出情况,以及城市间的合作网络,挖掘了每个城市的优势学科。在机构合作网络研究方面,主要研究工作包括挖掘网络的演化机制、影响因素等。例如,Roesle
r[21] 在2017年研究了德国生物技术产业内由公共机构资助的研发项目下形成的合作网络的演化情况,发现了大学在网络演化中发挥了绝对的主导作用。Luo等[22] 在2018年通过研究澳大利亚人文社科领域大学间合作网络演化的影响因素发现,虽然地理空间对大学间的合作有一定的负面影响,但是通过加强大学内部研究人员的合作,可以有效提升大学间的合作水平。此外,在专利分析领域,专利权人合作网络受到了较多的关注度。例如,笔者早在2011年就提出了适用于专利权人关联网络分析的社会网络分析方法体系,对其分析理论、方法进行了系统的讨论,其中最重要的一个模块就是专利权人合作网络[23] ;随后笔者利用该方法体系研究了工业生物技术领域专利权人合作网络的演化特征[24] ,研究了生物经济领域引擎技术与非引擎技术专利权人合作网络演化特征的差异,发现了引擎技术拥有更高的专利合作程度的规律[25] 。2017年,Choe等[26] 研究了韩国专利权人合作网络的演化特征,发现了专利权人合作网络具有小世界特征,政府资助的研发机构在专利权人合作网络中扮演着核心节点和中间点的角色,对网络演化起到了决定性的作用。在个人合作网络研究方面,早在2002年Girvan和Newma
n[10] 首次提出“社团”概念的研究中,他们以圣塔菲研究所的科学家合作网络为研究对象,开展个人合作网络的社团划分研究,用于验证GN算法的效果。Börner等[27] 在2005年开展了加权作者合作网络,通过论文数及被引频次对网络进行加权,进而基于作者在网络中的位置来评价作者的影响力。笔者在2013年基于Scientometrics期刊1978—2010年发表的所有论文的作者合作演化网络挖掘出了科学计量学领域的重要学者[15] 。合作网络研究的重点方向之一是社团划分研究。例如,Girvan和Newma
n[10] 利用GN算法对圣塔菲研究所1999—2000年的271位科学家的合作网络开展了社团划分研究,将271位科学家形成的合作网中由118位科学家构成的最大主成分划分为4个社团,分别是RNA结构、统计物理、生态学数学模型、基于代理的模型。随后,有关合作网络的社团研究大量涌现。有代表性的工作以及科学计量学领域最新的研究包括:Palla等[28] 在2007年对科学家及其手机通讯对象所构建的合作网络的演化开展了定量研究,Guimera等[29] 在2005年研究了团队组建机制对艺术和科学领域的合作网络结构和团队绩效的影响,Lambiotte等[30] 在2009年通过合作网络的社团结构研究了科学合作模式是如何促进知识创造和扩散的,Moliner等[31] 在2017年研究了人才管理领域科学家合作网络的社团结构,Zheng等[32] 在2017年基于单本期刊的作者共著网络开展了社团的演化研究,Mao等[33] 提出了一种利用机器学习技术和网络理论来检测同时具有拓扑和主题特征的主题科学社团的方法等。笔者也利用科学家合作网络的社团结构研究了中科院量子卓越创新中心的科研组织模式。2.2 合作网络的应用
合作网络研究的首要应用是用于科研表现评价,已有研究证明了科学家合作水平的高低在一定程度上可以反映科学家科研表现的强
弱[34] 。例如,Abbasi等[35] 在2011年发现,科学家的科研表现与度数中心度、效率和平均合作强度成正比。在此基础上,笔者构建了一个用于评价科学家科研表现的复合合作强度指数(compound collaboration strength,CCS),综合了作者数量、合作机构数量、篇均合作作者数量、篇均合作机构数量、以样本STDEV.S标准差表征的每篇论文合作机构分布的异质性以及拥有合作机构论文所占比例共6个参数[34] 。合作网络还被用于研究学科结构与演化。例如,Bettencourt
等[36] 在2009年指出,作者合作网络会随着学科的发展而变得越来越稠密,作者(nodes)及合作边(edges)的关系符合简单的标度律edges= A(nodes)α,其中标度指数α>1;作者合作网络的直径在经历领域发展初期的快速增长后,会在领域进入成熟期后稳定在12~14。合作网络也可被用于评价技术的重要性。例如,笔者基于专利权人合作网络演化特征的研究,提出了生物经济引擎技术预见模型,比较分析了两种引擎技术和两种非引擎技术的专利权人合作网络演化特征的差
异[25] ,为开展技术预见研究提供支撑,为科学家、政策和规划制定者以及利益相关者提供战略和政策制定的参考。3 引文网络
引文网络分析是科学计量学领域研究的重要内容,引文网络在一定程度上可被看作一种信任网
络[37] 。引文网络分析的内涵和方法也随着社会网络分析方法的发展得以不断丰富[38] ,吴海峰等[39] 将引文网络研究划分为引文网络演化、学科知识和主题识别、学术评价指标优化、引文网络的社团等几个方面。引文网络的社团划分是引文网络领域的研究热点之一,为了便于研究人员分析引文网络的社团结构,荷兰莱顿大学Waltman和VanEck在2013年开发了CitNetExplorer软件,集成了SLM社团划分算法用于引文网络的社团划分研
究[13] 。通过引文网络社团分析能够更准确地揭示科学结构和发展过程[40] ,例如,Wanjantuk[41] 等运用复杂网络随机游走方法,利用拓扑图结构的特征对引文网络进行社团结构分析;Kajikawa等[42] 利用FN算法研究引文网络社团随时间的演化情况来识别新兴研究方向;Ren等[43] 提出了一种适用于引文网络的高度聚类及包含三角结构的新社团划分算法;陈卫玲[44] 提出了引文语义链网络中基于语义相似度的社团划分算法;笔者也开展了综合考虑节点内容及结构属性的加权引文网络社团划分的尝试性研究,提出了一种基于样本加权的引文网络社团划分方法[45,46] 。引文网络社团研究不仅仅是引文网络研究领域的热点,也是科学计量学领域的研究热点之一,近年来研究工作不断增加[47] ,在领域的学科结构[41,48,49] 、追踪研究成果[42] 、发现科研范式[50] 等方面取得了大量研究成果。在科学家评价、科学思想传播和技术发展脉络研究等方面也日益引起重视[47] 。引文网络社团结构是科研范式的外在表现,基于网络类型的不同,引文网络社团结构的差异则可用于分析特定学科、特定国家以及特定机构的科研范式。引文网络的演化研究是引文网络分析的另一个重要方面,可用于分析知识扩散规律,挖掘知识流与主路径,揭示科学结构与探测学科交叉主题,在历史角度和宏观层面揭示或呈现科学或学科演化的特征与规律
等[38] 。例如,Batagel等[51] 在2003年提出了用于在引文网络中搜寻主路径的搜索路径数(search path count, SPC)算法[51] ,其核心思想是以引文网络中遍历权重最高的路径作为主路径,该算法成为当前开展主路径研究的最经典的算法之一。然而已有的引文网络经典主路径分析方法(如SPC)没有区分引文网络节点之间的差异,也没有考虑引用边可能代表不同的引用行为或引用目的。为此,Wei等[52] 基于SPC算法,利用元路径来描述和量化在基于文献关联属性的相关性,然后将这种相关性与原始链接的遍历权重进行整合,获得新的指数,通过在合成生物学领域的实证分析,证明了这种改良方法可以成为主要路径分析的有效补充。此外,论文和专利之间的引用关系,特别是论文被专利的引用近年来日益引起研究人员的关注,其基本的假设是专利对论文的引用隐含着科学向技术的转移,然而,对这种假设还缺乏广泛而深入的讨论和论证。现有研究大多数停留在计量和统计水平,而缺少在网络结构和演化动力学水平考察科学向技术的知识转移的研究,这将是社会网络分析在专利分析中的重要潜在应用领域之一。此外,高被引专利可以用来评价专利丛林,引文网络中关系强度较高的节点之间的技术相关强度高,通过分析不同专利权人在引用网络与合作网络中的关系,可以用于分析专利权人之间的竞争合作关系,甚至作为制定联合开展新技术研发计划的依据。
引文网络还可用于识别科学结构和学科范式。例如,Boyack
等[53] 基于论文的引用关系,构建了ISI-WoS数据库的212个学科间的引用关系,以可视化的形式呈现了科学的骨架结构。笔者也在2016年利用引用网络的社团结构来比较世界上有代表性的几家量子信息科研单元的科研范式,揭示了各科研单元的学科结构、发展脉络与知识传承问题[50] 。4 主题关联网络
共词网络分析是研究主题关联网络最简单、最常见的方法,通常利用文章关键词或摘要、标题中的词或短语的共现关
系[54] 而构造无向网络,利用共词网络可揭示学科领域的科学结构与演化趋势,揭示特定主题的热点研究方向和研究前沿等。例如,早在1991年,Callon等[55] 就指出共词分析是研究基础研究和技术研究之间相互作用的有用工具,他们以聚合物化学领域15年的数据为例,讨论了不同学科领域的研究进展及其相互作用模式、技术“生命周期”、研究轨迹、研究领域的相互作用动力学等问题;Ding等[56] 在2001年利用共词分析方法分析了1987—1997年信息检索领域的知识结构、研究模式和新趋势;Su等[57] 在2010年利用期刊论文关键词,创建了一个三维的“聚焦研究的并行网络”、一个“关键词共现网络”和一个二维的知识地图,从不同角度来分析技术预见领域的知识结构。最近,Ji等[58] 在2017年利用共词聚类分析来发现社会经济行为的新趋势,发现了影响其成功的因素,包括市场指导、持续创新和盈利能力;Wu等[59] 在2018年利用共词网络分析了与中国环境损失相关的化学事故的特点及成因问题,发现了化学事故的环境成本巨大;Zhao等[60] 在2018年利用定量和共词网络分析方法,揭示了脉络膜新生血管的主题趋势和知识结构,等等。此类共词网络的应用研究工作很多,也在揭示学科结构、热点、趋势等方面发挥了重要的作用。最近也有研究关注以共词网络为基础的对相关主题关联分析指标的拓展研究。例如,Feng等[61] 在2017年提出了一种基于语义距离对共词分析进行改进的方法,他们将语义距离与基于本体的概念映射生成的概念矩阵相结合,得到了更好的效果;Wang等[62] 在2018年基于关键词分析延伸出3类指标,包括基于某学科的平均唯一关键词数与平均关键词频率的比率所得出的指标K,在K核过滤之后主题之间的相关矩阵,利用指标I(节点中介中心性与其度数的比值)和C(簇系数)来预测潜在增长的关键词。基于主题或技术分类体系的主题关联网络研究,由于其采用被科学家广泛使用和认可的通用的分类标准体系,因而更具可比较性。特别是对专利而言,专利文献因具有系统的分类体系,如国际专利分类号(IPC)、美国专利分类号(USPC)、德温特专利分类号(DPC)等,成为开展专利技术主题关联分析的主要切入点。通过基于专利分类号的分布,可以计算不同经济体、不同地区和不同专利权人的技术相似度。例如,杨璧嘉
等[63] 在2008年通过基于专利的IPC计算专利之间的相关性,支撑技术路线图研究;笔者在博士论文中开展的专利权人主题关联网络研究中也通过基于IPC的相似性来研究专利权人之间的主题关联关系。基于语义相似度的主题关联研究是当前的热点,研究焦点在于不断丰富主题关联网络的链接基础,深入研究主题相似计算算法,如利用VSM模型、SAO模型和LDA主体模型等开展语义层面上的相似度计算。例如,Salton
等[64] 提出向量空间模型VSM来计算文献之间的本文相似度,Yoon等[65] 利用基于文本“主-谓-宾(SAO)”结构的专利语义分析来揭示特定领域专利之间的相似性,进而研究技术演化,Blei等[66] 在2003年提出的LDA(三层贝叶斯图文档生成模型,latent Dirichlet allocation)主题模型掀起了主题模型研究的热潮。主题模型的特点在于可快速发现文献的主题,包括主体聚类(如k-means)和概率模型(如LDA)两类。然而,传统的诸如LDA等主题模型因其基本原理是基于词共现频率、忽略了词之间的顺序以及语义关联而导致其在分析短文本时存在效力下降的不足。随着研究的深入,研究人员也开始尝试将不同主题关联方法整合在一起进行研究。例如,蔡永明等[67] 为了解决共词网络分析不能产生新主题的问题以及克服传统LDA模型的不足,他们将传统的LDA模型与共词网络整合在一起,提出了CA-LDA模型,提高了具有相同搭配关系词汇划分在同一主题下的概率,进而提高了短文本主题分析的效果。5 网络可视化
近年来,随着计算机技术的快速进步,越来越多的可视化算法和工具得以开发,为网络可视化分析提供了更多的手段和工具,大量静态和动态可视化的科学地图被展现出来。在引文网络可视化方面,最具代表性的研究方向是利用引文网络来分析科学结构。例如,Boyack
等[53] 在2005年把WoS数据库中的7121种期刊分成了212个簇,然后根据引用关系绘制了共引和互引二维地图,并采用互引地图对学科之间的链接关系进行了呈现,描绘了科学的骨架结构。2009年,他们又基于文章引用关系,对WoS数据库中14个与化学研究相关的学科的科学结构变化与知识交换进行了研究,发现了生物化学和生物工程稳步地进入化学领域、并对化学领域的知识基础产生影响的现象[68] 。除基于论文的分析外,专利引用网络可视化也为挖掘信息流的发展方向、发现核心专利、发明人或申请人等提供新的手段,例如,Gress[69] 通过分析美国专利引用网络随时间流的变化,探讨了信息流的发展方向。合作网络可视化的研究工作非常多,其中近年来最具代表性和有影响力的一项研究是美国印第安纳大学Börner团队制作的作者加权合作演化网络,该成果被Nature杂志引用报
道[70] 。需要指出的是,网络可视化并不能代替对研究对象的分析,可视化作图是对研究结果进行表达和呈现的手
段[71] 。可视化的科学地图在描述科学结构与技术结构、分析国家或区域竞争优势等方面发挥的作用越来越大,对提升学科情报研究以及科技咨询工作效率颇具益处。然而,经过十余年的发展,如果现在仍旧停留在欣赏精美科学地图的层面,那么很难真正发挥社会网络分析用于情报分析领域的价值。增加科学地图的可读性、可解释性即表达功能是在开展可视化研究中需要重视的问题。6 讨论与展望
通过近年来的发展,图书情报领域对社会网络分析方法的认知越来越深刻,社会网络分析方法在情报分析中的应用已经成为该方法的重要应用领域之一。同时,社会网络分析方法的应用极大地拓宽了情报分析工作的视角,为情报分析工作带来了新的思路和新的解决方案。基于本文的归纳和评述可见,未来社会网络分析在情报分析领域的应用至少在以下几方面还有很大的发展和探索的空间。
首先,社会网络分析为情报分析领域开展合作、引文、主题关联等相互关系提供了数学的和可视化的分析,然而,当前情报分析人员通常更注重可视化呈现,对数学分析这一核心功能的研究则相对较少。事实上,数学的分析是深度利用与提升社会网络分析方法功效的必要手段,用好社会网络分析所提供的数学分析功能,有助于提升学术团体和学科结构挖掘、主路径识别、科技评价、甚至技术预见的水平。
其次,当前多数研究工作关注的是截至某一时间节点的静态网络的结构特征,往往忽略了网络沿着时间轴演化过程中的变化情况。网络的演化过程蕴含着大量的、不断更新的信息。建议在未来研究中,应提高对演化现象的关注和探讨。例如,合作关系是存在产生和消失现象的,而当前的研究普遍重视合作关系的建立,却忽视了合作关系也是会消失的现实。当前的研究通常是利用逐年累积的数据来构建网络,合作关系只存在增强或不变的情况。如果不考虑网络随时间的累积效应,仅以特定时间段内(如逐年)的数据构建网络,那么网络演化的变化则更加多样,网络的结构和演化也将呈现出更丰富的特征,此时则可以分析合作网络的建立、解散或再合作的演化特征,网络社团结构的变化也会呈现出新的特征。
第三,重视改良和优化更符合情报分析需要的网络分析新方法。情报分析领域的研究对象(论文、专利等)与生物学、物理学等领域的研究对象不同,直接借用复杂网络领域的共性分析方法仅能揭示出情报分析领域研究对象的部分特征,还需要基于节点之间关系的影响因素或节点的不同属性来对链接进行赋权,进而优化和改良相关的网络分析算法。例如,虽然有些合作网络的研究考虑了基于合作论文数量权重,但并未考虑合作机构对论文贡献度的差异,也没有考虑单篇论文中合作机构数量对合作边权重的影响。这些问题都有深入研究探索的空间,实现对相应网络边进行加权来优化和改良。对引文网络研究也存在类似的问题,有必要考虑文本相似度、论文节点属性、引用动机等对引文网络社团结构的影响,开展加权的引文网络的社团划分,提高引文网络社团划分的精准性,更加真实地反映学科结构和演化脉络,这将对分析学科结构及其相关研究将具有十分重要的意义。
参考文献
- 1
林聚任. 社会网络分析: 理论、方法与应用[M]. 第1版. 北京: 北京师范大学出版社, 2009: 1-5.
- 2
李金华. 网络研究三部曲: 图论、社会网络分析与复杂网络理论[J]. 华南师范大学学报(社会科学版), 2009, 41(2): 136-138.
- 3
Otte E, Rousseau R. Social network analysis: a powerful strategy, also for the information sciences[J]. Journal of Information Science, 2002, 28(6): 441-453.
- 4
刘宏鲲, 张效莉, 曹崀, 等. 中国城市航空网络航线链接机制分析[J]. 中国科学G辑: 物理学 力学 天文学, 2009, 39(7): 935-942.
- 5
Colizza V, Flammini A, Serrano M A, et al. Detecting rich-club ordering in complex networks[J]. Nature Physics, 2006, 2(2): 110-115.
- 6
章忠志. 复杂网络的演化模型研究[D]. 大连: 大连理工大学, 2006: 2-5.
- 7
Borgatti S P, Mehra A, Brass D J, et al. Network Analysis in the Social Sciences[J]. Science, 2009, 323(5916): 892-895.
- 8
Lin Z Q, Hou S C, Wu J S. The correlation between editorial delay and the ratio of highly cited papers in Nature, Science and Physical Review Letters[J]. Scientometrics, 2016, 107(3): 1457-1464.
- 9
Shen Z S, Yang L Y, Wu J S. Lognormal distribution of citation counts is the reason for the relation between Impact Factors and Citation Success Index[J]. Journal of Informetrics, 2018, 12(1): 153-157.
- 10
Girvan M, Newman M E J. Community structure in social and biological networks[J]. Proceedings of the National Academy of Sciences of the United States of America, 2002, 99(12): 7821-7826.
- 11
Newman M E J. Fast algorithm for detecting community structure in networks[J]. Physical Review E, 2004, 69(6): 066133.
- 12
Blondel V D, Guillaume J L, Lambiotte R, et al. Fast unfolding of communities in large networks[J]. Journal of Statistical Mechanics: Theory and Experiment, 2008, 2008(10): P10008.
- 13
Waltman L, Van Eck N J. A smart local moving algorithm for large-scale modularity-based community detection[J]. European Physical Journal B, 2013, 86(11): 471.
- 14
Newman M E J, Girvan M. Finding and evaluating community structure in networks[J]. Physical Review E, 2004, 69(2): 026113.
- 15
Chen Y W, Börner K, Fang S. Evolving collaboration networks in Scientometrics in 1978–2010: a micro–macro analysis[J]. Scientometrics, 2013, 95(3): 1051-1070.
- 16
Khan G F, Park H W. The e-government research domain: A triple helix network analysis of collaboration at the regional, country, and institutional levels[J]. Government Information Quarterly, 2013, 30(2): 182-193.
- 17
Han P, Shi J, Li X Y, et al. International collaboration in LIS: global trends and networks at the country and institution level[J]. Scientometrics, 2014, 98(1): 53-72.
- 18
Frenken K, Hardeman S, Hoekman J. Spatial scientometrics: Towards a cumulative research program[J]. Journal of Informetrics, 2009, 3(3): 222-232.
- 19
Wu J. Geographical knowledge diffusion and spatial diversity citation rank[J]. Scientometrics, 2013, 94(1): 181-201.
- 20
Csomos G. A spatial scientometric analysis of the publication output of cities worldwide[J]. Journal of Informetrics, 2018, 12(2): 547-566.
- 21
Roesler C, Broekel T. The role of universities in a network of subsidized R&D collaboration: The case of the biotechnology-industry in Germany[J]. Review of Regional Research, 2017, 37(2): 135-160.
- 22
Luo Q, Xia J C, Haddow G, et al. Does distance hinder the collaboration between Australian universities in the humanities, arts and social sciences?[J]. Scientometrics, 2018, 115(2): 695-715.
- 23
陈云伟, 方曙. 专利权人关联网络的社会网络分析方法研究[J]. 图书情报知识, 2011(3): 58-66.
- 24
Chen Y W, Fang S. Mapping the evolving patterns of patent assignees’ collaboration networks and identifying the collaboration potential[J]. Scientometrics, 2014, 101(2): 1215-1231.
- 25
陈云伟, 邓勇, 陈方, 等. 引擎技术预见模型的构建及实证研究[J]. 图书情报工作, 2017, 61(13): 77-86.
- 26
Choe H, Lee D H. The structure and change of the research collaboration network in Korea (2000—2011): network analysis of joint patents[J]. Scientometrics, 2017, 111(2): 917-939.
- 27
Börner K, Dall’Asta L, Ke W M, et al. Studying the emerging global brain: Analyzing and visualizing the impact of co-authorship teams[J]. Complexity, 2005, 10(4): 57-67.
- 28
Palla G, Barabasi A L, Vicsek T. Quantifying social group evolution[J]. Nature, 2007, 446(7136): 664-667.
- 29
Guimera R, Uzzi B, Spiro J, et al. Team assembly mechanisms determine collaboration network structure and team performance[J]. Science, 2005, 308(5722): 697-702.
- 30
Lambiotte R, Panzarasa P. Communities, knowledge creation, and information diffusion[J]. Journal of Informetrics, 2009, 3(3): 180-190.
- 31
Moliner L A, Gallardo-Gallardo E, de Puelles P G. Understanding scientific communities: a social network approach to collaborations in Talent Management research[J]. Scientometrics, 2017, 113(3): 1439-1462.
- 32
Zheng J, Gong J Y, Li R, et al. Community evolution analysis based on co-author network: a case study of academic communities of the journal of “Annals of the Association of American Geographers”[J]. Scientometrics, 2017, 113(2): 845-865.
- 33
Mao J, Cao Y J, Lu K, et al. Topic scientific community in science: a combined perspective of scientific collaboration and topics[J]. Scientometrics, 2017, 112(2): 851-875.
- 34
陈云伟, 邓勇, 陈方, 等. 复合合作强度指数构建及应用研究[J]. 图书情报工作, 2015, 59(13): 96-103.
- 35
Abbasi A, Altmann J, Hossain L. Identifying the effects of co-authorship networks on the performance of scholars: A correlation and regression analysis of performance measures and social network analysis measures[J]. Journal of Informetrics, 2011, 5(4): 594-607.
- 36
Bettencourt L M A, Kaiser D I, Kaur J. Scientific discovery and topological transitions in collaboration networks[J]. Journal of Informetrics, 2009, 3(3): 210-221.
- 37
Bar-Ilan J. Informetrics at the beginning of the 21st century—A review[J]. Journal of Informetrics, 2008, 2(1): 1-52.
- 38
陈云伟. 引文网络演化研究进展分析[J]. 情报科学, 2016, 34(8): 171-176.
- 39
吴海峰, 孙一鸣. 引文网络的研究现状及其发展综述[J]. 计算机应用与软件, 2012, 29(2): 164-168.
- 40
邱均平, 董克. 引文网络中文献深度聚合方法与实证研究——以WOS数据库中XML研究论文为例[J]. 中国图书馆学报, 2013, 39(2): 111-120.
- 41
Wanjantuk P, Keane J A. Finding related documents via communities in the citation graph[C]// Proceedings of the International Symposium on Communications and Information Technology. IEEE, 2004: 445-450.
- 42
Kajikawa Y, Yoshikawa J, Takeda Y, et al. Tracking emerging technologies in energy research: Toward a roadmap for sustainable energy[J]. Technological Forecasting and Social Change, 2008, 75(6): 771-782.
- 43
Ren F X, Shen H W, Cheng X Q. Modeling the clustering in citation networks[J]. Physica A: Statistical Mechanics and Its Applications, 2012, 391(12): 3533-3539.
- 44
Chen W L, Fengxia Y X, Wang G. Community discovery algorithm of citation semantic link network[C]// Proceedings of the 2013 Sixth International Symposium on Computational Intelligence and Design. Washington, DC: IEEE Computer Society, 2013: 289-292.
- 45
肖雪, 陈云伟, 邓勇. 基于节点内容及拓扑结构的引文网络社团划分[J]. 图书情报知识, 2017(1): 89-97.
- 46
肖雪, 王钊伟, 陈云伟, 等. 基于样本加权的引文网络的社团划分[J]. 图书情报工作, 2016, 60(20): 86-93.
- 47
尹丽春, 刘泽渊. 《科学计量学》引文网络的演化研究[J]. 中国科技期刊研究, 2006, 17(5): 718-722.
- 48
Chen P, Redner S. Community structure of the physical review citation network[J]. Journal of Informetrics, 2010, 4(3): 278-290.
- 49
Börner K, Klavans R, Patek M, et al. Design and update of a classification system: The UCSD map of science[J]. PLoS ONE, 2012, 7(7): e39464.
- 50
陈云伟, 许轶, 王立娜, 等. 基于网络结构的科研单元的科研范式研究[J]. 图书情报知识, 2016(5): 53-61.
- 51
Batagelj V. Efficient algorithms for citation network analysis[EB/OL]. [2015-12-18]. http://www.researchgate.net/publication/1956732.
- 52
Wei L, Liu C J, Xu H Y, et al. Main path identification involving article’s associated attribute: A case study of synthetic biology[C]// Proceedings of the 16th International Conference on Scientometrics and Informetrics, Wuhan, 2017: 599-610.
- 53
Boyack K W, Klavans R, Börner K. Mapping the backbone of science[J]. Scientometrics, 2005, 64(3): 351-374.
- 54
He Q. Knowledge discovery through co-word analysis[J]. Library Trends, 1999, 48(1): 133-159.
- 55
Callon M, Courtial J P, Laville F. Co-word analysis as a tool for describing the network of interactions between basic and technological research: The case of polymer chemistry[J]. Scientometrics, 1991, 22(1): 155-205.
- 56
Ding Y, Chowdhury G G, Foo S. Bibliometric cartography of information retrieval research by using co-word analysis[J]. Information Processing & Management, 2001, 37(6): 817-842.
- 57
Su H N, Lee P C. Mapping knowledge structure by keyword co-occurrence: a first look at journal papers in technology foresight[J]. Scientometrics, 2010, 85(1): 65-79.
- 58
Ji Y J, Jiang Y, He L. An evaluation method based on co-word clustering analysis – Case study of Internet + Innovation and entrepreneurship economy[C]// Proceedings of the International Conference on Geo-Spatial Knowledge and Intelligence. Singapore: Springer,.2018, 849: 585-595.
- 59
Wu D S, Song Y, Xie K F, et al. Traits and causes of environmental loss-related chemical accidents in China based on co-word analysis[J]. Environmental Science and Pollution Research, 2018, 25(18): 18189-18199.
- 60
Zhao F K, Shi B, Liu R X, et al. Theme trends and knowledge structure on choroidal neovascularization: a quantitative and co-word analysis[J]. BMC Ophthalmology, 2018, 18: 86.
- 61
Feng J, Zhang Y Q, Zhang H. Improving the co-word analysis method based on semantic distance[J]. Scientometrics, 2017, 111(3): 1521-1531
- 62
Wang M Y, Chai L H. Three new bibliometric indicators/approaches derived from keyword analysis[J]. Scientometrics, 2018, 116(2): 721-750.
- 63
杨璧嘉, 张旭. 专利网络分析在技术路线图中的应用[J]. 现代图书情报技术, 2008(5): 61-66.
- 64
Salton G, Wong A, Yang C S. A vector space model for automatic indexing[J]. Communication of ACM, 1975, 18(11): 613-620.
- 65
Yoon J, Kim K. Identifying rapidly evolving technological trends for R&D planning using SAO-based semantic patent networks[J]. Scientometrics, 2011, 88(1): 213-228.
- 66
Rosen-Zvi M, Griffiths T, Steyvers M, et al. The author-topic model for authors and documents[C]// Proceedings of the 20th Conference on Uncertainty in Artificial Intelligence. Arlington: AUAI Press, 2004: 487-494.
- 67
蔡永明, 长青. 共词网络LDA模型的中文短文本主题分析[J]. 情报学报, 2018, 37(3): 305-317.
- 68
Boyack K W, Börner K, Klavans R. Mapping the structure and evolution of chemistry chemistry research[J]. Scientometrics, 2009, 79(1): 45-60.
- 69
Gress B. Properties of the USPTO patent citation network 1963-2002[J]. World Patent Information, 2010, 32(1): 3-21.
- 70
Whitfield J. Group theory[J]. Nature, 2008, 455(7214): 720-723.
- 71
Börner K, Boyack K. Mapping interdisciplinary research (sidebar, systems science section)[M]. New York: Oxford University Press, 2010: 457-460.
- 1
摘要
从合作网络、引文网络、主题关联网络三个角度出发,对社会网络分析方法在情报分析中的应用研究进展进行梳理,侧重对经典概念、方法和算法进行梳理,对新概念、新思路、新指标、新算法等进行分析与总结,并对其功能与应用前景进行讨论。
Abstract
The purpose of this paper was to conclude the development of social network analysis (SNA) using intelligence analysis through the following three aspects: collaboration network, citation network, and topic-associated network. This paper emphasizes combining classic concepts, methods, and algorithms, as well as introducing new concepts, ideas, indicators, and algorithms. Finally, this paper discusses the functions and prospects of SNA.
社会网络分析(social network analysis,SNA)是对社会关系结构及其属性加以分析的一套规范和方法,它主要分析的是不同社会单元所构成的关系的结构及其属
2002年,Otte和Rousseau发表了一篇名为“Social network analysis: a powerful strategy, also for the information sciences”的论