en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
参考文献 1
王伟, 靖继鹏. 公共危机信息传播的社会网络机制研究[J]. 情报科学, 2007, 25(7): 979-982.
参考文献 2
曹学艳, 段飞飞, 方宽, 等. 网络论坛视角下突发事件舆情的关键节点识别及分类研究[J]. 图书情报工作, 2014, 58(4): 65-70.
参考文献 3
武澎, 王恒山, 李煜. 突发事件信息传播超网络中枢纽节点的判定研究[J]. 管理评论, 2013, 25(6): 104-111.
参考文献 4
刘志明, 刘鲁. 微博网络舆情中的意见领袖识别及分析[J]. 系统工程, 2011, 29(6): 8-16.
参考文献 5
戴丽娜. 微博舆论领袖的识别方法与管理策略研究[J]. 新闻记者, 2012(9): 26-29.
参考文献 6
ChaM, HaddadiH, BenevenutoF, et al. Measuring User Influence in Twitter: The Million Follower Fallacy[C]// Proceedings of the 4th International AAAI Conference on Weblogs and Social Media, Washington DC, 2010: 10-17.
参考文献 7
DingZ Y, JiaY, ZhouB, et al. Measuring the spreadability of users in microblogs[J]. Journal of Zhejiang University -Science C, 2013, 14(9): 701-710.
参考文献 8
贾亚敏, 安璐, 李纲. 城市突发事件网络信息传播时序变化规律研究[J]. 情报杂志, 2015, 34(4): 91-96.
参考文献 9
LiL F, ZhangQ P, TianJ, et al. Characterizing information propagation patterns in emergencies: A case study with Yiliang Earthquake[J]. International Journal of Information Management, 2018, 38(1): 34-41.
参考文献 10
谭雪晗, 涂艳, 马哲坤. 基于SNA的事故灾难舆情关键用户识别及治理[J]. 情报学报, 2017, 36(3): 297-306.
参考文献 11
SimonT, GoldbergA, AdiniB. Socializing in emergencies-A review of the use of social media in emergency situations[J]. International Journal of Information Management, 2015, 35(5): 609-619.
参考文献 12
OhO, KwonK K H K, RaoH R. An exploration of social media in extreme events: rumor theory and twitter during the Haiti earthquake[C]// Proceedings of the International Conference on Information Systems, Saint Louis, Missouri, USA, 2010: 1-13.
参考文献 13
AlbertR, JeongH, BarabasiA L. Error and attack tolerance of complex networks[J]. Nature, 2000, 406(6794): 378-382.
参考文献 14
ChenD B, LüL Y,ShangM S, et al. Identifying influential nodes in complex networks[J]. Physica A , 2012, 391(4): 1777-1787.
参考文献 15
任卓明, 邵凤, 刘建国, 等. 基于度与集聚系数的网络节点重要性度量方法研究[J]. 物理学报, 2013, 62(12): 522-526.
参考文献 16
BonacichP. Factoring and weighting approaches to status scores and clique identification[J]. Journal of mathematical sociology, 1972, 2(1): 113-120.
参考文献 17
FreemanL C. Centrality in social networks conceptual clarification[J]. Social networks, 1978, 1(3): 215-239.
参考文献 18
FreemanL C. A set of measures of centrality based on betweenness[J]. Sociometry, 1977, 40(1): 35-41.
参考文献 19
PoulinR, BoilyM C, MâsseB R. Dynamical systems to define centrality in social networks[J]. Social Networks, 2000, 22(3): 187-220.
参考文献 20
CominC H, CostaL F. Identifying the starting point of a spreading process in complex networks[J]. Physical Review E, 2011, 84(5): 1-6.
参考文献 21
KitsakM, GallosL K, HavlinS S, et al. Identification of influential spreaders in complex networks[J]. Nature Physics, 2010, 6(11): 888-893.
参考文献 22
ZengA, ZhangC J. Ranking spreaders by decomposing complex networks[J]. Physics Letters A, 2013, 377(14): 1031-1035.
参考文献 23
HouB N, YaoY P, LiaoD S. Identifying all-around nodes for spreading dynamics in complex networks[J]. Physica A, 2012, 391(15): 4012-4017.
参考文献 24
WengJ S, LimE P, JiangJ, et al. TwitterRank: finding topic-sensitive influential twitters[C]// Proceedings of the 3rd ACM International Conference on Web Search and Data Mining. New York: ACM Press, 2010: 261-270.
参考文献 25
ZhangJ, AckermanM S, AdamicL. Expertise networks in online communities: structure and algorithms[C]// Proceedings of the 16th International Conference on World Wide Web, Banff, Alberta, Canada, 2007: 221-230.
参考文献 26
LiQ, ZhouT, LüL Y, et al. Identifying influential spreaders by weighted LeaderRank[J]. Physica A, 2013, 404(24): 47-55.
参考文献 27
TyshchukY, WallaceW A. Actionable Information during Extreme Events[C]// Proceedings of the 2012 ASE/IEEE International Conference on Privacy, Security, Risk and Trust and 2012 International Confernece on Social Computing. Amsterdam, Netherlands, 2012: 338-347.
参考文献 28
YaoC Y, HeG M. Key nodes analysis of microblogging public opinion spread about public emergencies[C]// Proceedings of the International Conference on Modeling, Simulation and Applied Mathematics. Thailand: Atlantis Press, 2015: 264-268.
参考文献 29
FinkS. Crisis management: Planning for the inevitable[M]. New York: American Management Association, 1986: 5-6.
参考文献 30
ZhangZ K, LiuC, ZhanX X, et al. Dynamics of information diffusion and its applications on complex networks[J]. Physics Reports, 2016, 651: 1-34.
参考文献 31
YangJ, CountsS. Predicting the speed, scale, and range of information diffusion in Twitter[C]// Proceedings of 4th International AAAI Conference on Weblogs and Social Media, Washington DC, 2010: 355-358.
参考文献 32
RiquelmeF, González-CantergianiP. Measuring user influence on Twitter: A survey[J]. Information Processing & Management, 2016, 52(5): 949-975.
参考文献 33
张鹏威, 刘红丽, 俞丽娟, 等. 微博信息传播中的用户影响力研究综述[J]. 情报科学, 2016, 34(8): 160-164.
参考文献 34
MeiY, ZhongY L, YangJ. Finding and analyzing principal features for measuring user influence on Twitter[C]// Proceedings of the 2015 IEEE First International Conference on Big Data Computing Service and Applications. San Francisco, CA, USA, 2015: 478-486.
参考文献 35
LeavittA, BurchardE, FisherD, et al. The influentials: New approaches for analyzing influence on Twitter[J]. Web Ecology, 2009, 4(2): 1-18.
参考文献 36
BrinS, PageL. The anatomy of a large-scale hypertextual web search engine[J]. Computer Networks and ISDN Systems, 1998, 30(1): 107-117.
参考文献 37
HuangJ M, LiC, WangW Q, et al. Temporal scaling in information propagation[J]. Scientific Reports, 2014, 4: 1-6.
参考文献 38
YangJ, LeskovecJ. Modeling information diffusion in implicit networks[C]// Proceedings of the 2010 IEEE 10th International Conference on Data Mining. Sydney, NSW, Australia, 2010: 599-608.
参考文献 39
PhillipsM E. Hurricane harvey Twitter dataset[EB/OL]. [2017-11-22]. https://digital.library.unt.edu/ark:/67531/metadc993940/.
参考文献 40
方滨兴, 许进, 李建华, 等. 在线社交网络分析[M]. 北京: 电子工业出版社, 2014: 24-26.
参考文献 41
王晨旭, 晓宏, 秦涛, 等. 微博消息传播中意见领袖影响力建模研究[J]. 软件学报, 2015, 26(6): 1473-1485.
参考文献 42
姜启源, 谢金星, 叶俊. 数学模型[M]. 第3版. 北京: 高等教育出版社, 2003: 138-140.
参考文献 43
张玥, 孙霄凌, 浦正宁, 等. 微博舆情传播影响因素研究——基于信源特征和信息形式的视角[J]. 情报资料工作, 2014(3): 59-64.
参考文献 44
江燕青, 许鑫. 半衰期视角的微博信息老化研究——以高校官方微博为例[J]. 图书情报知识, 2016(2): 92-100.
参考文献 45
LermanK, GhoshR. Information contagion: an empirical study of the spread of news on digg and Twitter social networks[C]// Proceedings of 4th International AAAI Conference on Weblogs and Social Media. Washington DC: AAAI, 2010: 166-176.
目录 contents

    摘要

    为有效识别突发事件信息传播在不同阶段中的关键节点及其演化特征,本文结合危机传播的生命周期,提出一种考虑用户行为特征、网络全局信息以及影响力衰退机制的关键节点动态识别方法。以“哈维”飓风事件为案例进行研究,利用Spearman相关分析和SIR传播模型检验了方法的合理性,并在不同演化阶段关键节点特征对比分析的基础上,提出针对不同阶段突发事件信息传播的舆情治理策略。实验结果表明:与PageRank方法相比,该方法识别出的关键节点在传播速度和传播范围方面表现出一定的优势;随着信息传播不同阶段的演化,关键节点的认证率呈现上升趋势,信息优势表现为先下降后上升,响应优势呈现出相反趋势,而结构优势差异并不显著;在突发事件舆情治理方面,可重点识别潜伏期中高原创、高信息优势和非认证的关键节点,注意搜集爆发期中普通型关键节点掌握的信息,强化蔓延期中各类型关键节点之间的协同,留意消散期中小范围群体的聚集现象。

    Abstract

    In order to effectively identify the key nodes in information propagation networks during emergencies and their dynamic characteristics during different stages of an emergency, this paper proposes a method that introduces crisis lifecycle theory and considers characteristics of user behaviors and global network attributes in the information propagation of social networks, as well as the decay law of spreading influence. Hurricane Harvey was chosen as a study case to conduct the experiment. Spearman s correlation analysis and the SIR model were used to verify the effectiveness of this method. The results show that the TPR method is somewhat better than PageRank in terms of spreading speed and spreading scope. With the evolution of different stages of information propagation, the verification rate of key nodes increases. Therefore, the information advantage decreases at first, then increases after the chronic period, while the response advantage shows an opposite trend. There are no significant differences in the aspect of structural advantage. The results shed light on the management of public opinion: administrators should a) focus on the key nodes in the prodromal period that are non-verified and outstanding in terms of originality and information advantage; b) pay more attention to information provided by key nodes that are common netizens in the breakout period; c) strengthen the coordination among different types of key nodes in the chronic period; and d) keep an eye on small-scale clusters during the recovery period.

  • 1 引 言

    1

    信息社会的动态复杂环境给突发事件管理各级组织提出了新挑战,尤其是微博、微信等社交媒体的出现和普及,不仅使得突发事件信息能够在较短时间内实现大范围传播,也打破了传统环境下以政府为主体的“单级”信息传播控制模式。如何在交互式参与的多极化、动态化信息传播模式下密切跟踪互联网、微博、微信等渠道的舆情动态,快速收集、评估影响、精准研判、及时回应,是突发事件信息管理的理论研究热点和实践难题。在突发事件信息的传播与交流中,处于中心地位的成员将原本相互间并无关联的组织或个人联系起来,形成具有特殊拓扑性质的网络结[1],这些中心成员在信息传播网络中也称为关键节点。根据信息传播的二八定律,突发事件的信息传播主要由关键节点和敏感人群推[2]。对突发事件舆情动态进行监测、预警和控制的一个关键环节即是较为全面、合理地判定信息传播中的关键节[3]

    本文将关键节点定义为:在事件相关信息传播中,具备突出的局部传播影响力或全局传播影响力的网络用户。局部传播影响力可以体现为网络用户的局部属性,如节点度、粉丝数、微博数、转发数、提及数等,全局传播影响力可以借助基于节点全局属性的方法如介数中心性、紧密中心性、PageRank算法等进行度量。与现有研究中普遍关注的关键节点(如意见领[4]、舆论领[5]等)有所不同,本文所要识别的关键节点并不一定具备粉丝量大、发言数多或影响持续时间长等特征。相关研究表明,一个拥有众多粉丝或积极发表言论的用户却不一定在微博网络中具有很高的传播能[6,7]。此外,从图1可以看出,“哈维”飓风事件中某微博用户的被转发数在短时期内经历了迅猛增长随后快速衰退的过程,说明有些网络用户只在某时间段具有较高影响力。这类某个时间阶段的关键节点在现有的关键节点识别研究中往往容易被忽视,但突发事件信息预警、舆情引导等工作往往需要根据突发事件信息传播的阶段性特征采取有针对性的应对措[8],因而动态识别各时间阶段的关键节点很有必要。

    图1
                            “哈维”飓风事件中某用户的被转发频次时序变化

    图1 “哈维”飓风事件中某用户的被转发频次时序变化

    突发事件的网络信息传播通过网络广播、网络电视、网络新闻、博客、微博、即时通信等多种方式进行,其传播系统由大量相互作用、类型不同的网络构成,因而很难找到一致可行的方式去描述其中的信息传播过程。与其他几种网络信息传播方式相比,微博传播具有传播范围广、交互作用强、传播速度快、传播路径可描述等特点,因而现有许多关于网络信息传播的研[9,10]都是围绕微博网络展开,并且微博被认为是研究突发事件的重要平[11,12],因此本文选取微博网络作为研究突发事件信息传播网络关键节点识别的情境。

  • 2 信息传播关键节点识别研究现状

    2
  • 2.1 信息传播网络关键节点识别方法研究

    2.1

    最早利用网络拓扑结构研究信息传播关键节点的是社会学领域的学者,随后,其他领域的学者也进行了研究和改进,产生了诸多研究成果,主要集中在以下几个方面:

    (1)基于网络局部属性的关键节点识别方法,主要考虑节点及其邻居节点的属性,例如,考虑多级邻居节点信[13],综合考虑邻居节点个数以及其邻居之间的联系紧密程[14,15]等。这类识别方法具有计算简单、时间复杂度低等优点,不足之处在于忽略了邻居节点间的某些拓扑关系,也没有考虑节点在网络中的位置。

    (2)基于网络全局属性的关键节点识别方法,考虑全局信息的节点重要性评价指标包括特征向量中心性(eigenvector centrality[16]、邻近中心性(clo-seness centrality[17]、介数中心性(betweenness cen-trality[18]等。Poulin[19]在求解特征向量映射迭代方法的基础上提出累积提名的方法来评价节点的重要性程度;Comin[20]基于介数与度数的关系提出一种节点重要性排序指标。该类方法识别出的关键节点对网络的鲁棒性作用显著,但是因为计算复杂度高,因此不适用于大型社会化网络。

    (3)基于网络位置属性的关键节点识别方法。Kitsak[21]认为节点的位置信息比其邻居节点信息更能反映节点的重要性程度,并提出K-核分解方法计算节点的Ks值来评价节点的重要性程度。Zeng[22]考虑节点的Ks值和经过K-核分解后被移除的节点的信息,提出混合度分解方法。Hou[23]综合考虑度、介数、K-核三种不同的指标对节点的重要性进行评价。这类方法时间复杂度低,且比度数、介数等更能刻画节点的传播能力。然而不能回避的一点是该方法不适合多传播源的情形。

    (4)基于随机游走的关键节点识别方法,这类方法借用了基于网页之间链接关系的网页排序技术,如基于PageRank算法的微博网络关键节点识[24]、基于HITS算法的权威用户识[25]、基于加权LeaderRank算法的影响力传播者识[26]。这类方法从网络的拓扑结构出发,考虑了邻居节点的重要性影响,且算法复杂度较低,能较为有效地衡量节点重要性。但这类方法也存在不足之处,即较为理想化,而忽略了实际网络传播中的一些影响因素,如用户之间的交互情况。

  • 2.2 突发事件信息传播中的关键节点识别研究

    2.2

    在突发事件信息传播关键节点识别方面,Tysh-chuk[27]基于出度、中介中心性和密度中心性识别突发事件预警类信息传播中的关键节点。Yao[28]通过度分析法、K-核分析法和核心-边缘分析法识别和分析公共突发事件舆情传播中关键节点。曹学艳[2]基于LeaderRank方法识别“网络名人型”和“事件关注型”两类突发事件信息传播关键节点。谭雪晗[10]基于节点的入度、出度和接近中心性将突发事件信息传播网络中的关键节点分为关键信息发布者和关键事件关注者。武澎[3]基于突发事件信息传播超网络、接近中心性方法和超级节点思想对突发事件信息传播系统中的枢纽节点进行判定。总的来说,以上研究均属于静态分析,而探讨关键节点在突发事件信息传播过程中如何动态产生影响的研究还鲜有所见。

    综合以上分析,信息传播网络中的关键节点识别还存在以下问题:①现有关键节点识别方法多考虑邻居结构、网络结构或网络位置,却忽略了实际社交网络中,用户之间的信息传播活动不仅与网络结构有关,还与个体用户行为有关;②有关突发事件信息传播关键节点识别的研究还只关注静态的分析,并未考虑实际社交网络中用户影响力随时间的动态变化。基于此,本文从危机生命周期视角入手,提出一种综合考虑用户行为特征、网络全局信息和影响力衰退机制的阶段关键节点动态识别方法,并对“哈维”飓风事件在推特中的信息传播进行案例分析,验证方法的合理性和有效性,并揭示关键节点在突发事件网络信息传播生命周期中的动态特征。

  • 3 关键节点动态识别框架

    3

    本文识别突发事件信息传播各阶段关键节点的整体框架参见图2。具体步骤如下:首先,对突发事件信息传播过程按时间进行阶段划分,并构建各阶段传播网络G1、G2、G3、G4;第二步,根据用户在各阶段传播网络中的结构优势、信息优势和响应优势分别计算用户在各阶段的局部影响力L1L2L3L4;第三步,通过动态设置PageRank算法的初始影响力值和转移概率,分别计算各阶段的信息传播全局影响力WPR1、WPR2、WPR3、WPR4;第四步,综合考虑用户在第k阶段的全局影响力和第k-1阶段的影响力剩余值,依次计算阶段传播影响力TPR1、TPR2、TPR3、TPR4;最后,根据阶段传播影响力值对用户进行排序,识别出各阶段的关键节点。

    图2
                            关键节点动态识别框架

    图2 关键节点动态识别框架

    为实现根据突发事件信息传播不同阶段的特点制定针对性强、可行性高的应急处置方案,本文借鉴史蒂文·芬克提出的危机传播生命周期划分方[29],并考虑新媒体环境下突发事件信息传播特[8],将突发事件网络信息传播生命周期划分为潜伏期、爆发期、蔓延期和消散期四个阶段:

    (1)潜伏期。该阶段的信息传播较为缓慢,相关信息数量较少,表现为一段斜率较为平坦的上升曲线,到增长曲线变得异常陡峭前截止。

    (2)爆发期。该阶段的公众关注度急剧上升,表现为一段急剧上升后并在高点持续波动的曲线,到曲线下降前截止。

    (3)蔓延期。该阶段是公众关注度强烈震荡的时期,表现为一段震荡下行的曲线。

    (4)消散期。该阶段仅有部分人群仍在关注,相关信息数量起伏较小,最终将维持在一个相对较低的水平,且几乎没有太大波动。

    微博用户之间的信息转发功能可清晰描述信息从一个用户流向另一个用户的传播过程,社会网络研究普遍认为这种关系是一种反映微博信息传播的可行方[30,31]。基于此,本文将在实证分析部分利用微博转发关系并依据危机传播生命周期构建突发事件信息传播阶段网络:潜伏期网络(G1)、爆发期网络(G2)、蔓延期网络(G3)和消散期网络(G4)。网络中的节点V代表唯一的用户ID,网络中的有向边E表示用户之间的转发关系:从转发用户指向被转发用户。

  • 4 信息传播影响力测度方法

    4

    节点影响力的测度是关键节点识别研究的定量化分析,如何计算网络中节点的信息传播影响力是关键节点识别的重点和难[32],本文将在这一节进行具体阐述。

  • 4.1 信息传播局部影响力度量

    4.1

    度量节点局部影响力的直接指标(指可以从微博数据中直接获取的指标)主要包括粉丝数、好友数、微博数、转发数、提及数等。随着研究的深入,许多学者发现直接指标存在过于数据化、代表意义不明确等弊[33],难以准确描述用户影响力,因此更多的间接指标被提出来反映用户影响力。间接指标是指通过直接指标或其他间接指标运算得到的指[33]。已有研究表明,间接指标的实际意义往往更加明确,其对用户影响力的衡量也更为准[33]。基于此,本文采用结构优势、信息优势和响应优势三个描述用户行为的间接指标来衡量用户在某特定主题上的信息传播局部影响力。需要注意的是,在分阶段计算局部影响力时,这些指标都需要根据当前阶段的实时情况进行统计和计算。

  • 1) 结构优势

    1)

    粉丝数与好友数的比值被认为是衡量用户影响力的一个有效指[34]。本文在此基础上提出结构优势指标(用S表示)来反映用户传播和接收信息的趋势。计算公式为

    S = F R F R + F G
    (1)

    式中,FR表示粉丝数,FG表示好友数。当S值大于0.5时,说明该用户传播信息的可能性大于其接收信息的可能性。由于粉丝数和好友数是实时变化的,计算时取用户在当前阶段的最大粉丝数和最大好友数。

  • 2) 信息优势

    2)

    新发布的微博数也是衡量用户影响力的有效指[34]。本文在此基础上提出信息优势指标(用T表示)来反映用户在某时段关于特定主题的信息贡献。计算公式为

    T = P T A T
    (2)

    式中,PT表示用户在某时段关于特定主题的新发博数,AT表示所有用户在该时段关于特定主题的发博总数。T值越大,说明该用户在该时期有关特定主题的信息贡献度越高,反映出其所拥有的相关信息资源越丰富。

  • 3) 响应优势

    3)

    已有研究表明微博用户影响力与被提及和被转发频次有很强的相关[6]。本文通过响应优势(用R表示)综合这两个直接指标来衡量用户影响力,计算方式如公式(3)所示。该指标由Leavitt[35]提出,它比直接用被提及频次和被转发频次更能区分用户的传播影响力。举例来说,当用户A和用户B都获得相同的提及和转发次数,而用户A比用户B发了更多的微博,这说明用户B能够通过更少的努力获得和用户A一样的用户响应。

    R = R T + M T P T
    (3)

    式中,RT和MT分别表示用户在某时段获得的新转发数和新提及数,PT表示该用户在某时段关于特定主题的新发博数。

  • 4) 局部影响力

    4)

    综合以上指标,用户 i 的信息传播局部影响力计算公式为

    L i = S i - S m i n S m a x - S m i n + T i - T m i n T m a x - T m i n + R i - R m i n R m a x - R m i n
    (4)

    式中,对 S i T i R i 进行了最小-最大规范化处理,这有助于防止具有较大初始值域的指标(如响应优势)比具有较小初始值域的指标(如信息优势)的权重过大, L i 表示用户 i 的信息传播局部影响力, S i T i R i 分别表示用户 i 的结构优势、信息优势和响应优势, S m a x / S m i n T m a x / T m i n R m a x / R m i n 分别表示所有用户中的结构优势、信息优势和响应优势的最大值/最小值。

    为方便后面的PageRank计算,对所有节点局部影响力进行归一化处理,让所有节点的局部影响力之和为1:

    L i ' = L i k = 1 N L k
    (5)

    式中, L i ' 表示归一化后节点i的局部影响力, N 表示网络中的节点总数。

  • 4.2 信息传播全局影响力度量

    4.2

    PageRank算法是一个适合大规模网络全局排序的方[36],不仅考虑了直接相邻的节点,还考虑了间接相邻的节点,能够反映节点全局属性,但PageRank算法没有考虑网络中节点的自身属性和节点之间的交互特征,因此本文基于PageRank算法计算信息传播全局影响力(用 W P R 表示)并做如下改进:①利用4.1节中的信息传播局部影响力计算方法设置各节点的WPR初始值;②根据特定节点之间的转发情况设置转移概率 x i j 。信息传播全局影响力计算如下:

    W P R i = 1 - d N + d j M i ( W P R j × x i j )
    (6)

    式中, i 表示转发网络中的用户, i [ 1 , N ] W P R i 表示节点 i 的WPR值, N 是转发网络中的用户总数,d是随机因子, M ( i ) 为转发用户i的微博的用户集合。 x i j 为用户 j 转发用户 i 的微博的概率,即转移概率:

    x i j = i j j
    (7)
  • 4.3 信息传播阶段影响力度量

    4.3

    社交网络中用户之间的影响力并非静止不变,而是随着时间的推移发生衰[37,38]。本文提出Tem-poral PageRank(TPR)方法,在计算阶段传播影响力时将时间因素纳入考虑,并为了简化计算,提出假设:用户在第 k 阶段的传播影响力仅与其在第 k - 1 阶段的传播影响力以及其在第 k 阶段的信息传播行为带来的新影响力有关。阶段传播影响力的计算公式为

    T P R i k = T P R i k - 1 × α ( t i ) + W P R i k
    (8)
    t i = t k - t i k - 1
    (9)

    式中, T P R i k 表示用户 i 在第 k 阶段的信息传播影响力, T P R i k - 1 表示用户 i 在第 k - 1 阶段的信息传播影响力, α ( t i ) 表示用户的传播影响力随时间间隔 t i 衰退的速率函数,需要根据具体案例确定其模型方程, t i 为用户 i 在第 k - 1 阶段的最后一次发博时间 t i k - 1 与第 k 阶段末端 t k 的时间间隔(天),如公式(9)所示, W P R i k 为用户 i 在第 k 阶段的信息传播全局影响力。

  • 5 实证分析——以2017年“哈维”飓风信息传播为例

    5
  • 5.1 “哈维”飓风数据处理及传播阶段划分

    5.1

    本研究以2017年美国“哈维(Harvey)”飓风自然灾害事件(形成于2017年8月17日,8月25日登陆美国德克萨斯州沿岸,9月2日消散)为分析案例。数据来源于北德克萨斯州大学提供的“哈维”飓风Twitter数据[39],微博发布时间跨度为2017年8月18日至2017年9月22日,这也是数据采集时间,共7041866条微博数据,包括微博文本、作者信息、转发数据、提及数据等。

    根据3.1节中提出的生命周期划分方法并结合“哈维”飓风微博每日增长情况(图3)构建各阶段传播网络,为避免排序结果不唯一的问题,网络中去除了孤立节点(即没有交互行为的用户)和自循环边(即自我转发的关系)。四个阶段传播网络的基本属性如表1所示。其中,平均度是一个刻画网络稀疏性的指标,反映信息的扩散速度;聚类系数是一个衡量网络聚集程度的指标,表明网络成员之间的整体凝聚性强[40]。从表1可以看出,随着时间的演化,传播网络的平均度经历了一个先增长后衰退的过程,而传播网络的聚集系数则呈现相反趋势,这说明,在“哈维”飓风信息传播生命周期中,大众关于“哈维”飓风事件的信息传播热度在潜伏期和爆发期里随着时间的推移逐渐增长。爆发期过后,虽然大众关于“哈维”飓风事件的信息传播热度逐渐下降,但仍存在较多小范围聚集讨论该事件的群体。

    图3
                            “哈维”飓风微博每日增长数量曲线

    图3 “哈维”飓风微博每日增长数量曲线

    表1 四个传播网络的基本属性

    网络阶段时间节点数连边数平均度聚集系数
    G1潜伏期2017.8.18—8.2424593370983.0169560.0023505630
    G2爆发期2017.8.25—8.2889162920615974.6243380.0002672148
    G3蔓延期2017.8.29—8.31101682518573033.6531420.0000704059
    G4消散期2017.9.01—9.2269091012517723.6235460.0003219725
    表1
                    四个传播网络的基本属性
  • 5.2 传播影响力衰退函数拟合分析

    5.2

    微博分享是微博平台中信息传播的主要形式,微博被转发频次的演化能在一定程度上反映该微博及其作者的传播影响力随时间的演化规律,在对影响力时序演化的研究中已有学者利用被转发频次进行分[41]。本文抽取“哈维”飓风事件中被转发频次较多的50条微博数据,对它们的被转发频率 y (次)与时间跨度 t (距离该微博第一次发布的时间,单位:天)进行统计和模型拟合,确定“哈维”飓风事件中的传播影响力衰退函数。拟合结果显示可决系数R2=0.695,说明模型拟合结果可以接受,拟合曲线如图4所示。可以看出,被转发频率 α 随着时间跨度 t 的延长呈负指数下降,因而得到传播影响力衰退函数:

    图4
                            “哈维”飓风微博被转发频率与时间跨度的拟合曲线

    图4 “哈维”飓风微博被转发频率与时间跨度的拟合曲线

    y = b 0 α t = b 0 e - 0.808 t
    (10)

    式中,参数b0为初始阶段影响力,即公式(8)中的 T P R i k - 1 ,衰退速率 α t = e - 0.808 t ,后续研究结果均是在该函数基础上得到。

  • 5.3 关键节点识别结果评价

    5.3
  • 5.3.1 TPR识别结果与中心性值的相关分析

    5.3.1

    度中心性和介数中心性是分别从节点局部属性和网络全局属性角度识别关键节点的两种经典指标。为验证本文TPR方法识别出的关键节点的合理性,下面对通过TPR方法找出的“哈维”飓风信息传播网络各阶段排名前5%节点的度中心性、介数中心性、PR值和TPR值进行Spearman相关分析。结果如表2所示。可以看出各阶段前5%节点的TPR值与节点的度中心性、介数中心性、PR值均存在显著相关性,说明TPR方法识别出的各阶段关键节点具有一定的合理性。

    表2 各阶段TPR值与度中心性、介数中心性、PR值的相关性

    TPR1值TPR2值TPR3值TPR4值
    斯皮尔曼等级相关系数度中心性相关系数0.796**0.667**0.715**0.809**
    显著性0.0000.0000.0000.000
    N1300450005100034500
    介数中心性相关系数0.262**0.319**0.227**0.218**
    显著性0.0000.0000.0000.000
    N1300450005100034500
    PR值相关系数0.953**0.580**0.937**0.945**
    显著性0.0000.0000.0000.000
    N1230445815064834546
    表2
                    各阶段TPR值与度中心性、介数中心性、PR值的相关性

    注:**表示相关性在0.01级别显著(双尾)。

  • 5.3.2 基于TPR与PageRank的关键节点识别对比

    5.3.2

    从表2中可以看出TPR方法识别出的各阶段排名前5%节点的TPR值与PR值之间存在显著相关,且相关系数较高,说明TPR算法的关键节点识别结果与PageRank算法的关键节点识别结果具有较高的一致性,但不完全相同。于是接下来进一步比较TPR算法和PageRank算法识别出的关键节点在传播速度和传播范围上的差异。本文采用基于传播动力学的评价方法——SIR传播模[42]对“哈维”飓风事件四个阶段的信息传播网络进行仿真,各传播阶段选取的子网络基本属性如表3所示。设定传播时间t=80,感染概率 β =0.10,恢复概率 γ =0.08,初始感染节点设置为各阶段各算法得分排名前15位的关键节点(表4,各节点以对应用户在Twitter中的用户id表示),进行100次SIR传播仿真后取平均值作为最后结果,结果如图5a、图5b所示。图中横坐标代表迭代次数即传播时间步数,纵坐标代表状态节点数。易感者数量下降的快慢可以反映网络传播速度快慢,即相同迭代步数下易感者减少幅度越大表明传播速度越快。最终稳定状态下的易感者总数可以反映网络传播范围大小,即稳定状态下的易感者数量越少表明传播范围越广。以潜伏期传播网络为例,观察图5a、图5b可知,迭代四步后,Page-Rank算法和TPR算法的易感者个数分别减少到3719和3690,即TPR算法所识别出的关键节点比Page-Rank算法所识别出的关键节点的传播速度更快,此后也一直保持领先。PageRank算法和TPR算法的易感者个数分别在迭代56步和51步后达到稳定,达到稳定时,易感者个数分别减少到2523和2464,即TPR算法所识别出的关键节点比PageRank算法所识别出的关键节点的传播范围更广,且耗时更短。其他几个阶段的信息传播仿真情况与潜伏期的信息传播仿真结果类似,如图5及表5所示,不在此赘述。以上实验结果证明,在“哈维”飓风各阶段的信息传播网络中,TPR算法比传统PageRank算法更能找出传播速度快、传播范围广的关键节点。

    表3 不同传播阶段中的子网络属性

    实验网络所属阶段节点数连边数
    Sub1潜伏期50747311
    Sub2爆发期355911622
    Sub3蔓延期43798830
    Sub4消散期42216741
    表3
                    不同传播阶段中的子网络属性

    表4 不同传播阶段中Top -N初始感染者识别(用户ID

    排名潜伏期爆发期蔓延期消散期
    PageRank算法TPR算法PageRank算法TPR算法PageRank算法TPR算法PageRank算法TPR算法
    1290180065290180065594911608594911608314388850031438885002878548628785486
    217108817681710881768162473831624738370924641708933939270924641708933939216815644450941680
    3162473831624738360095839760095839729979827229979827245094168016815644
    415858432158584321929144119291441287854862878548613675311367531
    5161170291611702958956148576117833651952265195222708352727083527
    6159370251593702576117833589561485330835243633083524361666907516669075
    72715745592715745591115569892111556989222650211226502111113425211134252
    81517303491666907572824869765441536021388284428514193162473832507387725073877
    916669075151730349222154852221548519291441192914413934437439344374
    1017378355173783552719719666271971966610469145216669075110855805110855805
    1154279364454279364444513878445138781666907542851419381887601439060377690651198
    12190716821907168291285858834442534613818975113818975116675174518487179
    136519522169081105246104071517303491624738310469145218487179166751745
    141665187116651871213882849128585882558062664680359790651198818876014390603776
    15169081102101411268940342290180065287455179916815644379392612146569971
    表4
                    不同传播阶段中Top -N初始感染者识别(用户ID)
    图5
                            “哈维”飓风多源信息传播仿真结果

    图5 “哈维”飓风多源信息传播仿真结果

    表5 “哈维”飓风各阶段多源信息传播仿真结果

    算法名称潜伏期爆发期蔓延期消散期
    稳定时间易感者数稳定时间易感者数稳定时间易感者数稳定时间易感者数
    PageRank算法562523501296612198572630
    TPR算法512464461275572177512606
    表5
                    “哈维”飓风各阶段多源信息传播仿真结果
  • 5.4 各阶段关键节点特征分析

    5.4

    为全面地探讨突发事件信息传播在不同阶段上关键节点所表现出的差异性,从而更准确地把握突发事件信息传播在不同阶段的发展态势,本文对各阶段TPR值排名前100位的用户从认证性、原创水平、结构优势、信息优势、响应优势和用户类型等方面进行比较分析。其中,认证性是指用户是否得到微博平台的官方认证,可反映用户的可信[43]。原创水平描述了用户发布原创微博的倾向性。结构优势能体现用户的信息传播和接收趋势。响应优势反映出用户在同等努力水平下获得较高公众回应的能力。用户类型体现关键节点的社会角色。

  • 1) 认证性

    1)

    6中,横坐标表示用户的认证性,纵坐标表示关键节点中认证用户和非认证用户所占比例。观察图6可以发现,各阶段都有55%以上的关键节点属于认证用户,反映出在突发事件微博传播中认证用户比非认证用户更容易将信息传播给公众,且这种趋势随着“哈维”飓风信息传播的演化越来越明显。

    图6
                            关键节点的认证性分析

    图6 关键节点的认证性分析

  • 2) 原创水平

    2)

    本文用微博原创率(IR,原创微博数与总微博数之比)来衡量用户的原创水平,IR值低于0.2时表示用户的微博原创水平很低,IR值在0.5到0.8之间时表示用户的微博原创水平较高,IR值高于0.8时表示用户具有很高的微博原创水平。

    7中,横坐标表示用户的原创水平,纵坐标表示关键节点中不同原创水平的用户所占比例。可以看出,各阶段70%以上的关键节点都具有很高或较高的原创水平,整体上说明关键节点用户更倾向于通过发布原创微博的方式传播信息,也验证了原创性对微博传播的增强作[44]。在“哈维飓风”信息传播各时期中,潜伏期关键节点的原创水平最高,54%以上的关键节点都具有很高的原创水平。这也符合突发事件信息传播的阶段性特征,即在潜伏期人们掌握的事件相关信息还比较少,因而那些掌握大量最新资讯的微博用户更容易成为该阶段的关键节点。而在消散期,有10%的关键节点仅有很低的原创水平。换句话说,这些用户几乎完全通过转发已有微博来传播信息,说明该阶段有关“哈维”飓风新消息的传播已逐渐减少,人们对该事件的关注热度在逐渐消散。

    图7
                            关键节点的原创水平分析

    图7 关键节点的原创水平分析

  • 3) 结构优势

    3)

    S值为用户在结构优势指标上的得分。当S值低于0.5时,表示用户的结构优势较差;当S值在0.5到0.8之间时,表示用户的结构优势较好;当S值高于0.8时,表示用户的结构优势很好。

    8中的横坐标表示用户的结构优势水平,纵坐标表示关键节点中不同结构优势水平的用户所占比例。不难发现,各阶段关键节点的结构优势分布比较类似,都有75%以上的关键节点具有很好的结构优势,他们传播信息的趋势更大,其他关键节点也都具备较好的信息传播结构优势,仅有个别关键节点的结构优势较差,他们接收信息的趋势更大。

    图8
                            关键节点的结构优势分析

    图8 关键节点的结构优势分析

  • 4) 信息优势

    4)

    为了便于对各阶段关键节点的信息优势进行比较,本文对所有关键节点的信息优势指标得分(T值)乘上100000然后取以10为底的对数,并绘制箱形图(图9),其中,横坐标表示突发事件信息传播的时间阶段,纵坐标表示转换后的信息优势值。图9表明,相比于其他几个阶段而言,潜伏期的关键节点拥有更好的信息优势。当然,由于关键节点成员众多,其成员之间的信息优势差距也比较大,但仍然优于其他几个阶段。整体上说明,在突发事件初期,掌握信息资源较多的用户更可能成为关键节点。而随着时间的推移,一方面,由于该事件越来越受到公众的关注导致Twitter上的相关信息总量急剧上升;另一方面,由于相关信息越来越充足使得人们更青睐于质量高的微博,因而信息优势所发挥的作用急剧下滑。而在消散期,关键节点的信息优势又有所回升,可能与该阶段相关微博的日增长总量的下滑有关。

    图9
                            关键节点的信息优势分析

    图9 关键节点的信息优势分析

  • 5) 响应优势

    5)

    为了便于对各阶段关键节点的响应优势进行比较,本文对所有关键节点的响应优势指标得分(R值)取以10为底的对数,并绘制箱形图(图10),其中,横坐标表示突发事件信息传播的时间阶段,纵坐标表示转换后的响应优势值。

    图10
                            关键节点的响应优势分析

    图10 关键节点的响应优势分析

    从图10中观察发现,潜伏期中,关键节点的响应优势普遍偏低,说明该阶段公众对“哈维飓风”普遍还不太关心。而到了爆发期,公众的响应上涨了一个指数级,这可能是因为“哈维”飓风在该阶段带来的巨大破坏力引起了公众的重视。而蔓延期里,虽然飓风已基本消散,但该自然灾害已造成许多地区损失惨重、居民流离失所,急需外界的救援和帮助,这种需求激发了公众的社会责任感和同情心,因而该阶段的平均响应优势继续保持较高水平,但关键节点成员之间的响应优势差距很大。到消散期,各受灾地区已在外界的帮助和支持下慢慢得到恢复,微博上的公众响应也逐渐下降。

  • 6) 用户类型

    6)

    关于关键节点用户类型的划分,本文通过分析用户群体在自然灾害事件中的特征属性及行为表现,将关键节点用户类型分为政府型、媒体型、社会组织型、专家学者型、名人明星型和普通用户型。本文通过用户的用户名、用户简介和认证信息对关键节点的用户类型进行识别。

    从图11中可以看出,新闻媒体在“哈维”飓风微博传播的各个时期都发挥着最大作用。这是因为在一些情况下,尤其是在突发事件过程中,通过社交媒体工具进行报道能让公众更快地获取到最新的、实时的信[45]。自2012年“桑迪飓风”以后,社交媒体平台成了美国政府与公众交流的主要渠[11]。这一点从图11中也可以看出,随着事件的演进,有越来越多的美国政府部门在“哈维”飓风信息传播中担任关键节点。在潜伏期,“哈维”飓风还处在酝酿阶段,人们对其知之甚少,公众的信息需求促使他们对气象学、地质学等领域专家学者的微博极为关注,因而该时期有许多专家学者成为关键信息节点。在爆发期,普通居民型关键节点明显增多,这可能是由于灾情的加剧导致一些偏远地区或受灾严重地区的媒体报道受到阻碍,因而当地居民发布的微博信息就成为公众获取事件相关消息的重要来源。在蔓延期和消散期,社会组织型和名人明星型关键节点显著增加,原因是“哈维”飓风带来的连续强降雨造成许多地区陷入长达两个星期的严重水灾,因而在这段时间里Twitter平台上出现许多公益组织、环境组织和名人明星为受灾地区募捐、祈福和提供指导。

    图11
                            关键节点的用户类型分析

    图11 关键节点的用户类型分析

  • 6 结 语

    6

    本文综合考虑突发事件信息传播生命周期、用户行为特征、网络全局信息和影响力衰退机制,在PageRank算法的基础上提出阶段关键节点动态识别TPR方法,并以“哈维”飓风微博传播为案例进行实验和分析。实验结果证明了TPR方法具有一定的合理性。与PageRank方法相比,TPR方法更能识别出传播速度快、传播范围广的重要节点。此外,本文对比分析了不同阶段的关键节点的特征,主要发现为:①各阶段的关键节点都有较高的认证率,且这种趋势随着“哈维”飓风信息传播的演化越来越明显;②潜伏期的关键节点的原创水平最高,消散期的最低;③随着时间的推移,传播影响力受用户信息优势的影响呈现先下降后上升的趋势;④各阶段关键节点的结构优势分布类似;⑤关键节点的响应优势随着时间的推移呈现先上升后下降的趋势;⑥专家型关键节点多集中在潜伏期,普通型关键节点多集中在爆发期,而蔓延期和消散期的社会组织型和名人型关键节点比其他时期更多。

    根据以上发现,本文提出针对不同阶段舆情治理工作的参考建议:①潜伏期是高原创性、高信息优势和非认证的关键节点用户涌现的时期,他们容易从源头上引起信息失真、谣言等信息异化风险,因此需要对这些类型的关键节点进行重点识别和把控;②爆发期是关键节点的响应优势快速增长的时期,管理者应借助高响应优势的关键节点的影响力及时对舆情方向进行把握和引导,此外,爆发期也是普通型关键节点涌现的时期,政府部门及相关组织应积极关注他们掌握的零次信息和一次信息以便及时了解实时灾情和群众需求;③蔓延期是网络舆情治理的关键时期,也是政府、媒体、社会组织、名人明星、普通网民等各类关键节点用户百花齐放的时期,需要强化他们的协同意识和共同目标实现协同舆情治理;④在消散期,虽然灾情已基本缓解,网络舆情热度也逐渐消退,但小范围群体的热议和讨论仍需关注,以防止“舆情搭载”、“次生舆情”等新问题。

    在进一步的研究中需要注意以下几点:①计算局部影响力时,结构优势、信息优势和响应优势的权重分配需要结合突发事件信息传播不同阶段的特征进行考虑。②本文采用微博被转发频次演化对阶段影响力衰退模型进行模拟,然而,传播影响力的衰退可能还受到网络密度、网络直径等因素影响,因此,有必要进一步地深入、系统分析特定事件下特定阶段中影响传播能力衰退的主要因素。③由于不同类型的突发事件信息传播所具有的网络拓扑特性、关键节点特征不同。因此,本文通过分析“哈维”飓风信息传播案例得出突发事件信息传播网络在不同阶段中的普适性结论,其可推广性还需要进一步讨论。未来需要与其他类型的突发事件案例进行分析和比较,以提出适用于各类突发事件的分阶段舆情治理措施。

  • 参 考 文 献

    • 1

      王伟, 靖继鹏. 公共危机信息传播的社会网络机制研究[J]. 情报科学, 2007, 25(7): 979-982.

    • 2

      曹学艳, 段飞飞, 方宽, 等. 网络论坛视角下突发事件舆情的关键节点识别及分类研究[J]. 图书情报工作, 2014, 58(4): 65-70.

    • 3

      武澎, 王恒山, 李煜. 突发事件信息传播超网络中枢纽节点的判定研究[J]. 管理评论, 2013, 25(6): 104-111.

    • 4

      刘志明, 刘鲁. 微博网络舆情中的意见领袖识别及分析[J]. 系统工程, 2011, 29(6): 8-16.

    • 5

      戴丽娜. 微博舆论领袖的识别方法与管理策略研究[J]. 新闻记者, 2012(9): 26-29.

    • 6

      Cha M, Haddadi H, Benevenuto F, et al. Measuring User Influence in Twitter: The Million Follower Fallacy[C]// Proceedings of the 4th International AAAI Conference on Weblogs and Social Media, Washington DC, 2010: 10-17.

    • 7

      Ding Z Y, Jia Y, Zhou B, et al. Measuring the spreadability of users in microblogs[J]. Journal of Zhejiang University -Science C, 2013, 14(9): 701-710.

    • 8

      贾亚敏, 安璐, 李纲. 城市突发事件网络信息传播时序变化规律研究[J]. 情报杂志, 2015, 34(4): 91-96.

    • 9

      Li L F, Zhang Q P, Tian J, et al. Characterizing information propagation patterns in emergencies: A case study with Yiliang Earthquake[J]. International Journal of Information Management, 2018, 38(1): 34-41.

    • 10

      谭雪晗, 涂艳, 马哲坤. 基于SNA的事故灾难舆情关键用户识别及治理[J]. 情报学报, 2017, 36(3): 297-306.

    • 11

      Simon T, Goldberg A, Adini B. Socializing in emergencies-A review of the use of social media in emergency situations[J]. International Journal of Information Management, 2015, 35(5): 609-619.

    • 12

      Oh O, Kwon K K H K, Rao H R. An exploration of social media in extreme events: rumor theory and twitter during the Haiti earthquake[C]// Proceedings of the International Conference on Information Systems, Saint Louis, Missouri, USA, 2010: 1-13.

    • 13

      Albert R, Jeong H, Barabasi A L. Error and attack tolerance of complex networks[J]. Nature, 2000, 406(6794): 378-382.

    • 14

      Chen D B, Lü L Y,Shang M S, et al. Identifying influential nodes in complex networks[J]. Physica A , 2012, 391(4): 1777-1787.

    • 15

      任卓明, 邵凤, 刘建国, 等. 基于度与集聚系数的网络节点重要性度量方法研究[J]. 物理学报, 2013, 62(12): 522-526.

    • 16

      Bonacich P. Factoring and weighting approaches to status scores and clique identification[J]. Journal of mathematical sociology, 1972, 2(1): 113-120.

    • 17

      Freeman L C. Centrality in social networks conceptual clarification[J]. Social networks, 1978, 1(3): 215-239.

    • 18

      Freeman L C. A set of measures of centrality based on betweenness[J]. Sociometry, 1977, 40(1): 35-41.

    • 19

      Poulin R, Boily M C, Mâsse B R. Dynamical systems to define centrality in social networks[J]. Social Networks, 2000, 22(3): 187-220.

    • 20

      Comin C H, Costa L F. Identifying the starting point of a spreading process in complex networks[J]. Physical Review E, 2011, 84(5): 1-6.

    • 21

      Kitsak M, Gallos L K, Havlin S S, et al. Identification of influential spreaders in complex networks[J]. Nature Physics, 2010, 6(11): 888-893.

    • 22

      Zeng A, Zhang C J. Ranking spreaders by decomposing complex networks[J]. Physics Letters A, 2013, 377(14): 1031-1035.

    • 23

      Hou B N, Yao Y P, Liao D S. Identifying all-around nodes for spreading dynamics in complex networks[J]. Physica A, 2012, 391(15): 4012-4017.

    • 24

      Weng J S, Lim E P, Jiang J, et al. TwitterRank: finding topic-sensitive influential twitters[C]// Proceedings of the 3rd ACM International Conference on Web Search and Data Mining. New York: ACM Press, 2010: 261-270.

    • 25

      Zhang J, Ackerman M S, Adamic L. Expertise networks in online communities: structure and algorithms[C]// Proceedings of the 16th International Conference on World Wide Web, Banff, Alberta, Canada, 2007: 221-230.

    • 26

      Li Q, Zhou T, Lü L Y, et al. Identifying influential spreaders by weighted LeaderRank[J]. Physica A, 2013, 404(24): 47-55.

    • 27

      Tyshchuk Y, Wallace W A. Actionable Information during Extreme Events[C]// Proceedings of the 2012 ASE/IEEE International Conference on Privacy, Security, Risk and Trust and 2012 International Confernece on Social Computing. Amsterdam, Netherlands, 2012: 338-347.

    • 28

      Yao C Y, He G M. Key nodes analysis of microblogging public opinion spread about public emergencies[C]// Proceedings of the International Conference on Modeling, Simulation and Applied Mathematics. Thailand: Atlantis Press, 2015: 264-268.

    • 29

      Fink S. Crisis management: Planning for the inevitable[M]. New York: American Management Association, 1986: 5-6.

    • 30

      Zhang Z K, Liu C, Zhan X X, et al. Dynamics of information diffusion and its applications on complex networks[J]. Physics Reports, 2016, 651: 1-34.

    • 31

      Yang J, Counts S. Predicting the speed, scale, and range of information diffusion in Twitter[C]// Proceedings of 4th International AAAI Conference on Weblogs and Social Media, Washington DC, 2010: 355-358.

    • 32

      Riquelme F, González-Cantergiani P. Measuring user influence on Twitter: A survey[J]. Information Processing & Management, 2016, 52(5): 949-975.

    • 33

      张鹏威, 刘红丽, 俞丽娟, 等. 微博信息传播中的用户影响力研究综述[J]. 情报科学, 2016, 34(8): 160-164.

    • 34

      Mei Y, Zhong Y L, Yang J. Finding and analyzing principal features for measuring user influence on Twitter[C]// Proceedings of the 2015 IEEE First International Conference on Big Data Computing Service and Applications. San Francisco, CA, USA, 2015: 478-486.

    • 35

      Leavitt A, Burchard E, Fisher D, et al. The influentials: New approaches for analyzing influence on Twitter[J]. Web Ecology, 2009, 4(2): 1-18.

    • 36

      Brin S, Page L. The anatomy of a large-scale hypertextual web search engine[J]. Computer Networks and ISDN Systems, 1998, 30(1): 107-117.

    • 37

      Huang J M, Li C, Wang W Q, et al. Temporal scaling in information propagation[J]. Scientific Reports, 2014, 4: 1-6.

    • 38

      Yang J, Leskovec J. Modeling information diffusion in implicit networks[C]// Proceedings of the 2010 IEEE 10th International Conference on Data Mining. Sydney, NSW, Australia, 2010: 599-608.

    • 39

      Phillips M E. Hurricane harvey Twitter dataset[EB/OL]. [2017-11-22]. https://digital.library.unt.edu/ark:/67531

      /metadc993940/.

    • 40

      方滨兴, 许进, 李建华, 等. 在线社交网络分析[M]. 北京: 电子工业出版社, 2014: 24-26.

    • 41

      王晨旭, 晓宏, 秦涛, 等. 微博消息传播中意见领袖影响力建模研究[J]. 软件学报, 2015, 26(6): 1473-1485.

    • 42

      姜启源, 谢金星, 叶俊. 数学模型[M]. 第3版. 北京: 高等教育出版社, 2003: 138-140.

    • 43

      张玥, 孙霄凌, 浦正宁, 等. 微博舆情传播影响因素研究——基于信源特征和信息形式的视角[J]. 情报资料工作, 2014(3): 59-64.

    • 44

      江燕青, 许鑫. 半衰期视角的微博信息老化研究——以高校官方微博为例[J]. 图书情报知识, 2016(2): 92-100.

    • 45

      Lerman K, Ghosh R. Information contagion: an empirical study of the spread of news on digg and Twitter social networks[C]// Proceedings of 4th International AAAI Conference on Weblogs and Social Media. Washington DC: AAAI, 2010: 166-176.

陈思菁

机 构:武汉大学信息资源研究中心,武汉 430072

Affiliation:Center for Studies of Information Resources, Wuhan University, Wuhan 430072

作者简介:陈思菁,女,1992年生,博士研究生,主要研究方向为社交网络、信息传播

李纲

机 构:武汉大学信息资源研究中心,武汉 430072

Affiliation:Center for Studies of Information Resources, Wuhan University, Wuhan 430072

作者简介:李纲,男,1966年生,教授,博士生导师,主要研究方向为竞争情报、智慧城市

毛进

机 构:武汉大学信息资源研究中心,武汉 430072

Affiliation:Center for Studies of Information Resources, Wuhan University, Wuhan 430072

邮 箱:maojin@whu.edu.cn

作者简介:毛进,男,1988年生,博士后,主要研究方向为信息组织、知识网络,E-mail:maojin@whu.edu.cn

巴志超

机 构:武汉大学信息资源研究中心,武汉 430072

Affiliation:Center for Studies of Information Resources, Wuhan University, Wuhan 430072

作者简介:巴志超,男,1990年生,博士研究生,主要研究方向为数据挖掘、知识网络。

马 兰

角 色:责任编辑

Role:Executive editor

1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F001.jpg
1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F002.jpg
1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F003.jpg
网络阶段时间节点数连边数平均度聚集系数
G1潜伏期2017.8.18—8.2424593370983.0169560.0023505630
G2爆发期2017.8.25—8.2889162920615974.6243380.0002672148
G3蔓延期2017.8.29—8.31101682518573033.6531420.0000704059
G4消散期2017.9.01—9.2269091012517723.6235460.0003219725
1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F004.jpg
TPR1值TPR2值TPR3值TPR4值
斯皮尔曼等级相关系数度中心性相关系数0.796**0.667**0.715**0.809**
显著性0.0000.0000.0000.000
N1300450005100034500
介数中心性相关系数0.262**0.319**0.227**0.218**
显著性0.0000.0000.0000.000
N1300450005100034500
PR值相关系数0.953**0.580**0.937**0.945**
显著性0.0000.0000.0000.000
N1230445815064834546
实验网络所属阶段节点数连边数
Sub1潜伏期50747311
Sub2爆发期355911622
Sub3蔓延期43798830
Sub4消散期42216741
排名潜伏期爆发期蔓延期消散期
PageRank算法TPR算法PageRank算法TPR算法PageRank算法TPR算法PageRank算法TPR算法
1290180065290180065594911608594911608314388850031438885002878548628785486
217108817681710881768162473831624738370924641708933939270924641708933939216815644450941680
3162473831624738360095839760095839729979827229979827245094168016815644
415858432158584321929144119291441287854862878548613675311367531
5161170291611702958956148576117833651952265195222708352727083527
6159370251593702576117833589561485330835243633083524361666907516669075
72715745592715745591115569892111556989222650211226502111113425211134252
81517303491666907572824869765441536021388284428514193162473832507387725073877
916669075151730349222154852221548519291441192914413934437439344374
1017378355173783552719719666271971966610469145216669075110855805110855805
1154279364454279364444513878445138781666907542851419381887601439060377690651198
12190716821907168291285858834442534613818975113818975116675174518487179
136519522169081105246104071517303491624738310469145218487179166751745
141665187116651871213882849128585882558062664680359790651198818876014390603776
15169081102101411268940342290180065287455179916815644379392612146569971
1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F005.jpg
算法名称潜伏期爆发期蔓延期消散期
稳定时间易感者数稳定时间易感者数稳定时间易感者数稳定时间易感者数
PageRank算法562523501296612198572630
TPR算法512464461275572177512606
1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F006.jpg
1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F007.jpg
1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F008.jpg
1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F009.jpg
1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F010.jpg
1000-0135-2019-02-178/alternativeImage/30c9313a-4f67-4048-903c-0207e7549653-F011.jpg

图1 “哈维”飓风事件中某用户的被转发频次时序变化

图2 关键节点动态识别框架

图3 “哈维”飓风微博每日增长数量曲线

表1 四个传播网络的基本属性

图4 “哈维”飓风微博被转发频率与时间跨度的拟合曲线

表2 各阶段TPR值与度中心性、介数中心性、PR值的相关性

表3 不同传播阶段中的子网络属性

表4 不同传播阶段中Top -N初始感染者识别(用户ID

图5 “哈维”飓风多源信息传播仿真结果

表5 “哈维”飓风各阶段多源信息传播仿真结果

图6 关键节点的认证性分析

图7 关键节点的原创水平分析

图8 关键节点的结构优势分析

图9 关键节点的信息优势分析

图10 关键节点的响应优势分析

图11 关键节点的用户类型分析

image /

无注解

无注解

无注解

无注解

无注解

**表示相关性在0.01级别显著(双尾)。

无注解

无注解

无注解

无注解

无注解

无注解

无注解

无注解

无注解

无注解

  • 参 考 文 献

    • 1

      王伟, 靖继鹏. 公共危机信息传播的社会网络机制研究[J]. 情报科学, 2007, 25(7): 979-982.

    • 2

      曹学艳, 段飞飞, 方宽, 等. 网络论坛视角下突发事件舆情的关键节点识别及分类研究[J]. 图书情报工作, 2014, 58(4): 65-70.

    • 3

      武澎, 王恒山, 李煜. 突发事件信息传播超网络中枢纽节点的判定研究[J]. 管理评论, 2013, 25(6): 104-111.

    • 4

      刘志明, 刘鲁. 微博网络舆情中的意见领袖识别及分析[J]. 系统工程, 2011, 29(6): 8-16.

    • 5

      戴丽娜. 微博舆论领袖的识别方法与管理策略研究[J]. 新闻记者, 2012(9): 26-29.

    • 6

      Cha M, Haddadi H, Benevenuto F, et al. Measuring User Influence in Twitter: The Million Follower Fallacy[C]// Proceedings of the 4th International AAAI Conference on Weblogs and Social Media, Washington DC, 2010: 10-17.

    • 7

      Ding Z Y, Jia Y, Zhou B, et al. Measuring the spreadability of users in microblogs[J]. Journal of Zhejiang University -Science C, 2013, 14(9): 701-710.

    • 8

      贾亚敏, 安璐, 李纲. 城市突发事件网络信息传播时序变化规律研究[J]. 情报杂志, 2015, 34(4): 91-96.

    • 9

      Li L F, Zhang Q P, Tian J, et al. Characterizing information propagation patterns in emergencies: A case study with Yiliang Earthquake[J]. International Journal of Information Management, 2018, 38(1): 34-41.

    • 10

      谭雪晗, 涂艳, 马哲坤. 基于SNA的事故灾难舆情关键用户识别及治理[J]. 情报学报, 2017, 36(3): 297-306.

    • 11

      Simon T, Goldberg A, Adini B. Socializing in emergencies-A review of the use of social media in emergency situations[J]. International Journal of Information Management, 2015, 35(5): 609-619.

    • 12

      Oh O, Kwon K K H K, Rao H R. An exploration of social media in extreme events: rumor theory and twitter during the Haiti earthquake[C]// Proceedings of the International Conference on Information Systems, Saint Louis, Missouri, USA, 2010: 1-13.

    • 13

      Albert R, Jeong H, Barabasi A L. Error and attack tolerance of complex networks[J]. Nature, 2000, 406(6794): 378-382.

    • 14

      Chen D B, Lü L Y,Shang M S, et al. Identifying influential nodes in complex networks[J]. Physica A , 2012, 391(4): 1777-1787.

    • 15

      任卓明, 邵凤, 刘建国, 等. 基于度与集聚系数的网络节点重要性度量方法研究[J]. 物理学报, 2013, 62(12): 522-526.

    • 16

      Bonacich P. Factoring and weighting approaches to status scores and clique identification[J]. Journal of mathematical sociology, 1972, 2(1): 113-120.

    • 17

      Freeman L C. Centrality in social networks conceptual clarification[J]. Social networks, 1978, 1(3): 215-239.

    • 18

      Freeman L C. A set of measures of centrality based on betweenness[J]. Sociometry, 1977, 40(1): 35-41.

    • 19

      Poulin R, Boily M C, Mâsse B R. Dynamical systems to define centrality in social networks[J]. Social Networks, 2000, 22(3): 187-220.

    • 20

      Comin C H, Costa L F. Identifying the starting point of a spreading process in complex networks[J]. Physical Review E, 2011, 84(5): 1-6.

    • 21

      Kitsak M, Gallos L K, Havlin S S, et al. Identification of influential spreaders in complex networks[J]. Nature Physics, 2010, 6(11): 888-893.

    • 22

      Zeng A, Zhang C J. Ranking spreaders by decomposing complex networks[J]. Physics Letters A, 2013, 377(14): 1031-1035.

    • 23

      Hou B N, Yao Y P, Liao D S. Identifying all-around nodes for spreading dynamics in complex networks[J]. Physica A, 2012, 391(15): 4012-4017.

    • 24

      Weng J S, Lim E P, Jiang J, et al. TwitterRank: finding topic-sensitive influential twitters[C]// Proceedings of the 3rd ACM International Conference on Web Search and Data Mining. New York: ACM Press, 2010: 261-270.

    • 25

      Zhang J, Ackerman M S, Adamic L. Expertise networks in online communities: structure and algorithms[C]// Proceedings of the 16th International Conference on World Wide Web, Banff, Alberta, Canada, 2007: 221-230.

    • 26

      Li Q, Zhou T, Lü L Y, et al. Identifying influential spreaders by weighted LeaderRank[J]. Physica A, 2013, 404(24): 47-55.

    • 27

      Tyshchuk Y, Wallace W A. Actionable Information during Extreme Events[C]// Proceedings of the 2012 ASE/IEEE International Conference on Privacy, Security, Risk and Trust and 2012 International Confernece on Social Computing. Amsterdam, Netherlands, 2012: 338-347.

    • 28

      Yao C Y, He G M. Key nodes analysis of microblogging public opinion spread about public emergencies[C]// Proceedings of the International Conference on Modeling, Simulation and Applied Mathematics. Thailand: Atlantis Press, 2015: 264-268.

    • 29

      Fink S. Crisis management: Planning for the inevitable[M]. New York: American Management Association, 1986: 5-6.

    • 30

      Zhang Z K, Liu C, Zhan X X, et al. Dynamics of information diffusion and its applications on complex networks[J]. Physics Reports, 2016, 651: 1-34.

    • 31

      Yang J, Counts S. Predicting the speed, scale, and range of information diffusion in Twitter[C]// Proceedings of 4th International AAAI Conference on Weblogs and Social Media, Washington DC, 2010: 355-358.

    • 32

      Riquelme F, González-Cantergiani P. Measuring user influence on Twitter: A survey[J]. Information Processing & Management, 2016, 52(5): 949-975.

    • 33

      张鹏威, 刘红丽, 俞丽娟, 等. 微博信息传播中的用户影响力研究综述[J]. 情报科学, 2016, 34(8): 160-164.

    • 34

      Mei Y, Zhong Y L, Yang J. Finding and analyzing principal features for measuring user influence on Twitter[C]// Proceedings of the 2015 IEEE First International Conference on Big Data Computing Service and Applications. San Francisco, CA, USA, 2015: 478-486.

    • 35

      Leavitt A, Burchard E, Fisher D, et al. The influentials: New approaches for analyzing influence on Twitter[J]. Web Ecology, 2009, 4(2): 1-18.

    • 36

      Brin S, Page L. The anatomy of a large-scale hypertextual web search engine[J]. Computer Networks and ISDN Systems, 1998, 30(1): 107-117.

    • 37

      Huang J M, Li C, Wang W Q, et al. Temporal scaling in information propagation[J]. Scientific Reports, 2014, 4: 1-6.

    • 38

      Yang J, Leskovec J. Modeling information diffusion in implicit networks[C]// Proceedings of the 2010 IEEE 10th International Conference on Data Mining. Sydney, NSW, Australia, 2010: 599-608.

    • 39

      Phillips M E. Hurricane harvey Twitter dataset[EB/OL]. [2017-11-22]. https://digital.library.unt.edu/ark:/67531

      /metadc993940/.

    • 40

      方滨兴, 许进, 李建华, 等. 在线社交网络分析[M]. 北京: 电子工业出版社, 2014: 24-26.

    • 41

      王晨旭, 晓宏, 秦涛, 等. 微博消息传播中意见领袖影响力建模研究[J]. 软件学报, 2015, 26(6): 1473-1485.

    • 42

      姜启源, 谢金星, 叶俊. 数学模型[M]. 第3版. 北京: 高等教育出版社, 2003: 138-140.

    • 43

      张玥, 孙霄凌, 浦正宁, 等. 微博舆情传播影响因素研究——基于信源特征和信息形式的视角[J]. 情报资料工作, 2014(3): 59-64.

    • 44

      江燕青, 许鑫. 半衰期视角的微博信息老化研究——以高校官方微博为例[J]. 图书情报知识, 2016(2): 92-100.

    • 45

      Lerman K, Ghosh R. Information contagion: an empirical study of the spread of news on digg and Twitter social networks[C]// Proceedings of 4th International AAAI Conference on Weblogs and Social Media. Washington DC: AAAI, 2010: 166-176.