en
×

分享给微信好友或者朋友圈

使用微信“扫一扫”功能。
参考文献 1
樊兴华, 赵静, 方滨兴, 等. 影响力扩散概率模型及其用于意见领袖发现研究[J]. 计算机学报, 2013, 36(2): 360-367.
参考文献 2
LazarsfeldP F, BerelsonB, GaudetH. The people’s choice[J]. Eco-Architecture: Harmonisation between Architecture and Nature, 1944, 18(1): 154.
参考文献 3
AralS, WalkerD. Identifying influential and susceptible members of social networks[J]. Science, 2012, 337(6092): 337.
参考文献 4
马茜, 马军. 在影响力最大化问题中寻找种子节点的替补节点[J]. 计算机学报, 2017, 40(3): 674-686.
参考文献 5
GoyalA, BonchiF, LakshmananL V S. Learning influence probabilities in social networks[C]// Proceedings of the Third International Conference on Web Search and Web Data Mining. New York: ACM Press, 2010: 241-250.
参考文献 6
TangJ, SunJ M, WangC, et al. Social influence analysis in large-scale networks[C]// Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2009: 807-816.
参考文献 7
PageL, BrinS, MotwaniR, et al. The PageRank citation ranking: Bringing order to the Web[R]. Stanford University, 1998.
参考文献 8
WengJ, LimE P, JiangJ, et al. TwitterRank: finding topic-sensitive influential twitterers[C]// Proceedings of the ACM International Conference on Web Search and Data Mining. New York: ACM Press, 2010: 261-270.
参考文献 9
KleinbergJ M. Authoritative sources in a hyperlinked environment[J]. Journal of the ACM, 1999, 46(5): 604-632.
参考文献 10
ChaM, HaddadiH, BenevenutoF, et al. Measuring user influence in Twitter: The million follower fallacy[C]// Proceedings of the International Conference on Weblogs and Social Media. Palo Alto: AAAI Press, 2010.
参考文献 11
BrandesU. A faster algorithm for betweenness centrality[J]. The Journal of Mathematical Sociology, 2001, 25(2): 163-177.
参考文献 12
ZhangY C, LiuY, ChengH, et al. A method of measuring user influence in MicroBlog[J]. Journal of Convergence Information Technology, 2011, 6(10): 243-250.
参考文献 13
顾洁, 胡安安, 刘旭, 等. 社交网络正、负影响力计算——基于符号网络的PageRank算法改进[J]. 情报学报, 2015, 34(7): 725-733.
参考文献 14
何军, 刘业政. 基于社交关系和影响力的在线社交网络用户兴趣偏好获取方法研究[J]. 情报学报, 2014, 33(7): 730-739.
参考文献 15
司夏萌, 刘云. 虚拟社区中人际交互行为的统计分析研究[J]. 物理学报, 2011, 60(7): 859-866.
参考文献 16
KatzE, LazarsfeldP F, RoperE. Personal influence: the part played by people in the flow of mass communications[J]. American Journal of Sociology, 1956, 62(1): 1583-1583.
参考文献 17
李阅志, 祝园园, 钟鸣. 基于k-核过滤的社交网络影响最大化算法[J]. 计算机应用, 2018, 38(2): 464-470.
参考文献 18
周飞, 高茂庭. 基于PageRank的网络社区意见领袖发现算法[J]. 计算机工程, 2018, 44(2): 203-209.
参考文献 19
FreemanL C. Centrality in social networks conceptual clarification[J]. Social Networks, 1979, 1(3): 215-239.
目录 contents

    摘要

    在社交网络中意见领袖对信息传播有着巨大的促进作用,意见领袖往往能够影响群众以及引导网络舆论的走向。寻找网络中的意见领袖可以及时准确地掌握网络动态。本文提出一种融入紧密度中心性与信用的用户影响力强度计算模型,寻找电商化社交网络中的意见领袖。该模型首先根据用户间的好友关系获得关系邻接矩阵。然后用该邻接矩阵计算每个用户的紧密度中心性。提出SocialCreditRank算法计算用户影响力,该算法选择用户在网络中的紧密度中心性比重作为用户被随机选择的概率,用户与好友的信誉度之比对好友的贡献度进行修正。本文以支付宝的用户数据作为实验对象,实验结果表明该方法比一般的意见领袖识别方法效果更加精确。

    Abstract

    Opinion leaders play a major role in promoting information dissemination in social networks. Opinion leaders can often influence the masses and guide the trend of network public opinion. Looking for opinion leaders in the network can timely and can accurately grasp network dynamics. In this paper, we propose a calculation model of user influence intensity that integrates closeness centrality and tightness of credit, and looks for opinion leaders in e-commerce social networks. First, the model obtains the relationship adjacency matrix according to the friend relationship between users. Then the compactness centrality of each user is calculated with an adjacency matrix. The social credit rank algorithm is proposed for calculating user influence. The algorithm chooses the density centrality proportion of the user in the network as the probability that the user is randomly selected. The ratio of the user s credibility to that of the friend's contribution is revised. In this paper, the user data of Alipay is used as an experimental object. The experimental results show that the method is more accurate than the general opinion leader identification method.

  • 1 引 言

    1

    随着互联网的发展,微信、微博、QQ等社交网络平台逐渐渗透到人们的日常生活中。当一个话题在社交网络平台中传播时,意见领袖对话题的发展能够产生巨大的影响。意见领袖通过与粉丝之间的互动能够带动网络中话题的走向,有时甚至能够影响现实社[1]。意见领袖的概念是由Lazarsfield[2]提出的,他认为意见领袖是将从媒体传过来的观点传播到普通群众中去的人。本文中社交网络的意见领袖指的是在社交网络平台十分活跃、具有较高威望的用户,通过与其他用户之间的交流、分享、互动将自己的观点传播给其他用户,从而影响他们的用户。如何挖掘社交网络中的影响力较大的用户已经成为一个比较热门的研究领域。研究方向主要包括用户间影响力强度度量和个体影响力度量等。用户间的影响力强度度量主要通过用户间行[3]、交互特[4,5]和语义关联强[6]来度量影响力强度;个体影响力度量方式包括PageRank[7]及其扩展算[8]、HITS算[9]以及各种社会网络中心性指[10,11]如度(degree)中心性、紧密(closeness)中心性和介数(betweenness)中心性等。

    除了研究度量用户影响力强弱外,如何寻找合适的评价指标衡量用户的影响力同样很重要。Zhang[12]对微博中用户的粉丝数、转发数、互粉数等指标进行研究,发现选择恰当的指标能提高度量用户影响力大小的准确性。顾洁[13]认为用户的信誉对用户的影响力存在显著作用。在社会关系网络中,度量用户影响力大小的指标不仅要考虑用户个体的属性,还需要考虑用户在网络中的社会属性。

    在社会关系网络中,用户之间的关系不仅仅只是表明两者间存在联系的一个简单的二元关[14]。在研究一个用户的影响力时,不但要考虑用户之间的关系强度,还要考虑用户的社交行为对用户之间的关系产生的影响。用户之间的关系强度根据不同的亲密程度分为强关系和弱关系,强弱表示能够被影响的程度大小;根据用户之间距离不同还可以将关系分为直接关系和间接关系。不同用户之间的关系各不相同,且容易受到各种影响发生变化。而用户的社会属性包括用户在网络中的活跃程度、用户的好友数量和与其他用户之间的交互程度等。研究社交化中用户的影响力,对于分析话题形成的机制、研究信息传播模型和指导舆论引导有着重要的作用。

    社交网络用户影响力研究数据主要分为两大类。第一类是用户的基础属性,如年龄、习惯、爱好、地理位置等。通常具有相似基础属性用户之间的影响传播会更容[15]。另一类是基于用户间的交互行为产生的数据,如用户发表状态、评论、转发、关注等行为。这些数据经过分析可以反映用户的影响力强弱。目前存在的计算社会关系网络中用户影响力的方法都有一定缺陷,只考虑用户间直接关系,忽略了用户在网络中的位置,没有考虑到网络的全局性以及信誉在用户影响力度量中的作用,所以关于影响力强度的计算方法都有待改进。

    本文提出了一种在电商化社交网络中融合用户紧密度中心性和用户信用的用户影响力计算算法。根据该算法得到的结果,排名越靠前的用户越可能是一个意见领袖。本文在第2节中讲述了现在用户影响力研究的方向,在第3节中提出SocialCreditRank算法,第4节是实验和分析,根据支付宝用户数据评估了SocialCreditRank在寻找网络中意见领袖的有效性,并与其他方法进行了比较。

  • 2 问题描述

    2

    随着用户影响力在社交化网络中的广泛应用,对影响力强度的研究也引起了众多学者的重视。Katz[16]通过对美国总统大选选票结果的研究,发现个体之间影响力存在强弱关系,少部分关键选民能够影响大部分普通选民。李阅志[17]针对现有社交网络影响最大化算法影响范围小和时间复杂度高的问题,提出一种基于独立级联模型的k-核过滤算法。Aral[3]通过对FaceBook中130万用户之间关系影响力和敏感性的计算,研究影响力在不同年龄、性别的用户之间传播的容易程度。马茜[4]通过分析用户之间的交互行为和话题领域的相似程度,提出了一个基于链接的潜在变分模型,提高了用户分类的精确性。在Google创始人Larry Page提出PageRank网页排名算法后,许多学者以该算法为基础研究节点的影响力。周飞[18]提出一种基于用户影响力和PageRank的意见领袖发现算法,综合考虑用户自身影响力、用户动态行为影响度和用户行为给动态内容带来的真实影响。通过从知乎网络社区收集的大规模数据实验结果表明,该算法更具合理性并能有效地提高网络社区意见领袖的识别准确度。但PageRank虽然考虑了用户在网络中的拓扑属性,但并未考虑用户个体属性。研究发现在拓扑网络中到其他用户距离越近的用户以及信誉度较高的用户往往具有较大的影响[13,19]。本文融合了用户在网络中的紧密度中心性和用户信誉度,提出了研究用户影响力排名的SocialCreditRank算法。

    通过研究用户影响力的排名,分析在社交网络中处于不同信誉环境下用户的影响力强度,同时也分析用户影响力与其到其他用户之间距离的关系。根据本文所提出的影响力排名模型中,计算社交网络中区域范围内的用户影响力强度,寻找意见领袖,使在面对社会舆论时,可以依靠意见领袖良好地引导社会舆论,提高对社会舆论的掌握能力。

  • 3 融入用户信用和社交网络的影响力强度模型

    3
  • 3.1 基本定义

    3.1

    定义1:用户。用户是在电商化社交网络中的个体,用户在网络中需填写年龄,地址等个人信息。用户可以在电商平台中进行消费并对商品进行评价,对感兴趣的商品可以收藏。同时还可以与其他用户建立好友关系,相互之间可以进行交流、商品推荐等活动。用户的集合为 U = { u 1 , u 2 , , u n } n 表示用户数量。

    定义2:好友。好友是与用户有直接关系的其他用户,好友可以使存在线下互动关系的朋友,也可以是只有线上交流的朋友。用户与好友之间可以进行互动,如评论、推荐等行为。用户 u i 所有好友的集合表示为: F i = { u x , , u y } u x u y 表示在社交网络中用户 u i 的好友。 F = { F 1 , , F n } 表示网络中所有用户好友集的集合。

    定义3:用户信用。社交化电商平台通过分析用户的基础属性、信用历史、人脉关系、行为偏好和履约能力等数据得到的对用户诚信度的评价称为用户信用。用户信用可以客观的评价用户在社交化电商平台中的声望。用户信用的集合为 R = { r 1 , r 2 , , r n } ,其中 r i 表示用户 u i 的信用。

    定义4:紧密度中心性。用户到其他所有可到达用户的最短距离的度量称为紧密度中心性,它考察一个用户在传播信息时对其他用户的依赖程度。如果一个用户离其他用户越近,那么他传播信息的时候也就越不需要依赖他人。一个用户到社交化电商平台网络中各个用户的距离都很短,那么这个用户在网络中的影响力就会相对较高。用户 i 的紧密度中心性表达式为

    C i = n - 1 y = 1 n d x y
    (1)

    式中, d x y 表示节点x到节点y的最短路径距离; n 表示网络中节点的总数; n - 1 表示节点可能的最大邻居节点。所有用户的紧密度中心性集合可表示为: C = { C 1 , C 2 , , C n }

  • 3.2 PageRank模型

    3.2

    PageRank通过网络中大量的连接关系来确定一个网页的等级。若页面A存在到页面B的链接,可以理解为页面A给页面B投票,根据链接的来源可以确定被链接页面的等级。该算法的基本思想是:如果一个网页A有指向网页B的链接,那么就认为A的重要性对B的重要性有所贡献,且网页B的重要性只与指向它的网页的重要性相关。如果A的重要性越高,相应的网页B的重要性也就越高。一个页面的PageRank值取决于连接到该页面的页面数以及这些页面的PageRank值,如果一个网页被越多重要的网页所链接,那么这个网页是重要的概率就越大。其表达式为

    P a g e R a n k ( v i ) = 1 - d + d × j = 1 n P a g e R a n k ( v j ) O ( v j )
    (2)

    式中, P a g e R a n k ( v i ) 代表页面 v i 的PageRank值; d 是阻尼因子,通常选择为0.85,其意义在于任意时刻用户到达某个页面后继续向后浏览的概率, 1 - d 是用户停止点击的概率; v j 是链入到页面 v i 的某一个页面; O ( v j ) 代表页面 v j 的出度。由此公式可知页面 v i 的PageRank值是由该页面的入度、所有链入页面的出度和他们的PageRank值所决定的。

  • 3.3 用户影响力强度计算SocialCreditRank

    3.3

    本文提出的计算用户影响力模型,由数据获取、数据处理、影响力排序三部分组成的,如图1所示。

    (1)数据获取。从电商化社交网络中选择一个包含一定数量用户的小世界网络。在小世界网络中,所有用户组成用户数据集 U = { u 1 , u 2 , , u n } ,每个用户都有各自的好友,网络中所有用户好友集的组成集合 F = { F 1 , , F n } 。平台通过分析用户的基础属性、信用历史等数据得到用户的信誉度。用户信誉度的集合为 R = { r 1 , r 2 , , r n }

    图1
                            用户影响力强度计算模型

    图1 用户影响力强度计算模型

    (2)数据处理。根据小世界网络用户以及各自的好友关系集合 U = { u 1 , u 2 , , u n } F = { F 1 , , F n } ,得到一个n阶好友关系邻接矩阵G,在好友关系邻接矩阵G中,若两个用户之间两两互为好友关系,则在矩阵中用1表示;若两个用户之间没有直接关系,则用0表示。然后利用紧密度中心性算法计算邻接矩阵G中每个用户的紧密度中心性,若紧密度中心性越大,则表示用户到网络中其他节点的距离越近,将信息传播到网络的能力也就越强,用户的影响力强度也越大。

    (3)影响力强度计算。在PageRank基础上,以用户在网络中的紧密度中心性比重作为用户被随机选择的概率。同时,由于人们更倾向于认同信用较高的用户,所以选择用户与好友的信用之比对该好友对用户影响力强度的贡献进行修正。若用户的信誉度比该好友高,则加强该好友对用户影响力强度的贡献,反之则减少对用户影响力强度的贡献。将所有用户的SocialCreditRank初始值设为1,然后根据公式(3)计算用户的SocialCreditRank值。对公式(3)进行多次迭代,直到SocialCreditRank值收敛,得到每个用户的SocialCreditRank值即用户在本文模型下的影响力强度,SocialCreditRank值越大的用户越可能是网络中的意见领袖。

    本文提出一种测量电商化社交网络中用户影响力强度计算方法。选择用户在网络中的紧密度中心性比重作为用户被随机选择的概率,紧密度中心性越大,用户在网络中传播信息就越容易,影响力就越[19]。选择用户与好友的信誉度之比 r i r j 对用户好友的贡献度进行修正。人们对信誉度高的用户抱有更大的信任感,在电商化社交关系网络中用户的影响力与其网络中信誉强度成正比,信誉强度越高,则该用户的影响力就越[13];用 S o c i a l C r e d i t R a n k ( u i ) 表示用户的影响力强度SocialCreditRank:

    S o c i a l C r e d i t R a n k ( u i ) = ( 1 - d ) × C u i j = 1 n C u j + d × j = 1 n r i r j × S o c i a l C r e d i t R a n k ( u j ) O ( u j )
    (3)

    式中, S o c i a l C r e d i t R a n k ( u i ) 是用户 u i 在网络中的SocialCreditRank值; d 是阻尼因子,参考PageRank将其取值设为0.85; i = 1 n C u j 是网络中所有用户的紧密度中心性之和; u j ( 1 < = j < = n ) 是用户 u i 的好友;是 O ( u i ) 是用户 u i 的出度,即与用户 u i 在网络中有直接好友关系的人数。将所有用户初始Social-CreditRank值设为1,通过对 S o c i a l C r e d i t R a n k ( u i ) 进行多次迭代,直到获得的值收敛,得到每个用户的SocialC-reditRank值即用户在本文模型下的影响力强度,SocialCreditRank值越大的用户越可能是网络中的意见领袖。算法过程如下:

    算法1 SocialTrustRank算法

    输入:社会关系网络矩阵 G ( ) ,用户信用分 r i ;

    输出:用户的SocialTrustRank值;

    若用户i和用户j存在关系,则w(ij)=1,否则=0

    1. 初始化sum,d为0,SocialTrustRank (i),SocialTrustRankbak(i)( i = 1,2 , , n ), ε =e-4

    2. while条件永真{

    3. for i = 0 to n do

    4. for j = 0 to n do

    5. if w(i,j)=1 then

    6. sum + =( r i / r j )*SocialTrustRank (i)/O(i)

    7. end if

    8. end for

    9. SocialTrustRank (i) = (1-d)*( C i / C s u m )+d*sum

    10. d = STR(i)- SocialTrustRankbak(i)

    11. SocialTrustRankbak(i)= SocialTrustRank (i)

    12. sum=0

    13. end for

    14. if(d < ε )

    15. return节点的SocialTrustRank值

  • 16 end while

    16

    通过分析用户的影响力强度,可以发现用户影响力与用户在网络中的信誉值,以及用户影响力和用户到其他用户的最短距离之间的关系。

  • 4 实验与分析

    4
  • 4.1 实验数据

    4.1

    本文的实验数据来自于支付宝平台下的用户信息。用户信息包括用户基础属性、好友关系数据和芝麻信用数据。以用户的信用分作为信誉度。随机选择一个支付宝用户作为初始节点,通过与其具有好友关系的用户进行扩散,以此构建一个小世界网络。假设拥有直接关系的两个用户之间的距离为1,则使所选取的所有节点与初始节点的距离不超过2,最终该网络包含106个用户和840条好友关系数据。由于好友关系是相互的,所以在网络中,两个用户之间的边是无向的。

  • 4.2 实验结果与分析

    4.2

    使用本文提出的SocialCreditRank用户影响力评估方法对支付宝用户数据集进行影响力强度分析。对计算结果SocialCreditRank值按从大到小排序得到用户相对影响力曲线图(图2)。纵坐标为用户的SocialCreditRank值,横坐标为用户的影响力排序,1表示影响力最大的用户,105表示影响力最小的用户。

    图2
                            用户SocialCreditRank结果图

    图2 用户SocialCreditRank结果图

  • 4.2.1 SocialCreditRank与其他节点影响力指标的关系

    4.2.1

    SocialCreditRank的本质是对网络中所有用户的影响力进行排序,SocialCreditRank值越大,则用户影响力越大。我们对比了SocialCreditRank与其他节点影响力指标紧密度中心性和PageRank排序结果之间的关系图(图3,4),并用kendall相关系数度量SocialCreditRank与这些节点影响力指标排序结果的相关性强弱。

    图3
                            SocialCreditRank与PageRank排序结果关系图

    图3 SocialCreditRank与PageRank排序结果关系图

    图4
                            SocialCreditRank与Closeness排序结果关系图

    图4 SocialCreditRank与Closeness排序结果关系图

    在统计学中,Kendall相关系数是衡量两个排序结果相关性强弱的统计值,用 τ 表示。Kendall相关系数是无参数假设检验, - 1 τ 1 τ = 1 时示两个排序相关性完全一致;当 τ = - 1 时,表示两个排序的相关性完全相反;当 τ = 0 时,表示两个排序结果是完全独立的。根据两个排序结果中元素的一致性, τ 分为三种计算方式: τ A τ B τ C 。本文选择的计算方式为 τ B

    假设2个随机变量分别为 X Y ,它们的元素个数均为 N ,2个随机变量取的第 i ( 1 i N ) 个值分别用 X i Y i 表示。 X Y 中的对应元素组成一个元素对集合 X Y = ( X i , Y i ) 1 i N 。当集合 X Y 中任意两个元素 ( X i , Y i ) ( X j , Y j ) 的排行相同时(也就是说当出现情况1或2时;情况1: X i > X j Y i > Y j ,情况2: X i < X j Y i < Y j ),这两个元素就被认为是一致的。当出现情况3或4时(情况3: X i > X j Y i < Y j ,情况4: X i < X j Y i > Y j ),这两个元素被认为是不一致的。当出现情况5或6时(情况5: X i = X j ,情况6: Y i = Y j ),这两个元素既不是一致的,也不是不一致的。 τ B 计算公式为

    τ B C - D ( N 3 - N 1 ) ( N 3 - N 2 )
    (4)

    式中, C 表示 X Y 中更拥有一致性元素的对数; D 表示 X Y 中更拥有不一致性元素的对数; N 3 = n n - 1 2 N 2 = j = 1 t u j ( u j - 1 ) 2 N 1 = i = 1 s t i ( t i - 1 ) 2 N1N2分别针对 X Y 进行计算,现在以计算N1为例,将 X 中的相同元素分别组合成小集合,s表示集合X中拥有的小集合数,ti表示第i个小集合所包含的元素数。同理N2可在集合Y计算而得。

    鉴于两个排名中可能存在拥有相同排名的用户,本文用 τ B 计算SocialCreditRank与其他节点重要性指标排序结果相关性,发现SocialCreditRank与紧密度中心性的排序结果相关性为0.446,与PageRank的排序结果相关性为0.855,且与这两个用户影响力排序结果都具有显著性水平0.01的强正相关性。

  • 4.2.2 SocialCreditRank与PageRank、Closeness中心性用户影响力强度实验结果对比

    4.2.2

    本文采用与信息检索相类似的评估方法对算法进行评估,根据对意见领袖的识别效果判断算法的有效性,让网络中的用户对其他用户投票选出真正的意见领袖,然后将真正的意见领袖与根据Social-CreditRank、PageRank和Closeness中心性三种方法得到的前n位用户进行对比,以识别真正意见领袖的准确性判断影响力算法的有效性:

    排名前n个用户中的准确率ACn

    A C n = n n
    (5)

    排名前n个用户中的平均准确率AvgACn

    A v g A C n = i = 1 n A C 1 n
    (6)

    为了评估本文提出的用户影响力评估方法,本文对比了以下3种方法。

    (1)SocialCreditRank:本文提出的用户影响力评估方法。

    (2)PageRank:根据相连用户的影响力评估用户的影响力。

    (3)Closeness中心性:根据用户到网络中方其他节点的距离评价用户的影响力。

    1给出了通过SocialCreditRank方法获得的排名前5的用户,以及他们根据PageRank和Closeness中心性算法获得的影响力强度排名。由于用户User053的好友数量相交其他4位用户较少,导致在PageRank和Closeness中的排名较低,但RCUser053=3(RCU03表示用户User053的信用分在其好友中的排名),而RCUser01=5,RCUser019=6,RCUser054=10,RCUser050=4,SocialCreditRank算法加入了好友相互之间的信用分对其贡献度进行了修正,提高了用户User053的排名。

    表1 SocialCreditRank排名前5的用户及在PageRankCloseness中心性影响力强度计算中的排名

    用户User001User019User053User054User050
    SocialCreditRank12345
    PageRank13625
    Closeness14576
    表1
                    SocialCreditRank排名前5的用户及在PageRank和Closeness中心性影响力强度计算中的排名

    通过Ucinet对用户网络进行可视化,可视化结果如图5所示。可以发现用户User001、User019和 User053等用户在网络中拥有大量的连接关系,说明他们在网络中处于重要地位,与SocialCreditRank结果一致。通过这些用户可以较快的将信息传播到整个网络中。

    图5
                            用户关系网络图

    图5 用户关系网络图

    SocialCreditRank、PageRank和Closeness中心性三种用户影响力指标计算得到的前50位用户中真正意见领袖的数量以及根据公式(6)计算得到的平均准确率如表2所示。从表2中可以看出SocialCredit-Rank在识别真正意见领袖的数量和准确率上都优于其他两种影响力排序方法。这是由于SocialCredit-Rank不仅还融入了用户在网络中的紧密度特征,还融入了用户与好友之间的个人信用特征。

    SocialCreditRank、PageRank和Closeness中心性三种方法影响力排名前50名用户的真正意见领袖识别平均准确率变化曲线如图6所示。纵坐标表示平均准确率,横坐标表示排名前50位用户。

    如图6所示,随着用户数量增大,三种方法的准确性总体趋于收敛。Closeness中心性在排名靠前的用户中准确率较高,但随着用户数量的增加识别真正意见领袖的准确率越来越低。而PageRank方法则相反,在排名靠前的用户中准确率较低,但当用户数量增大时准确率恢复到一个较高的水平。Social-CreditRank方法的准确率整体保持在一个较高的水平,总体优于PageRank和Closeness。

    表2 三种方法影响力排名前50位用户中真正意见领袖的数量以及这它们的平均准确率

    方法识别意见领袖数平均准确率
    SocialCreditRank3068.03%
    PageRank2862.44%
    Closeness2561.46%
    表2
                    三种方法影响力排名前50位用户中真正意见领袖的数量以及这它们的平均准确率
    图6
                            前50个结果意见领袖准确率变化曲线

    图6 前50个结果意见领袖准确率变化曲线

  • 5 结束语

    5

    随着社交平台的日益普及,网络中的意见领袖对信息传播的作用越来越明显,寻找网络中的意见领袖可以快速掌握网络动态。本文提出了一种基于用户紧密度中心性与用户信用融合的电商化社会关系网络中用户影响力强度计算模型,用于寻找网络中影响力较高的意见领袖。实验表明相比于一般的用户影响力强度计算方法,本文提出的方法在识别网络中意见领袖方面具有更加良好的表现。在未来的工作中本文提出的影响力强度计算模型还有可以改进之处,本文将拥有直接关系的好友之间的距离取值为1,但不同好友之间的关系强度都是不一样的,所以用户之间的距离可以更加具体化。此外,真正意见领袖识别的准确率仍有很大的提升空间,因此还可以将更多的用户属性作为影响因素研究用户影响力。

  • 参 考 文 献

    • 1

      樊兴华, 赵静, 方滨兴, 等. 影响力扩散概率模型及其用于意见领袖发现研究[J]. 计算机学报, 2013, 36(2): 360-367.

    • 2

      Lazarsfeld P F, Berelson B, Gaudet H. The people’s choice[J]. Eco-Architecture: Harmonisation between Architecture and Nature, 1944, 18(1): 154.

    • 3

      Aral S, Walker D. Identifying influential and susceptible members of social networks[J]. Science, 2012, 337(6092): 337.

    • 4

      马茜, 马军. 在影响力最大化问题中寻找种子节点的替补节点[J]. 计算机学报, 2017, 40(3): 674-686.

    • 5

      Goyal A, Bonchi F, Lakshmanan L V S. Learning influence probabilities in social networks[C]// Proceedings of the Third International Conference on Web Search and Web Data Mining. New York: ACM Press, 2010: 241-250.

    • 6

      Tang J, Sun J M, Wang C, et al. Social influence analysis in large-scale networks[C]// Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2009: 807-816.

    • 7

      Page L, Brin S, Motwani R, et al. The PageRank citation ranking: Bringing order to the Web[R]. Stanford University, 1998.

    • 8

      Weng J, Lim E P, Jiang J, et al. TwitterRank: finding topic-sensitive influential twitterers[C]// Proceedings of the ACM International Conference on Web Search and Data Mining. New York: ACM Press, 2010: 261-270.

    • 9

      Kleinberg J M. Authoritative sources in a hyperlinked environment[J]. Journal of the ACM, 1999, 46(5): 604-632.

    • 10

      Cha M, Haddadi H, Benevenuto F, et al. Measuring user influence in Twitter: The million follower fallacy[C]// Proceedings of the International Conference on Weblogs and Social Media. Palo Alto: AAAI Press, 2010.

    • 11

      Brandes U. A faster algorithm for betweenness centrality[J]. The Journal of Mathematical Sociology, 2001, 25(2): 163-177.

    • 12

      Zhang Y C, Liu Y, Cheng H, et al. A method of measuring user influence in MicroBlog[J]. Journal of Convergence Information Technology, 2011, 6(10): 243-250.

    • 13

      顾洁, 胡安安, 刘旭, 等. 社交网络正、负影响力计算——基于符号网络的PageRank算法改进[J]. 情报学报, 2015, 34(7): 725-733.

    • 14

      何军, 刘业政. 基于社交关系和影响力的在线社交网络用户兴趣偏好获取方法研究[J]. 情报学报, 2014, 33(7): 730-739.

    • 15

      司夏萌, 刘云. 虚拟社区中人际交互行为的统计分析研究[J]. 物理学报, 2011, 60(7): 859-866.

    • 16

      Katz E, Lazarsfeld P F, Roper E. Personal influence: the part played by people in the flow of mass communications[J]. American Journal of Sociology, 1956, 62(1): 1583-1583.

    • 17

      李阅志, 祝园园, 钟鸣. 基于k-核过滤的社交网络影响最大化算法[J]. 计算机应用, 2018, 38(2): 464-470.

    • 18

      周飞, 高茂庭. 基于PageRank的网络社区意见领袖发现算法[J]. 计算机工程, 2018, 44(2): 203-209.

    • 19

      Freeman L C. Centrality in social networks conceptual clarification[J]. Social Networks, 1979, 1(3): 215-239.

琚春华

机 构:

1. 浙江工商大学现代商贸研究中心,杭州 310018

2. 浙江工商大学管理工程与电子商务学院,杭州 310018

Affiliation:

1. Department of Modern Business Research Center, Zhejiang Gongshang University, Hangzhou 310018

2. School of Management Science & Engineering, Zhejiang Gongshang University, Hangzhou 310018

作者简介:琚春华,男,1962年生,博士,教授,博士生导师,主要研究领域为数据挖掘与商务智能

赵凯迪

机 构:浙江工商大学管理工程与电子商务学院,杭州 310018

Affiliation:School of Management Science & Engineering, Zhejiang Gongshang University, Hangzhou 310018

作者简介:赵凯迪,男,1993年生,硕士研究生,主要研究领域为电子商务与数据挖掘

鲍福光

机 构:

1. 浙江工商大学现代商贸研究中心,杭州 310018

2. 浙江工商大学管理工程与电子商务学院,杭州 310018

Affiliation:

1. Department of Modern Business Research Center, Zhejiang Gongshang University, Hangzhou 310018

2. School of Management Science & Engineering, Zhejiang Gongshang University, Hangzhou 310018

邮 箱:baofuguang@126.com

作者简介:鲍福光,男,1986年生,博士,讲师,主要研究领域为电子商务与数据挖掘,E-mail:baofuguang@126.com。

车 尧

角 色:责任编辑

Role:Executive editor

1000-0135-2019-02-170/alternativeImage/337ee41d-593b-48cd-a112-a9e99711d712-F001.jpg
1000-0135-2019-02-170/alternativeImage/337ee41d-593b-48cd-a112-a9e99711d712-F002.jpg
1000-0135-2019-02-170/alternativeImage/337ee41d-593b-48cd-a112-a9e99711d712-F003.jpg
1000-0135-2019-02-170/alternativeImage/337ee41d-593b-48cd-a112-a9e99711d712-F004.jpg
用户User001User019User053User054User050
SocialCreditRank12345
PageRank13625
Closeness14576
1000-0135-2019-02-170/alternativeImage/337ee41d-593b-48cd-a112-a9e99711d712-F005.jpg
1000-0135-2019-02-170/alternativeImage/337ee41d-593b-48cd-a112-a9e99711d712-F006.jpg
方法识别意见领袖数平均准确率
SocialCreditRank3068.03%
PageRank2862.44%
Closeness2561.46%

图1 用户影响力强度计算模型

图2 用户SocialCreditRank结果图

图3 SocialCreditRank与PageRank排序结果关系图

图4 SocialCreditRank与Closeness排序结果关系图

表1 SocialCreditRank排名前5的用户及在PageRankCloseness中心性影响力强度计算中的排名

图5 用户关系网络图

图6 前50个结果意见领袖准确率变化曲线

表2 三种方法影响力排名前50位用户中真正意见领袖的数量以及这它们的平均准确率

image /

无注解

无注解

无注解

无注解

无注解

无注解

无注解

无注解

  • 参 考 文 献

    • 1

      樊兴华, 赵静, 方滨兴, 等. 影响力扩散概率模型及其用于意见领袖发现研究[J]. 计算机学报, 2013, 36(2): 360-367.

    • 2

      Lazarsfeld P F, Berelson B, Gaudet H. The people’s choice[J]. Eco-Architecture: Harmonisation between Architecture and Nature, 1944, 18(1): 154.

    • 3

      Aral S, Walker D. Identifying influential and susceptible members of social networks[J]. Science, 2012, 337(6092): 337.

    • 4

      马茜, 马军. 在影响力最大化问题中寻找种子节点的替补节点[J]. 计算机学报, 2017, 40(3): 674-686.

    • 5

      Goyal A, Bonchi F, Lakshmanan L V S. Learning influence probabilities in social networks[C]// Proceedings of the Third International Conference on Web Search and Web Data Mining. New York: ACM Press, 2010: 241-250.

    • 6

      Tang J, Sun J M, Wang C, et al. Social influence analysis in large-scale networks[C]// Proceedings of the ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2009: 807-816.

    • 7

      Page L, Brin S, Motwani R, et al. The PageRank citation ranking: Bringing order to the Web[R]. Stanford University, 1998.

    • 8

      Weng J, Lim E P, Jiang J, et al. TwitterRank: finding topic-sensitive influential twitterers[C]// Proceedings of the ACM International Conference on Web Search and Data Mining. New York: ACM Press, 2010: 261-270.

    • 9

      Kleinberg J M. Authoritative sources in a hyperlinked environment[J]. Journal of the ACM, 1999, 46(5): 604-632.

    • 10

      Cha M, Haddadi H, Benevenuto F, et al. Measuring user influence in Twitter: The million follower fallacy[C]// Proceedings of the International Conference on Weblogs and Social Media. Palo Alto: AAAI Press, 2010.

    • 11

      Brandes U. A faster algorithm for betweenness centrality[J]. The Journal of Mathematical Sociology, 2001, 25(2): 163-177.

    • 12

      Zhang Y C, Liu Y, Cheng H, et al. A method of measuring user influence in MicroBlog[J]. Journal of Convergence Information Technology, 2011, 6(10): 243-250.

    • 13

      顾洁, 胡安安, 刘旭, 等. 社交网络正、负影响力计算——基于符号网络的PageRank算法改进[J]. 情报学报, 2015, 34(7): 725-733.

    • 14

      何军, 刘业政. 基于社交关系和影响力的在线社交网络用户兴趣偏好获取方法研究[J]. 情报学报, 2014, 33(7): 730-739.

    • 15

      司夏萌, 刘云. 虚拟社区中人际交互行为的统计分析研究[J]. 物理学报, 2011, 60(7): 859-866.

    • 16

      Katz E, Lazarsfeld P F, Roper E. Personal influence: the part played by people in the flow of mass communications[J]. American Journal of Sociology, 1956, 62(1): 1583-1583.

    • 17

      李阅志, 祝园园, 钟鸣. 基于k-核过滤的社交网络影响最大化算法[J]. 计算机应用, 2018, 38(2): 464-470.

    • 18

      周飞, 高茂庭. 基于PageRank的网络社区意见领袖发现算法[J]. 计算机工程, 2018, 44(2): 203-209.

    • 19

      Freeman L C. Centrality in social networks conceptual clarification[J]. Social Networks, 1979, 1(3): 215-239.