网络用户评论的情感分歧度量化算法研究
徐健, 吴思洋
中山大学资讯管理学院,广州 510006
The Quantitative Algorithm of Sentiment Divergence Based on Web User Reviews
Xu Jian, Wu Siyang
School of Information Management, Sun Yat-sen University, Guangzhou 510006
摘要 从情感分歧角度出发,为网络用户评论情感分析提供新的研究方法和视角。借鉴已有的5种差异度、离散度计算公式,融入情感元素,应用于情感分歧度计算场景,分别得到基于情感值差、标准差、变异系数、信息熵、情感分布概率的5种情感分歧度量化算法,并且基于情感的正负值特点,提出基于正负情感比值的情感分歧度量化方法。在网络用户评论情感分析的基础上,利用这6种情感分歧度量化算法对用户评论进行情感分歧度量化,并对各种情感分歧度算法量化结果进行对比分析。实验结果表明,情感分歧度量化算法可实现对网络用户评论情感分歧度的量化;不同分歧度量化算法在适用性和区分度等方面的特点存在差异。
关键词 :
情感分析 ,
情感分歧度 ,
电影评论 ,
量化算法
收稿日期: 2019-03-23
基金资助: 广东省自然科学基金项目“情感分歧度量化模型及其应用研究”(2018A030313981)。
作者简介 : 徐健,男,1977年生,博士,副教授,硕士生导师,主要研究领域为情感分析、科学计量,E-mail:issxj@mail.sysu.edu.cn
1 黄卫东, 陈凌云, 吴美蓉. 网络舆情话题情感演化研究[J]. 情报杂志, 2014, 33(1): 102-107. 2 张紫琼, 叶强, 李一军. 互联网商品评论情感分析研究综述[J]. 管理科学学报, 2010, 13(6): 84-96. 3 宋恩梅, 何帆. 基于多网站的商品评论倾向性研究: 以手机为例[J]. 图书馆学研究, 2016(2): 85-92. 4 郑飏飏, 徐健, 肖卓. 情感分析及可视化方法在网络视频弹幕数据分析中的应用[J]. 现代图书情报技术, 2015(11): 82-90. 5 王英, 龚花萍. 基于情感维度的大数据网络舆情情感倾向性分析研究——以“南昌大学自主保洁”微博舆情事件为例[J]. 情报科学, 2017, 35(4): 37-42. 6 姜国华. 关于证券分析师对中国上市公司会计收益预测的实证研究[J]. 经济科学, 2004(6): 72-79. 7 白晓宇. 上市公司信息披露政策对分析师预测的多重影响研究[J]. 金融研究, 2009(4): 92-112. 8 AvramovD, ChordiaT, JostovaG, et al. Dispersion in analysts’ earnings forecasts and credit rating[J]. Journal of Financial Economics, 2009, 91(1): 83-101. 9 王玉涛, 王彦超. 业绩预告信息对分析师预测行为有影响吗[J]. 金融研究, 2012(6): 193-206. 10 HarjotoM, JoH. Legal vs. Normative CSR: Differential impact on analyst dispersion, stock return volatility, cost of capital, and firm value[J]. Journal of Business Ethics, 2015, 128(1): 1-20. 11 BarronO E, StanfordM H, YuY. Further evidence on the relation between analysts’ forecast dispersion and stock returns[J]. Contemporary Accounting Research, 2009, 26(2): 329-357. 12 TirasS L. The influence of forecast dispersion on the incremental explanatory power of earnings, book value and analyst forecasts on market prices[J]. Accounting Review, 2007, 82(3): 651-677. 13 LiM Y, WuJ S. Analysts’ forecast dispersion and stock returns: A quantile regression approach[J]. Journal of Behavioral Finance, 2014, 15(3): 175-183. 14 尹慧, 赵国庆. 异质信念与投资风险[J]. 金融经济学研究, 2013, 28(1): 46-58. 15 张立凡, 赵凯. 媒体干预下带有讨论机制的网络舆情传播模型研究[J]. 现代图书情报技术, 2015(11): 60-67. 16 CaoN, LuL, LinY R, et al. SocialHelix: Visual analysis of sentiment divergence in social media[J]. Journal of Visualization, 2015, 18(2): 221-235. 17 ZhangZ, LiX, ChenY. Deciphering word-of-mouth in social media: Text-based metrics of consumer reviews[J]. ACM Transactions on Management Information Systems, 2012, 3(1): Article No. 5. 18 Suba?i?I, BerendtB. Peddling or creating? Investigating the role of Twitter in news reporting[C]// Proceedings of the European Conference on Information Retrieval. Heidelberg: Springer, 2011, 6611: 207-213. 19 SiganosA, Vagenas-NanosE, VerwijmerenP. Divergence of sentiment and stock market trading[J]. Journal of Banking & Finance, 2017, 78: 130-141. 20 TangE K, SuganthanP N, YaoX. An analysis of diversity measures[J]. Machine Learning, 2006, 65(1): 247-271. 21 巴志超, 李纲, 朱世伟. 科研合作网络的知识扩散机理研究[J].中国图书馆学报, 2016, 42(5): 68-84. 22 李纲, 巴志超. 科研合作超网络下的知识扩散演化模型研究[J]. 情报学报, 2017, 36(3): 274-284. 23 杨思洛, 程爱娟. 图情档期刊论文的零被引现象分析[J]. 情报学报, 2015, 34(3): 247-256. 24 ShannonC E. A mathematical theory of communication[J] ACM SIGMOBILE Mobile Computing and Communications Review, 2001, 5(1). 25 张慧玲, 许海云, 刘春江. 学科交叉期刊的识别方法研究[J]. 情报学报, 2018, 37(11): 1140-1153. 26 KohaviR, WolpertD. Bias plus variance decomposition for zero-one loss functions[C]// Proceedings of the Thirteenth International Conference on International Conference on Machine Learning. Morgan Kaufmann Publishers Inc., 1996: 275-283. 27 徐琳宏, 林鸿飞, 潘宇, 等. 情感词汇本体的构造[J]. 情报学报, 2008, 27(2): 180-185. 28 结巴分词组件[EB/OL]. [2019-01-08]. https://github.com/fxsjy/jieba. 29 弹幕多维情感词典[DB/OL]. (2015-06-07) [2019-01-08]. https://wenku.baidu.com/view/22191501b9d528ea81c779dd.html.
[1]
马捷, 郝志远. 机器学习视域下融合情感元素的社交网络信息交互度量化分析 [J]. 情报学报, 2021, 40(7): 687-696.
[2]
范涛, 吴鹏, 王昊, 凌晨. 基于多模态联合注意力机制的网民情感分析研究 [J]. 情报学报, 2021, 40(6): 656-665.
[3]
李江波, 张梁, 姜春林. Altmetrics 视角下的人文社会科学学术专著影响力评价研究——基于BkCI 、Amazon 和Goodreads 的比较分析 [J]. 情报学报, 2020, 39(9): 896-905.
[4]
余传明, 郑智梁, 朱星宇, 安璐. 面向查询的观点摘要模型研究:以Debatepedia 为数据源 [J]. 情报学报, 2020, 39(4): 374-386.
[5]
贾丹萍, 靳健, 耿骞, 邓斯予. 感性工学视角下的用户需求挖掘研究 [J]. 情报学报, 2020, 39(3): 308-316.
[6]
徐琳宏, 丁堃, 陈娜, 李冰. 中文文献引文情感语料库构建 [J]. 情报学报, 2020, 39(1): 25-37.
[7]
周建, 刘炎宝, 刘佳佳. 情感分析研究的知识结构及热点前沿探析 [J]. 情报学报, 2020, 39(1): 111-124.
[8]
陈璟浩, 曾桢, 李纲. 城市网络形象监测系统的设计与实现 [J]. 情报学报, 2019, 38(3): 299-309.
[9]
李吉, 黄微, 郭苏琳, 孙悦. 网络口碑舆情情感强度测度模型研究——基于PAD 三维情感模型 [J]. 情报学报, 2019, 38(3): 277-285.
[10]
章成志, 童甜甜, 周清清. 整合不同评论平台的图书综合影响力评价研究 [J]. 情报学报, 2018, 37(9): 861-873.
[11]
吴鹏, 应杨, 沈思. 基于双向长短期记忆模型的网民负面情感分类研究 [J]. 情报学报, 2018, 37(8): 845-853.