多维度融合的文献作者亲密度计算
侯湘1,2 , 黄晋3 , 桑军3 , 夏晓峰3
1.重庆大学期刊社,重庆 400044 2.重庆大学自动化学院,重庆 400044 3.重庆大学大数据与软件学院,重庆 400044
Calculation of Author Intimacy Based on Multi-Dimensional Fusion
Hou Xiang1,2 , Huang Jin3 , Sang Jun3 , Xia Xiaofeng3
1.Journal Department, Chongqing University, Chongqing 400044 2.College of Automation, Chongqing University, Chongqing 400044 3.College of Big Data and Software, Chongqing University, Chongqing 400044
摘要 为了学术成果在不同论文作者和研究团队之间便捷交流和精准推送,需建立合理有效的学术社交网络(academic social networking,ASN),本文针对目前中文学术数据库平台尚未建立成熟的、基于文献引用的作者社交网络进行社区交互问题,以CNKI(China National Knowledge Infrastructure)数据源,某大学软件工程及信息安全学科领域的教授A及有合著或引用关系的122位作者在2014—2020年的文献数据为研究对象,构建学术作者引用网络。结合学术社交的特点,对作者、论文及引用数据进行挖掘,提出合著作者(co-author)、学科主题(subject topic)、基于学科敏感度的文献引用(sensitivity-citation)和图谱社交网络(social graph)4个维度的亲密度计算方法,加权得到网络中作者间的综合亲密度值。本文通过综合亲密度值建立作者关系图谱,得到作者在网络中的亲密度水平(author_degree),用亲密度水平值与发文数量相乘得到作者的网络水平(author_weight),找出图谱中相同研究水平的作者及研究团队,为学术社交网络数据推送打好基础。
关键词 :
学术社交网络 ,
文献引用 ,
亲密度 ,
多维度融合 ,
图谱
收稿日期: 2021-01-13
基金资助: 重庆市社会科学基金项目“重庆高校科技期刊助推高校‘双一流’建设的探索研究”(2020YBTQ130);中国高校科技期刊研究会“一流高校科技期刊建设”专项基金项目(CUJS-ZX-2021-005)。
作者简介 : 侯湘,女,1982年生,博士,主要研究领域为数据挖掘、科技期刊出版,E-mail:15394488@qq.com;黄晋,女,1998年生,硕士,主要研究领域为数据挖掘、信息安全;桑军,男,1968年生,教授,博士生导师,主要研究领域为数据挖掘、信息安全;夏晓峰,男,1980年生,副教授,硕士生导师,主要研究领域为数据挖掘、信息安;
引用本文:
侯湘, 黄晋, 桑军, 夏晓峰. 多维度融合的文献作者亲密度计算[J]. 情报学报, 2021, 40(8): 846-853.
Hou Xiang, Huang Jin, Sang Jun, Xia Xiaofeng. Calculation of Author Intimacy Based on Multi-Dimensional Fusion. 情报学报, 2021, 40(8): 846-853.
链接本文:
https://qbxb.istic.ac.cn/CN/10.3772/j.issn.1000-0135.2021.08.005 或 https://qbxb.istic.ac.cn/CN/Y2021/V40/I8/846
1 贾新露, 王曰芬. 学术社交网络的概念、特点及研究热点[J]. 图书馆学研究, 2016(5): 7-13. 2 赵杨, 李露琪. 国内外学术社交网络研究现状述评与思考[J]. 情报资料工作, 2016(6): 41-47. 3 周庆山, 杨志维. 学术社交网络用户行为研究进展[J]. 图书情报工作, 2017, 61(16): 38-47. 4 田依林, 刘平平. 合著型论文对学术期刊影响力的贡献度评价研究[J]. 中国科技期刊研究, 2020, 31(6): 725-730. 5 王江盼, 郭强, 刘建国. 基于PageRank的合著论文中作者贡献分配算法[J]. 电子科技大学学报, 2020, 49(6): 918-923. 6 任妮, 周建农. 合著网络加权模式下科研团队的发现与评价研究[J]. 现代图书情报技术, 2015, 31(9): 68-75. 7 卿雅娴, 李锐, 吴华意. 基于论文合著网络的学术社区分析方法研究——以《美国地理学家联合会会刊》为例[J]. 数据分析与知识发现, 2017, 1(4): 20-29. 8 唐璞妮. 基于引文分布与作者合著的学者p指数改进研究[J]. 情报理论与实践, 2020, 43(5): 99-103. 9 琚春华, 陶婉琼, 马希骜. 基于关系圈与个体交互习惯的用户关系强度计算方法[J]. 情报学报, 2019, 38(9): 974-987. 10 于岩, 陈鸿昶, 于洪涛. 基于霍克斯过程的社交网络用户关系强度模型[J]. 电子学报, 2016, 44(6): 1362-1368. 11 孙怡帆, 李赛. 基于相似度的微博社交网络的社区发现方法[J]. 计算机研究与发展, 2014, 51(12): 2797-2807. 12 Ju C H, Tao W Q. A novel relationship strength model for online social networks[J]. Multimedia Tools and Applications, 2017, 76(16): 17577-17594. 13 琚春华, 陈彦, 鲍福光. 融入网络结构与社交习惯的不对称用户关系强度计算[J]. 系统工程理论与实践, 2018, 38(8): 2135-2146. 14 Zhou T, Lü L, Zhang Y C. Predicting missing links via local information[J]. The European Physical Journal B, 2009, 71(4): 623-630. 15 桑军, 樊芳, 夏晓峰, 等. 社交网络基于邻居结点亲密度的信息流控制[J]. 重庆大学学报, 2018, 41(1): 70-77. 16 谷俊, 许鑫. 人文社科数据共享模型的设计与实现——以联盟链技术为例[J]. 情报学报, 2019, 38(4): 354-367. 17 王柳, 汤庸, 杨佐希, 等. 基于学者社交网络的论文与项目关联模型[J]. 计算机应用研究, 2020, 37(5): 1428-1431. 18 Grover A, Leskovec J. node2vec: scalable feature learning for networks[C]// Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM Press, 2016: 855-864. 19 Garlaschelli D, Loffredo M I. Patterns of link reciprocity in directed networks[J]. Physical Review Letters, 2004, 93(26): 268701. 20 Bordes A, Usunier N, Garcia-Durán A, et al. Translating embeddings for modeling multi-relational data[C]// Proceedings of 26th International Conference on Neural Information Processing Systems. Red Hook: Curran Associates, 2013, 2: 2787-2795. 21 Wang Z, Zhang J W, Feng J L, et al. Knowledge graph embedding by translating on hyperplanes[C]// Proceedings of the Tweviy-Eighth AAAI Conforence on Artificial Intelligence. Palo Alto: AAAI Press, 2014: 1112-1119.
[1]
张海涛, 周红磊, 李佳玮, 张鑫蕊. 信息不完全状态下重大突发事件态势感知研究 [J]. 情报学报, 2021, 40(9): 903-913.
[2]
张海涛, 刘伟利, 栾宇, 刘嫣. 重大突发事件的情景图谱构建 [J]. 情报学报, 2021, 40(9): 924-933.
[3]
张海涛, 李佳玮, 周红磊, 栾宇. 重大突发事件演变机制:认知框架与理论方法 [J]. 情报学报, 2021, 40(9): 914-923.
[4]
冯立杰, 尤鸿宇, 王金凤. 专利技术创新路径识别及其新颖性评价研究 [J]. 情报学报, 2021, 40(5): 513-522.
[5]
李纲, 王施运, 毛进, 李白杨. 面向态势感知的国家安全事件图谱构建研究 [J]. 情报学报, 2021, 40(11): 1164-1175.
[6]
杜建, 孔桂兰, 李鹏飞, 白永梅, 张路霞. 可计算医学知识的基本概念与实现路径 [J]. 情报学报, 2021, 40(11): 1221-1233.
[7]
张宁, 袁勤俭, 朱庆华. 学术社交网络平台管控对用户感知信息质量的影响——来自ResearchGate 全球用户的实证研究 [J]. 情报学报, 2020, 39(8): 829-844.
[8]
曹高辉, 任卫强, 丁恒. 面向限定域的深度语义事件泛化研究 [J]. 情报学报, 2020, 39(8): 863-871.
[9]
徐璐璐, 杜建, 叶鹰. 21 世纪以来医学信息学研究走向及其健康信息学转向 [J]. 情报学报, 2020, 39(7): 777-794.
[10]
顾秀丽, 黄颖, 孙蓓蓓, 张琳. 图书情报领域中的交叉科学研究:进展与展望 [J]. 情报学报, 2020, 39(5): 478-491.
[11]
王兰成. 多学科视域网络舆情知识图谱研究的现状和展望 [J]. 情报学报, 2020, 39(10): 1104-1113.
[12]
林杰, 苗润生. 专业社交媒体中的主题图谱构建方法研究——以汽车论坛为例 [J]. 情报学报, 2020, 39(1): 68-80.
[13]
刘雅姝, 张海涛, 徐海玲, 魏萍. 多维特征融合的网络舆情突发事件演化话题图谱研究 [J]. 情报学报, 2019, 38(8): 798-806.
[14]
刘志辉, 魏娟霞, 张均胜. 基于知识图谱的科技创新指标自适应计算方法研究 [J]. 情报学报, 2019, 38(8): 826-837.
[15]
胡昌平, 仇蓉蓉, 王丽丽. 学术社交网络用户的隐私保护研究——以科学网博客为例 [J]. 情报学报, 2019, 38(7): 667-674.