基于学术关键词与共被引的学者推荐研究
熊回香, 李晓敏, 杜瑾
华中师范大学信息管理学院,武汉 430079
Scholar Recommendation Research Based on Academic Keywords and Co-citation
Xiong Huixiang, Li Xiaomin, Du Jin
School of Information Management, Central China Normal University, Wuhan 430079
摘要 学术数据的激增出现信息过载现象,对科研用户造成一定的负担,研究学者推荐能够提高科研效率,便于顺利开展科学研究。本文构建了一种基于组合相似度计算的个性化学者推荐模型,组合相似度计算包括基于学者特征词相似度计算和基于学者共被引相似度计算。前者考虑的是学者基于研究内容的相似性,而后者考虑的是学者基于共被引关系的相似性。同时,以CSSCI(Chinese Social Sciences Citation Index)数据库和CNKI(China National Knowledge Infrastructure)中的数据进行模型验证,并且利用精确率、召回率和F值进行推荐效果评测。实验结果表明,本文提出的推荐模型取得了较好的结果,即能为目标学者推荐研究兴趣相似的学者,促进学术沟通。
关键词 :
学者推荐 ,
特征词 ,
共被引 ,
word2vec ,
Spearman相关系数
收稿日期: 2020-06-04
基金资助: 国家社会科学基金项目“融合知识图谱和深度学习的在线学术资源挖掘与推荐研究”(19BTQ005)。
作者简介 : 熊回香,女,1966年生,博士,教授,博士生导师,主要研究方向为网络信息组织与检索,E-mail:hxxiong@mail.ccnu.edu.cn;李晓敏,女,1996年生,硕士研究生,主要研究方向为网络信息组织与检索;杜瑾,女,1997年生,硕士研究生,主要研究方向为网络信息组织与检;
1 Xia F, Wang W, Bekele T M, et al. Big scholarly data: a survey[J]. IEEE Transactions on Big Data, 2017, 3(1): 18-35. 2 王伟. 基于学术大数据的科学家合作行为分析与挖掘[D]. 大连: 大连理工大学, 2018. 3 熊回香, 杨雪萍, 蒋武轩, 等. 基于学术能力及合作关系网络的学者推荐研究[J]. 情报科学, 2019, 37(5): 71-78. 4 李响, 谭静. 融合相关性与多样性的学术论文推荐方法研究[J]. 情报理论与实践, 2017, 40(6): 99-103. 5 刘萍, 郑凯伦, 邹德安. 基于LDA模型的科研合作推荐研究[J]. 情报理论与实践, 2015, 38(9): 79-85. 6 蒲姗姗. 基于知识互补的科研合作专家推荐模型研究[J]. 情报理论与实践, 2018, 41(8): 96-101. 7 Tang J, Wu S, Sun J, et al. Cross-domain collaboration recommendation[C]// Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data mining. New York: ACM Press, 2012: 1285-1293. 8 李仲, 韩红旗, 吴广印, 等. 基于文本稀疏分布式表征的学术合作推荐[J]. 情报科学, 2019, 37(6): 113-118. 9 Fang H, Zhai C X. Probabilistic models for expert finding[C]// Proceedings of the European Conference on Information Retrieval. Heidelberg: Springer, 2007: 418-430. 10 张金柱, 于文倩, 刘菁婕, 等. 基于网络表示学习的科研合作预测研究[J]. 情报学报, 2018, 37(2): 132-139. 11 余传明, 林奥琛, 钟韵辞, 等. 基于网络表示学习的科研合作推荐研究[J]. 情报学报, 2019, 38(5): 500-511. 12 熊回香, 李跃艳. 基于Word2Vec的学者推荐与跨语言论文推荐模型研究[J]. 情报科学, 2019, 37(12): 19-26. 13 朱云霞, 魏建香. 基于共引网络的学者间潜在合作机会发现[J]. 西南民族大学学报(人文社科版), 2016, 37(9): 235-240. 14 陈卫静, 郑颖. 基于作者关键词耦合的潜在合作关系挖掘[J]. 情报杂志, 2013, 32(5): 127-131. 15 孙鸿飞, 侯伟. 改进TFIDF算法在潜在合作关系挖掘中的应用研究[J]. 现代图书情报技术, 2014(10): 84-92. 16 张金柱, 韩涛, 王小梅. 作者-关键词二分网络中的合著关系预测研究[J]. 图书情报工作, 2016, 60(21): 74-80. 17 林原, 刘海峰, 王海龙, 等. 基于表示学习的学者间潜在合作机会挖掘[J]. 情报杂志, 2019, 38(5): 65-70. 18 Mikolov T, Sutskever I, Chen K, et al. Distributed representations of words and phrases and their compositionality[C]// Proceedings of the 26th International Conference on Neural Information Processing Systems. Red Hook: Curran Associates, 2013: 3111-3119. 19 赵蓉英, 郭凤娇, 曾宪琴. 基于位置的共被引分析实证研究[J]. 情报学报, 2016, 35(5): 492-500.
[1]
陈翔, 黄璐, 倪兴兴, 刘家润, 曹晓丽, 王长天. 基于动态语义网络分析的主题演化路径识别研究 [J]. 情报学报, 2021, 40(5): 500-512.
[2]
逯万辉, 谭宗颖. 基于深度学习的期刊分群与科学知识结构测度方法研究 [J]. 情报学报, 2020, 39(1): 38-46.
[3]
宋歌. 共被引分析方法迭代创新路径研究 [J]. 情报学报, 2020, 39(1): 12-24.
[4]
卢超, 侯海燕, DingYing, 章成志. 国外新兴研究话题发现研究综述 [J]. 情报学报, 2019, 38(1): 97-110.
[5]
韩青, 周晓英. 基于文献共被引特征的文献相似度计算优化研究 [J]. 情报学报, 2018, 37(9): 905-911.