基于GBDT 的学术会议替代计量学评价模型研究
张洋, 叶月, 张宗翔, 佘芳, 陈析宇
中山大学资讯管理学院,广州 510006
Research on Altmetrics Evaluation Model of Academic Conference Based on GBDT
Zhang Yang, Ye Yue, Zhang Zongxiang, She Fang, Chen Xiyu
School of Information Management, Sun Yat-sen University, Guangzhou 510006
摘要 学术会议作为科学评价的重要研究对象,同时也是传播学术成果的重要载体,它是某个学科发展到一定阶段的必然产物。在某些学科领域,学术会议因其知识传播的时效性,得到了众多学者的青睐。本文收集替代计量学指标Altmetrics.com和PlumX关于人工智能领域国际会议2007—2014年的相关数据,借助描述性统计与梯度提升决策树。通过指标筛选、数据不平衡问题处理、模型优化等步骤,形成一个基于梯度提升决策树的会议评价模型。本文使用新兴的替代计量学指标作为评价指标,同时结合当前热门的机器学习模型,有效地弥补传统文献计量学指标的不足,提升会议评价模型的准确率,丰富会议评价体系的相关研究并可作为后续研究的参考。
关键词 :
替代计量学 ,
机器学习 ,
梯度提升决策树 ,
会议评价
收稿日期: 2018-11-28
基金资助: 国家社会科学基金项目“新型网络环境下学术期刊影响力的计量分析与评价研究”(14BTQ067);广东省软科学研究计划项目“面向粤港澳大湾区的科技评价机制、方法与应用研究”(2018A070712016)。
作者简介 : 张洋,男,1975年生,博士,教授,博士生导师,研究领域为网络信息计量学、科学评价
引用本文:
张洋, 叶月, 张宗翔, 佘芳, 陈析宇. 基于GBDT 的学术会议替代计量学评价模型研究[J]. 情报学报, 2019, 38(11): 1150-1159.
Zhang Yang, Ye Yue, Zhang Zongxiang, She Fang, Chen Xiyu. Research on Altmetrics Evaluation Model of Academic Conference Based on GBDT . 情报学报, 2019, 38(11): 1150-1159.
链接本文:
https://qbxb.istic.ac.cn/CN/10.3772/j.issn.1000-0135.2019.11.003 或 https://qbxb.istic.ac.cn/CN/Y2019/V38/I11/1150
1 ZhuangZ M, ElmaciogluE, LeeD, et al. Measuring conference quality by mining program committee characteristics[C]// Proceedings of the ACM International Conference on Digital Libraries. New York: ACM Press, 2007: 225-234. 2 MartinsW S, Gon?alvesM A, LaenderA H F, et al. Assessing the quality of scientific conferences based on bibliographic citations[J]. Scientometrics, 2010, 83(1): 133-155. 3 NelakuditiS, GrayC, ChoudhuryR R. Snap judgement of publication quality[J]. ACM SIGMOBILE Mobile Computing and Communications Review, 2011, 15(2): 20-23. 4 LoizidesO S, KoutsakisP. On evaluating the quality of a computer science/computer engineering conference[J]. Journal of Informetrics, 2017, 11(2): 541-552. 5 王倩. h指数及其衍生指数在评价学术会议中的应用研究[J]. 科技情报开发与经济, 2015(15): 135-139. 6 肖建华, 霍国庆, 董帅, 等. 基于平衡计分卡的学术会议效果评价指标体系研究[J]. 科学学与科学技术管理, 2009, 30(12): 48-54. 7 张坤, 王文韬, 谢阳群. 机器学习在图书情报领域的应用研究[J]. 图书馆学研究, 2018(1): 47-52. 8 BornmannL. Do altmetrics point to the broader impact of research? An overview of benefits and disadvantages of altmetrics[J]. Journal of Informetrics, 2014, 8(4): 895-903. 9 刘恩涛, 李国俊, 邱小花, 等. Altmetrics工具比较研究[J]. 图书馆杂志, 2015, 34(8): 85-92. 10 邱均平, 余厚强. 论推动替代计量学发展的若干基本问题[J]. 中国图书馆学报, 2015, 41(1): 4-15. 11 MeschedeC, SiebenlistT. Cross-metric compatability and inconsistencies of altmetrics[J]. Scientometrics, 2018, 115(1): 283-297. 12 FriedmanJ H. Greedy function approximation: A gradient boosting machine[J]. Annals of Statistics, 2001, 29(5): 1189-1232. 13 SakrS, AlomariM. A decade of database conferences: A look inside the program committees[J]. Scientometrics, 2012, 91(1): 173-184. 14 EckmannM, RochaA, WainerJ. Relationship between high-quality journals and conferences in computer vision[J]. Scientometrics, 2012, 90(2): 617-630. 15 张洋, 叶月. 基于多指标的学术会议动态评价研究[J]. 数字图书馆论坛, 2018(7): 37-44. 16 Altmetrics.com[EB/OL]. https://www.altmetric.com/. 17 analyticsPlum[EB/OL]. https://plumanalytics.com/learn/about-metrics/. 18 邱均平, 余厚强. 论推动替代计量学发展的若干基本问题[J]. 中国图书馆学报, 2015, 41(1): 4-15. 19 刘恩涛, 李国俊, 邱小花, 等. Altmetrics工具比较研究[J]. 图书馆杂志, 2015, 34(8): 85-92. 20 刘春丽. altmetrics工具与机构知识库的整合与效果——以PlumX为例[J]. 图书情报工作, 2015, 59(24): 39-46. 21 杨柳, 陈铭. 常用替代计量学工具之比较研究[J]. 情报理论与实践, 2015, 38(9): 114-119, 144. 22 俞立平, 刘爱军. 主成分与因子分析在期刊评价中的改进研究[J]. 情报杂志, 2014, 33(12): 94-98. 23 董敏红. 基于主成分分析的图书情报类核心期刊评价指标有效性研究[J]. 情报科学, 2010, 28(11): 1670-1672, 1678. 24 ChawlaN V, BowyerK W, HallL O, et al. SMOTE: Synthetic minority over-sampling technique[J]. Journal of Artificial Intelligence Research, 2002, 16: 321-357. 25 imbalanced-learn[CP/OL]. https://github.com/scikit-learn-contrib/imbalanced-learn. 26 张公让, 万飞. 基于网格搜索的SVM在入侵检测中的应用[J]. 计算机技术与发展, 2016, 26(1): 97-100.
[1]
吴雪华, 毛进, 陈思菁, 谢豪, 李纲. 突发事件应急行动支撑信息的自动识别与分类研究 [J]. 情报学报, 2021, 40(8): 817-830.
[2]
马捷, 郝志远. 机器学习视域下融合情感元素的社交网络信息交互度量化分析 [J]. 情报学报, 2021, 40(7): 687-696.
[3]
黄文彬, 王越千, 步一, 车尚锟. 学术论文子句语义类型自动标注技术研究 [J]. 情报学报, 2021, 40(6): 621-629.
[4]
陈悦, 宋凯, 刘安蓉, 曹晓阳. 基于机器学习的人工智能技术专利数据集构建新策略 [J]. 情报学报, 2021, 40(3): 286-296.
[5]
余厚强, 章玮, 曹雪婷. 学术成果的脸书提及量分布特征研究 [J]. 情报学报, 2021, 40(10): 1079-1091.
[6]
余传明, 李浩男, 安璐. 基于深度学习的领域知识对齐模型研究:知识网络视角 [J]. 情报学报, 2020, 39(5): 521-533.
[7]
余厚强, 曹雪婷, 王曰芬. 新闻替代计量指标的分布特征研究 [J]. 情报学报, 2020, 39(10): 1081-1092.
[8]
何涛, 王桂芳, 马廷灿. 基于类中心向量的论文作者归属机构自动识别方法研究 [J]. 情报学报, 2019, 38(7): 716-721.
[9]
余传明, 林奥琛, 钟韵辞, 安璐. 基于网络表示学习的科研合作推荐研究 [J]. 情报学报, 2019, 38(5): 500-511.
[10]
刘夏, 黄灿, 余骁锋. 基于机器学习模型的专利质量预测初探 [J]. 情报学报, 2019, 38(4): 402-410.
[11]
黄璐, 朱一鹤, 张嶷. 基于加权网络链路预测的新兴技术主题识别研究 [J]. 情报学报, 2019, 38(4): 335-341.
[12]
周源, 刘宇飞, 薛澜. 一种基于机器学习的新兴技术识别方法: 以机器人技术为例 [J]. 情报学报, 2018, 37(9): 939-955.
[13]
余厚强, 王曰芬, 王菲菲, 陈必坤. 科学推文作者行为模式与地理分布研究 [J]. 情报学报, 2018, 37(2): 140-150.