多源数据融合的关键共性技术识别——基于知识图谱和深度学习模型
仲雨乐1 , 姚占雷1,2 , 许鑫1,2
1.华东师范大学经济与管理学院,上海 200062 2.商业分析上海市级实验教学示范中心,上海 200062
Multi-Source Data Fusion for Identification of Key Generic Technology: A Knowledge Graph and Deep Learning-Based Approach
Zhong Yule1 , Yao Zhanlei1,2 , Xu Xin1,2
1.School of Economics and Management, East China Normal University, Shanghai 200062 2.Shanghai Municipal Experimental Teaching Demonstration Center for Business Analytics, Shanghai 200062
摘要 关键共性技术的精准识别是技术创新与发展的关键环节,对产业技术布局和投资决策具有重要意义。本文构建了一套融合多源数据的新型关键共性技术识别方法。首先,围绕关键共性技术的基础特性与关键特征,从通用性、关联性、效益性、基础性和关键性5个维度构建可量化的关键共性技术识别指标体系;其次,整合知识图谱语义表征和检索优势,依托BiLSTM-Attention(bidirectional long short-term memory attention)训练关键共性技术识别模型,采用BERTopic主题聚类归纳形成候选关键共性技术主题清单,进而借助新闻资讯、社交媒体等多源异构数据,引入技术与社会交互影响因素,科学确定关键共性技术;最后,选取电化学储能领域进行实证研究,验证本文方法的有效性。实验结果表明,本文方法能够为各领域的关键共性技术识别提供更具价值的参考,由此进一步科学推动产业战略制定和决策,促进新质生产力形成与发展。
关键词 :
关键共性技术 ,
技术识别 ,
知识图谱 ,
多源数据融合 ,
深度学习
收稿日期: 2024-12-12
基金资助: 上海市人民政府决策咨询华东师范大学研究基地课题“上海推动未来产业高质量发展的创新服务研究”(2023-JD-D04)。
作者简介 : 仲雨乐,2001年生,硕士研究生,主要研究方向为科技情报;姚占雷,通信作者,1987年生,硕士,工程师,主要研究方向为科技情报、数智治理,E-mail:zlyao@infor.ecnu.edu.cn;许鑫,1976年生,博士,教授,博士生导师,主要研究方向为信息分析、情报技术;
1 Liang X, Xie X R. Key generic technology research and development decision-making in Stackelberg competition[J]. AIMS Mathematics, 2023, 8(12): 28833-28857. 2 Li Y Z, Wang J C. Technical development of operational in-situ marine monitoring and research on its key generic technologies in China[J]. Acta Oceanologica Sinica, 2023, 42(10): 117-126. 3 姚占雷, 樊亚鑫, 许鑫. 事件驱动的技术产业化阶段智能识别方法研究[J]. 图书情报工作, 2024, 68(9): 76-88. 4 马永红, 孔令凯, 林超然, 等. 基于专利挖掘的关键共性技术识别研究[J]. 情报学报, 2020, 39(10): 1093-1103. 5 韦景竹, 张桐瑞, 马芷晴. 基于科技报告的关键共性技术识别[J]. 情报杂志, 2025, 44(4): 153-159, 199. 6 陈伟, 林超然, 孔令凯, 等. 基于专利文献挖掘的关键共性技术识别研究[J]. 情报理论与实践, 2020, 43(2): 92-99. 7 单晓红, 郝秀艳, 刘晓燕. 融合技术社会影响力的关键共性技术识别研究[J]. 情报理论与实践, 2022, 45(11): 115-125, 97. 8 苗红, 张惠钊, 林昭颍, 等. 基于专利文本语义距离的跨领域关键共性技术识别方法研究[J]. 情报杂志, 2023, 42(8): 90-95. 9 王秀红, 高敏. 基于BERT-LDA的关键技术识别方法及其实证研究——以农业机器人为例[J]. 图书情报工作, 2021, 65(22): 114-125. 10 付振康, 朱庆华, 柳炳祥, 等. 专利视域下“卡脖子”关键技术识别及突破策略——以OLED技术领域为例[J]. 情报杂志, 2024, 43(5): 106-115. 11 单晓红, 郝秀艳, 刘晓燕. 面向技术多维特征的关键共性技术跨界溢出机理研究[J]. 中国科技论坛, 2024(9): 44-56. 12 虞锡君. 产业集群内关键共性技术的选择——以浙江为例[J]. 科研管理, 2006, 27(1): 80-84. 13 曹旭华, 王富忠, 胡华敏. 浙江省新材料行业关键共性技术的技术预见研究[J]. 科技进步与对策, 2010, 27(16): 46-49. 14 浦墨, 郑彦宁, 赵筱媛, 等. 共性技术识别研究进展[J]. 情报理论与实践, 2014, 37(11): 140-144. 15 李国秋, 范晓婷. 基于专利分析的上汽集团新能源汽车关键技术选择[J]. 现代情报, 2017, 37(10): 122-127, 136. 16 袁思达. 技术预见德尔菲调查中共性技术课题识别研究[J]. 科学学与科学技术管理, 2009, 30(10): 21-26. 17 张乔木. 基于德尔菲调查和聚类分析的关键共性技术预见研究——以山西省新材料行业为例[J]. 科技管理研究, 2017, 37(13): 121-124. 18 郑国雄, 李伟, 刘溉, 等. 基于德尔菲法和层次分析法的“卡脖子”关键技术甄选研究——以生物医药领域为例[J]. 世界科技研究与发展, 2021, 43(3): 331-343. 19 刘静, 胥彦玲, 段菲. 基于PCT专利分析的医药健康产业关键共性技术识别研究[J]. 图书情报导刊, 2023, 8(2): 72-79. 20 刘静, 胥彦玲, 张婧. 基于知识网络特征的产业关键共性技术识别模型与实证研究——以新一代信息技术产业为例[J]. 情报工程, 2024, 10(1): 28-41. 21 胡凯, 谢芬, 杨滨瑜, 等. 基于专利文本挖掘的产业关键共性技术识别与应用研究[J]. 科技管理研究, 2023, 43(8): 21-31. 22 Li G T, Siddharth L, Luo J X. Embedding knowledge graph of patent metadata to measure knowledge proximity[J]. Journal of the Association for Information Science and Technology, 2023, 74(4): 476-490. 23 魏明珠, 郑荣, 高志豪, 等. 融合知识图谱和深度神经网络的产业新兴技术预测模型研究[J]. 情报学报, 2022, 41(11): 1134-1148. 24 范佳颖, 马艳艳. 企业主导产学研合作与关键共性技术创新——结构性权力的调节效应[J]. 中国科技论坛, 2024(2): 61-70, 93. 25 冯立杰, 秦浩, 王金凤, 等. 融合专利数据与社交媒体数据的潜在颠覆性技术识别——基于深度学习模型[J]. 情报学报, 2024, 43(2): 181-197. 26 栾春娟. 战略性新兴产业共性技术测度指标研究[J]. 科学学与科学技术管理, 2012, 33(2): 11-16. 27 栾春娟, 王贤文, 侯海燕. 国内外共性技术及其测度研究综述[J]. 科学学与科学技术管理, 2011, 32(4): 37-43. 28 黄鲁成, 张静. 基于专利分析的产业共性技术识别方法研究[J]. 科学学与科学技术管理, 2014, 35(4): 80-86. 29 Ma Y H, Yang X M, Qu S, et al. Characteristics and driving factors of the technology cooperation network evolution: a case study of solid waste treatment field in China[J]. Technology Analysis & Strategic Management, 2023, 35(5): 508-522. 30 黄鲁成, 刘春文, 吴菲菲, 等. 基于NPCIA的核心技术识别模型及应用研究[J]. 科学学研究, 2020, 38(11): 1998-2007. 31 Lee M C, Chang J W, Yeh S C, et al. Applying attention-based BiLSTM and technical indicators in the design and performance analysis of stock trading strategies[J]. Neural Computing and Applications, 2022, 34(16): 13267-13279. 32 郑德俊, 程为. 基于三维主题特征测度的新兴主题识别研究[J]. 情报学报, 2024, 43(2): 167-180. 33 Wang Z Y, Chen J, Chen J P, et al. Identifying interdisciplinary topics and their evolution based on BERTopic[J]. Scientometrics, 2024, 129(11): 7359-7384. 34 王志强, 李宜展, 李云龙, 等. 基于BERTopic的大科学装置科学研究联合基金资助主题挖掘[J]. 图书情报工作, 2024, 68(24): 104-113.
[1]
冯岭, 潘云涛. 一种基于改进的深度学习模型的学科交叉文献识别方法 [J]. 情报学报, 2025, 44(6): 675-687.
[2]
江曼, 杨思洛, 魏家泽. 基于技术结构-功能语义关联的新兴技术识别研究 [J]. 情报学报, 2025, 44(5): 522-534.
[3]
石斌, 王昊, 李晓敏, 周抒. 结合学术网络与内容信息的文献语义表示方法研究 [J]. 情报学报, 2025, 44(2): 220-233.
[4]
吴雷, 周书发, 林超然. 基于专利文本深度语义信息挖掘的颠覆性技术识别及预测研究 [J]. 情报学报, 2025, 44(12): 1566-1579.
[5]
刘政昊, 邓雨枫, 李涵之, 郑梓阳, 丁震, 马费成. 社交知识大图的计算推理方法与应用展望 [J]. 情报学报, 2025, 44(11): 1422-1443.
[6]
沈思, 朱雨菲. 面向学术全文本多维知识元的学术图谱构建研究 [J]. 情报学报, 2024, 43(8): 960-975.
[7]
丁晟春, 秦天允, 王艺霖. 基于知识图谱的专利侵权风险预警研究 [J]. 情报学报, 2024, 43(8): 992-1002.
[8]
王康, 陈悦, 王玉奇, 韩盟. 颠覆性技术识别与扩散趋势预测:概念模型与实证分析 [J]. 情报学报, 2024, 43(8): 899-913.
[9]
相雅凡, 刘东苏, 马续补, 秦春秀, 时莹. 面向信息公开的突发公共卫生事件知识表示模型构建 [J]. 情报学报, 2024, 43(5): 538-552.
[10]
张贞港, 余传明. 基于知识增强的文本语义匹配模型研究 [J]. 情报学报, 2024, 43(4): 416-429.
[11]
张志剑, 夏苏迪, 刘政昊, 王文慧, 陈帅朴, 霍朝光. 基于数据增强和ViT 的印章识别方法研究 [J]. 情报学报, 2024, 43(3): 327-338.
[12]
周红磊, 张海涛, 刘伟利, 刘彦辉. 面向重大突发事件应急管理的事件知识图谱构建及场景应用 [J]. 情报学报, 2024, 43(12): 1453-1466.
[13]
张洋, 黄子萱, 朱嘉麒. 青年科技人才画像及鉴识方法研究 [J]. 情报学报, 2024, 43(11): 1283-1296.
[14]
袁满, 刘梦琪, 牟梦宁. 基于MDR 的知识图谱语义关系及表示标准化模型研究 [J]. 情报学报, 2023, 42(7): 832-841.
[15]
窦永香, 开庆, 王佳敏. 一种基于图表示学习的潜在颠覆性技术识别方法 [J]. 情报学报, 2023, 42(6): 637-648.