基于文本挖掘的中美技术差距分析——以空间技术领域为例
郭世杰1,2 , 陈芳2 , 韩涛1,2 , 王学昭1,2 , 王燕鹏2 , 吕璐成1,2 , 董璐2
1.中国科学院大学经济与管理学院图书情报与档案管理系,北京 100049 2.中国科学院文献情报中心,北京 100190
Analysis on Technology Gaps between China and US Based on Text Mining—Taking Space Technology as an Example
Guo Shijie1,2 , Chen Fang2 , Han Tao1,2 , Wang Xuezhao1,2 , Wang Yanpeng2 , Lyu Lucheng1,2 , Dong Lu2
1.Department of Library, Information and Archives Management, School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100049 2.National Science Library, Chinese Academy of Sciences, Beijing 100190
摘要 识别中外技术布局和性能差异,并针对我国关键核心技术所面临的风险进行监测预警。聚焦美国相关规章文件中技术产品的性能参数,设计基于性能参数定量对比的技术差距分析方法。分析相关文件的语义特征,构建面向文件语义要素的信息抽取方法和信息同步匹配方法。提出通过文献计量,识别应对技术差距的替代性研究单位、推荐合作机构的方法。在此基础上,以美国在空间科技领域的相关规章文件分析为例,开展实证分析。利用性能参数的挖掘对比,可以将美国相关规章文件中包含的技术产品与我国的技术水平对比结果分为4类:无差距、技术空白、技术布局差异、技术水平差距。
关键词 :
技术差距 ,
空间技术 ,
文本挖掘 ,
信息抽取
收稿日期: 2021-01-15
基金资助: 2020年中国科学院文献情报能力建设专项“科技领域战略情报研究咨询体系建设”(E0290001);“中国科学院文献情报中心青年人才创新团队”项目“面向科研设施的信息抽取”(G180141)。
作者简介 : 郭世杰,男,1989年生,博士研究生,助理研究员,主要从事空间光电科技战略情报、情报学理论与方法研究;陈芳,男,1981年生,硕士,副研究馆员,主要从事特色情报资源建设与分析、文本挖掘、出口管制研究;韩涛,男,1980年生,博士,研究员,硕士生导师,主要从事智能情报方法研究,hant@mail.las.ac.cn;王学昭,女,1978年生,博士,研究员,硕士生导师,主要从事科技战略情报、特色情报数据资源建设、知识产权与产业情报等研究;王燕鹏,男,1992年生,硕士,助理研究员,主要从事特色情报数据资源建设与分析、文本挖掘、技术预见研究;吕璐成,男,1989年生,博士研究生,助理研究员,主要从事专利情报和智能情报方法研究;董璐,女,1988年生,硕士,助理研究员,主要从事空间光电与重大科研设施情报、科研仪器情报研;
引用本文:
郭世杰, 陈芳, 韩涛, 王学昭, 王燕鹏, 吕璐成, 董璐. 基于文本挖掘的中美技术差距分析——以空间技术领域为例[J]. 情报学报, 2021, 40(8): 806-816.
Guo Shijie, Chen Fang, Han Tao, Wang Xuezhao, Wang Yanpeng, Lyu Lucheng, Dong Lu. Analysis on Technology Gaps between China and US Based on Text Mining—Taking Space Technology as an Example. 情报学报, 2021, 40(8): 806-816.
链接本文:
https://qbxb.istic.ac.cn/CN/10.3772/j.issn.1000-0135.2021.08.002 或 https://qbxb.istic.ac.cn/CN/Y2021/V40/I8/806
1 习近平在两院院士大会上的讲话(全文)[EB/OL]. (2018-05-28) [2019-11-29]. https://zj.zjol.com.cn/news.html?id=950820. 2 15 CFR Part 774-The commerce control list[EB/OL]. Cornell Law School. [2018-08-13]. https://www.law.cornell.edu/cfr/text/15/part-774. 3 Addition of certain entities; and modification of entry on the entity list[EB/OL]. [2019-11-29]. https://www.federalregister.gov/documents/2018/08/01/2018-16474/addition-of-certain-entities-and-modification-of-entry-on-the-entity-list. 4 COUNCIL REGULATION (EC) No 428/2009. European council[EB/OL]. [2019-11-29]. https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=celex:32009R0428. 5 National control initiatives[EB/OL]. [2019-11-29]. https://sbdu.entreprises.gouv.fr/en/regulations. 6 面对国际巨头垄断, 中国科研仪器怎么办[EB/OL]. (2019-03-05) [2019-11-29]. http://www.zaobao.com/wencui/politic/story 20190305-937181. 7 王斌. 国际战略博弈中的武器出口研究[D]. 北京: 中共中央党校, 2016. 8 邹霞. 美国出口管制法域外效力研究[D]. 厦门: 华侨大学, 2018. 9 葛晓峰. 美国两用物项出口管制法律制度分析[J]. 国际经济合作, 2018(1): 46-50. 10 ECTI Searchable commerce control list[EB/OL]. [2019-11-29]. https://info.learnexportcompliance.com/ecti-commerce-control-list. 11 陆天驰, 闵超, 高伊林, 等. 竞争情报视角下的中美人工智能技术领域差距分析——以美国商品管制清单为例[J]. 情报杂志, 2019, 38(11): 25-33. 12 魏简康凯, 宿铮. 美国出口管制改革的竞争情报分析[J]. 情报杂志, 2019, 38(4): 4-8 13 杨宇田, 陈峰. 列入美国技术出口管制部门受限名单的企事业单位分析[J]. 情报杂志, 2018, 37(10): 90-96. 14 祝捷频, 赵蕴华. 基于美国对华技术管制清单的专利分析——以数控系统领域为例[J]. 情报杂志, 2014, 33(11): 46-53. 15 中华人民共和国国家质量监督检验检疫总局, 中国国家标准化管理委员会. 中华人民共和国国家标准: 科技平台 大型科学仪器设备分类与代码GB/T 32847-2016[S/OL]. (2016-08-29) [2019- 11-29]. http://c.gb688.cn/bzgk/gb/showGb?type=online&hcno= D866C8AC7D854F422DDADA0A39BF4C24. 16 Electronic code of federal regulations[EB/OL]. [2019-11-29]. https://www.ecfr.gov/cgi-bin/text-idx?SID=61624ae15dc7c1b9bfda5037c8ad8350&m=09&d=05&y=2019&pd=20150701&pitd=20150701&node=pt15.2.774&submit=GO. 17 Federal Register[EB/OL]. [2019-11-29]. https://www.federalregister.gov/. 18 8月27日国内部分地区石墨粉报价[EB/OL]. (2019-08-27) [2019-11-29]. https://news.cnpowder.com.cn/51976.html. 19 研制四千度超高温陶瓷, 中国拿到都无法测试摸底[EB/OL]. (2016-12-30) [2019-11-29]. http://blog.sina.com.cn/s/blog_5f64 6d070102x26y.html. 20 中国高精度激光陀螺仪实现量产, 精度优于欧洲产品[EB/OL]. (2014-01-24) [2019-11-29]. https://www.guancha.cn/military-affairs/2014_01_24_201999.shtml. 21 我国激光陀螺仪持续突破: 精度媲美国际水平[EB/OL]. (2015-10-20) [2019-11-29]. https://laser.ofweek.com/2015-10/ART-240001-8120-29016842.html. 22 走冷门, 他研发出的陀螺仪精度全球第三[EB/OL]. (2018-06-20) [2019-11-29]. https://news.sina.com.cn/c/2018-06-20/doc-iheauxvz9645437.shtml. 23 长征七号火箭是我国第一型“全绿色”中型火箭[EB/OL]. (2016- 06-28) [2019-11-29]. http://www.calt.com/n482/n743/c5773/content.html. 24 雄立东方的传奇——祖国需求当己任, 排除万难为“两弹”[EB/OL]. (2011-10-28) [2019-11-29]. http://www.cas.cn/spzb1/zhengwenbjys/hjzpgb/yxj/201110/t20111028_3386945.html. 25 马玥, 姜琦刚, 李远华, 等. 国内外商用遥感卫星的定量化对比分析与评估[J]. 国土资源遥感, 2016, 28(1): 1-6.
[1]
史伟, 薛广聪, 何绍义. 基于偏差规则马尔可夫模型的网络舆情情感预测研究 [J]. 情报学报, 2023, 42(9): 1065-1077.
[2]
吴柯烨, 孙建军, 谢紫悦. 基于专利文本挖掘的细粒度技术机会分析 [J]. 情报学报, 2023, 42(10): 1199-1212.
[3]
王燕鹏, 王学昭, 陈小莉, 李宜展, 刘细文. 基于科技政策和前沿动态的第四次工业革命关键技术和举措分析 [J]. 情报学报, 2022, 41(1): 29-37.
[4]
吕璐成, 韩涛, 陈芳, 王学昭, 赵亚娟, 郭世杰. 美国商业管制清单与专利自动映射方法及实证研究 [J]. 情报学报, 2022, 41(1): 50-61.
[5]
黄文彬, 白浩东. 基于自动构建术语分类体系的公司划分研究——以新三板公司主营业务概念为例 [J]. 情报学报, 2021, 40(5): 479-488.
[6]
赵洪, 王芳. 大规模异构的政府统计报表信息抽取与集成融合研究 [J]. 情报学报, 2020, 39(9): 938-948.
[7]
白如江, 刘博文, 冷伏海. 基于多维指标的未来新兴科学研究前沿识别研究 [J]. 情报学报, 2020, 39(7): 747-760.
[8]
张颖怡, 章成志. 基于学术论文全文的研究方法句自动抽取研究 [J]. 情报学报, 2020, 39(6): 640-650.
[9]
余传明, 郑智梁, 朱星宇, 安璐. 面向查询的观点摘要模型研究:以Debatepedia 为数据源 [J]. 情报学报, 2020, 39(4): 374-386.
[10]
贾丹萍, 靳健, 耿骞, 邓斯予. 感性工学视角下的用户需求挖掘研究 [J]. 情报学报, 2020, 39(3): 308-316.
[11]
温有奎, 温浩, 乔晓东. 让知识产生智慧——基于人工智能的文本挖掘与问答技术研究 [J]. 情报学报, 2019, 38(7): 722-730.
[12]
谭章禄, 彭胜男, 王兆刚. 基于聚类分析的国内文本挖掘热点与趋势研究 [J]. 情报学报, 2019, 38(6): 578-585.
[13]
梁娜, 姚长青, 王峥, 高影繁, 李岩. 基于三重维度的企业风险信息抽取方法研究 [J]. 情报学报, 2019, 38(12): 1241-1249.
[14]
魏伟, 郭崇慧, 陈静锋. 国务院政府工作报告(1954—2017)文本挖掘及社会变迁研究 [J]. 情报学报, 2018, 37(4): 406-421.
[15]
刘浏, 王东波. 命名实体识别研究综述 [J]. 情报学报, 2018, 37(3): 329-340.