带摘要目录

2023年 第42卷 第6期
刊出日期:2023-06-24

专题
情报理论与方法
情报技术与应用
专题
637 一种基于图表示学习的潜在颠覆性技术识别方法 Hot!
窦永香, 开庆, 王佳敏
DOI: 10.3772/j.issn.1000-0135.2023.06.001
识别潜在颠覆性技术有助于国家和企业加强颠覆性技术供给,使其在国际科技竞争中赢得竞争优势或实现变轨超车。传统基于文献计量的颠覆性技术识别方法通常利用论文和专利数据先构建关键词网络或关键词集,然后人工构造高阶数据特征进行分析。这种人工构造高阶特征的方法容易使关键词网络等的结构信息表达不充分,导致识别的准确性降低。本文提出一种基于图表示学习的半监督潜在颠覆性技术识别方法。首先,基于科技文献数据库数据,利用关键词共现频率和期刊影响力构建技术关键词加权网络;然后,通过反向传播算法基于匿名游走序列学习获得关键词网络的向量表示;接着,通过比较待识别技术关键词网络的向量序列与公认颠覆性技术关键词网络的向量序列之间的相似程度,反映技术演化特征的相似性,从而识别出潜在的颠覆性技术;最后,从近年来国内外与颠覆性技术有关的战略规划、预测报告中选取10项技术作为实验对象,采集WoS(Web of Science)数据对本文提出的方法进行实验验证,发现在预给定5项颠覆性技术的条件下,本文方法能较好地将其中潜在的3项颠覆性技术识别出来,并能够将2项伪颠覆性技术判断为非颠覆性技术。
2023 Vol. 42 (6): 637-648 [摘要] ( 298 ) HTML (1 KB)  PDF (6244 KB)  ( 274 )
649 融合“科学-技术”知识关联的高颠覆性专利预测方法 Hot!
梁镇涛, 毛进, 李纲
DOI: 10.3772/j.issn.1000-0135.2023.06.002
颠覆性技术的识别与预测研究在服务国家重大科技战略发展需求、保障国家科技产业安全等方面具有重要意义。本文将专利家族视为技术单元,从对技术知识空间的改变视角定义高颠覆性专利,基于世界专利统计数据库(Worldwide Patent Statistical Database,PATSTAT)和微软学术论文(Microsoft Academic Graph,MAG)数据库,对专利的颠覆性、技术特征及“科学-技术”知识关联特征进行测度分析,并在此基础上提出了融合“科学-技术”知识关联的高颠覆性专利预测方法。本文将高颠覆性专利预测问题转化为监督式二分类任务,给定专利在其公开当年的“科学-技术”知识关联和其他技术特征,以其5年后的颠覆性指标值高低作为预测目标,训练机器学习模型。研究结果表明,①高颠覆性专利具有前置知识少且非主流、技术团队实力强、商业价值被低估、长期影响力大的特点;②专利的“科学-技术”知识关联属性是对其颠覆性进行预测的重要特征;③LightGBM(light gradient boosting machine)模型在综合性能与训练效率上取得了最佳表现,在半导体器件与电数字数据处理领域的实证结果验证了模型的有效性。但颠覆性技术的预测仍是一个困难的任务,后续研究可尝试从专利语义特征与结合多源数据等角度进一步提升性能表现。
2023 Vol. 42 (6): 649-662 [摘要] ( 467 ) HTML (1 KB)  PDF (1283 KB)  ( 311 )
663 一种基于特征拼接、标签迁移及深度学习组合的专利价值评估方法 Hot!
赵雪峰, 胡瑾瑾, 吴德林, 吴伟伟, 孙安东, 赵涛
DOI: 10.3772/j.issn.1000-0135.2023.06.003
专利价值评估对打击非正常申请、净化市场环境具有重要的现实意义。本文以特征拼接、标签迁移及深度学习组合为中心构建专利价值评估方法,并基于2010—2020年广东省专利申请探究评估方法实际表现,引入多组对比模型进行实验分析。研究结果表明:①拼接著录事项信息,可构建出技术特征显现更强的专利研究对象,避免因指标类研究对象未足够体现专利技术本质而引发评估准确率不高的现象;②以专利法律视角量化出更具专利价值代表性的价值标签体系,在延展专利标签体系研究深度的同时,解决因引用率、下载访问量等传统标签与专利实际价值不匹配而造成的价值评估错误问题;③以高精细度词向量为构建原理,组建以BERT(bidirectional encoder representations from transformers)及LSTM(long short-term memory)为核心的专利价值评估模型,有效解决传统模型特征因提取能力不足而产生评估准确率偏低的弊端。本文从研究对象有效性、标签体系性及模型构建评估率三个方面提出优化改进策略,为专利价值评估提供了新工具,具有较强的实际应用价值。
2023 Vol. 42 (6): 663-680 [摘要] ( 291 ) HTML (1 KB)  PDF (5236 KB)  ( 162 )
情报理论与方法
681 基于元胞自动机的跨地域科研协作知识交流模型及仿真分析 Hot!
叶光辉, 魏锦钰, 谭启韬, 夏立新
DOI: 10.3772/j.issn.1000-0135.2023.06.004
跨地域科研协作知识交流对推动科研创新、促进价值创造具有重要意义。现实中知识交流过程复杂,传统方法难以对其进行全面刻画。本文刻画了跨地域科研协作知识交流中的主体特征,借鉴元胞自动机理论构建跨地域科研协作知识交流仿真模型,并根据知识交流特点将其分为知识共享、知识转移和知识创新三个阶段,并从平均知识水平、知识均衡度和知识转移速度三个维度对不同因素下的仿真结果进行评测分析。研究结果表明,地理距离对跨地域科研协作知识交流的阻碍作用随时间的演变逐渐减弱,知识交流能力是提高知识交流效率的关键,知识创新是促进科研协作知识交流持续进行的不竭动力。本文通过探究不同影响因素对跨地域科研协作知识交流的效果,探讨知识在主体间转移的过程及特性,揭示了知识交流的内在机制,对解决跨地域科研协作知识交流研究中主体空间差异大、交流周期长、交互规则复杂等难题具有重要意义。
2023 Vol. 42 (6): 681-689 [摘要] ( 184 ) HTML (1 KB)  PDF (1548 KB)  ( 96 )
690 学术引用视角下我国政府信息公开政策及其研究的互动关联分析 Hot!
翟羽佳, 许佳, 梁艺潇
DOI: 10.3772/j.issn.1000-0135.2023.06.005
本文旨在从学术引用的视角出发,以政府信息公开政策及其学术研究成果为研究对象,从主题、引文和关联三个维度,对我国政府信息公开政策及其相关的社会科学研究的交互影响关系进行分析。研究结果表明,在主题维度上,我国学者对政府信息公开问题的研究主题和研究内容的关注焦点较为分散,并随着不同政策颁布的时间节点而迁移。在引文维度上,研究者主要通过直接引用的方式,在施引文献的引言和综述/方法/分析过程中,将政策或政策内容作为背景信息或理论依据进行引用。对《中华人民共和国政府信息公开条例》内容的引用主要集中在施引文献的前三章,具体表现为对政府信息公开的主体、范围、方式和程序四类条款内容的引用。在关联维度上,本文通过引用耦合关系构建了政府信息公开政策共现网络。研究结果显示,《中华人民共和国政府信息公开条例》和《中华人民共和国档案法》《中华人民共和国保守国家秘密法》《中华人民共和国宪法》的共现次数最多。此外,受关注程度较高的政策内容主要集中在两个方面:一是对不同政策内某一具体条款内容是否存在问题进行探讨,二是对不同政策中相关条款内容之间的关联关系进行理论辨析,其关联关系主要表现为相互支持和相互矛盾两种。
2023 Vol. 42 (6): 690-701 [摘要] ( 265 ) HTML (1 KB)  PDF (3642 KB)  ( 170 )
702 基于关联重言的人文社科期刊评价量化模型探索 Hot!
韩松涛, 李洁, 金佳丽, 黄晨
DOI: 10.3772/j.issn.1000-0135.2023.06.006
本研究基于关联重言(association tautology)构建一流学术圈,探寻从一流学科所在的高校学者发文角度进行期刊评价,通过对SSCI(Social Sciences Citation Index)、A&HCI(Arts & Humanities Citation Index)5000余种期刊在2014—2018年这5年中发表的50余万篇论文的计量分析,构建了一种大数据基础上的人文社科期刊评价方式——一流学科评价法,有效规避主观不确定性,并取得了较好的实证效果。本研究提出的可持续的动态计量评价方法,以学者的投稿行为作为切入点,能够有效解决当前引文分析的弊端,可以在应用中不断加以完善。
2023 Vol. 42 (6): 702-710 [摘要] ( 162 ) HTML (1 KB)  PDF (777 KB)  ( 150 )
情报技术与应用
711 基于改进BP神经网络和函数拟合的细胞生物学领域“睡美人”识别与典型应用探测 Hot!
胡泽文, 金昕悦, 崔静静
DOI: 10.3772/j.issn.1000-0135.2023.06.007
海量科技文献中“睡美人”的充分挖掘与广泛利用,能够最大程度实现此类文献的科学价值,发挥其对科技发展的重大促进作用。本文设计和实现融合K值算法的BP(back propagation)神经网络模型,以及融合最小二乘法和迭代算法的一元二次函数拟合识别模型,对细胞生物学领域401130篇论文中的“睡美人”进行识别检验,结果发现:①BP神经网络模型能明显改进“睡美人”识别的自动化程度和效果,不受引文期长短的影响,然而需要预先识别出“睡美人”进行识别模型训练;最小二乘法、迭代算法和切片算法的融入能够提升一元二次函数和基尼系数的识别效率。②一元二次函数拟合受引文期的影响较小,然而基尼系数受引文期的影响极大,较短引文期文献中识别出的“睡美人”数量是较长引文期文献中“睡美人”数量的15倍。③即使同一个领域,识别结果的方法差异也较为明显。K值算法、BP神经网络和一元二次函数的识别效果较优,然而识别数量较少,占总量比例不到0.09%。基尼系数方法受引文期影响,导致识别效果最差且识别数量最多,占比达到0.41%。④细胞生物学领域“睡美人”数量的年度分布较为稳定,保持在0.02%~0.17%。⑤“睡美人”识别结果能够广泛应用于不同价值文献的计量特征比较,领域研究热点主题的识别与推荐,以及潜在“精品”或高价值文献的识别与传播推荐。
2023 Vol. 42 (6): 711-728 [摘要] ( 178 ) HTML (1 KB)  PDF (4773 KB)  ( 225 )
729 基于知识重构的词人时空情感轨迹可视化研究 Hot!
张强, 高劲松, 龙家庆, 杨晓燕, 夏红玉, 蒋智慧
DOI: 10.3772/j.issn.1000-0135.2023.06.008
数字技术对人文科学研究的广泛介入,为解决传统人文学科问题提供了新的研究方法和范式。传统人文学者在研究词人过程中往往存在重“时间”轻“空间”的现象,而数字人文技术为从宏观角度探究词人时空情感轨迹的变化情况、了解词人的全貌特征提供了可能。基于此,本研究以辛弃疾为例,从多维度出发对辛弃疾的相关数据进行重构。首先,通过自顶向下的方式构建了辛弃疾的知识图谱,完成静态的知识关联;其次,结合GIS(geographic information system)技术展示其时空情感轨迹的变化态势,完成动态的知识展示;最后,从时间、空间、情感等多维度对辛弃疾进行知识发现。对辛弃疾的案例分析证明,该方法可以有效地对词人进行全貌描述和可视化呈现,挖掘背后的隐藏知识,为人文研究提供新的实践手段。
2023 Vol. 42 (6): 729-739 [摘要] ( 341 ) HTML (1 KB)  PDF (3461 KB)  ( 117 )
740 基于图卷积神经网络的古汉语分词研究 Hot!
唐雪梅, 苏祺, 王军, 杨浩
DOI: 10.3772/j.issn.1000-0135.2023.06.009
古汉语的语法有省略、语序倒置的特点,词法有词类活用、代词名词丰富的特点,这些特点增加了古汉语分词的难度,并带来严重的out-of-vocabulary(OOV)问题。目前,深度学习方法已被广泛地应用在古汉语分词任务中并取得了成功,但是这些研究更关注的是如何提高分词效果,忽视了分词任务中的一大挑战,即OOV问题。因此,本文提出了一种基于图卷积神经网络的古汉语分词框架,通过结合预训练语言模型和图卷积神经网络,将外部知识融合到神经网络模型中来提高分词性能并缓解OOV问题。在《左传》《战国策》和《儒林外史》3个古汉语分词数据集上的研究结果显示,本文模型提高了3个数据集的分词表现。进一步的研究分析证明,本文模型能够有效地融合词典和N-gram信息;特别是N-gram有助于缓解OOV问题。
2023 Vol. 42 (6): 740-750 [摘要] ( 280 ) HTML (1 KB)  PDF (1230 KB)  ( 107 )
751 科研数据共享中科研人员与共享中介期望收益分析与激励策略仿真研究 Hot!
高晓宁, 高明珠
DOI: 10.3772/j.issn.1000-0135.2023.06.010
共享中介在科研数据共享中缺乏真实传递数据质量和需求等信息的意愿,由此造成科研数据共享效率低下、科研人员承担大部分风险等隐患。本文基于委托代理理论,研究共享中介与科研人员间利益博弈关系,引入激励系数约束共享中介不规范行为,构建双方共担风险的激励模型,求解最优激励策略,为科研人员积极共享科研数据提供管理启示与决策支持。研究结果显示,科研人员的期望收益对于激励系数呈现凹性,共享中介的期望收益是其努力程度的凹函数,表明存在最优的激励策略能够使共享中介按照科研人员意愿传递科研数据共享的真实信息;最优激励策略随共享中介成本投入、风险厌恶程度、随机因子等参数的变化而动态改变。
2023 Vol. 42 (6): 751-760 [摘要] ( 216 ) HTML (1 KB)  PDF (2084 KB)  ( 84 )