带摘要目录

2023年 第42卷 第12期
刊出日期:2023-12-24

情报理论与方法
情报技术与应用
情报理论与方法
1395 基于弱信号的颠覆性技术早期识别研究 Hot!
刘俊婉, 庞博, 徐硕
DOI: 10.3772/j.issn.1000-0135.2023.12.001
基于专利的弱信号探测模型与技术颠覆性潜力测度体系相结合的方法,开展颠覆性技术早期识别,为颠覆性技术的早期识别提供一套有效的方法和思路。利用专利信息进行领域弱信号探测,利用LDA(latent Dirichlet allocation)主题模型从领域专利内容中抽取主题,基于弱函数对主题进行过滤得到包含弱信号的主题集合,进一步通过预兆函数对弱信号主题包含的术语进行过滤,得到该研究领域弱信号术语集合及其对应的专利集合。基于技术颠覆性潜力测度指标体系,对包含弱信号术语的专利进行颠覆性潜力测度,最终得到目标领域具有颠覆性潜力的技术,为该领域颠覆性技术的早期识别提供参考。以incoPat专利数据库中2008—2019年基因编辑领域的专利数据作为研究对象,结合弱信号探测模型与技术颠覆性潜力测度体系,对该领域具有颠覆性潜力的技术进行早期识别,通过与基于关键词识别的弱信号结果对比,并利用CRISPR/Cas9技术对上述颠覆性技术识别结果进行验证,证明了本文方法的可行性和有效性。
2023 Vol. 42 (12): 1395-1411 [摘要] ( 286 ) HTML (214 KB)  PDF (2285 KB)  ( 394 )
1412 融合论文颠覆性与巩固性的学者二元影响力测度 Hot!
杨杰, 孔嘉, 张艺炜, 王昊, 邓三鸿
DOI: 10.3772/j.issn.1000-0135.2023.12.002
针对当前学者评价研究与实践中存在的准确性与全面性不足的问题,本文从颠覆性影响力的视角出发,基于引文网络的深层互引信息,将被引文献划分为颠覆性被引文献和巩固性被引文献,构建了学者影响力的二元测度框架,凝练出两种不同类型的学术特征,即“颠覆型学者”和“巩固型学者”,并提出颠覆性被引量和颠覆性h指数等指标用于学者影响力测度。实证研究基于APS(American Physical Society)数据集的463348篇论文、9370286条引证链接、234086位消歧后作者以及诺贝尔奖(Nobel Prize)、沃尔夫奖(Wolf Prize)、狄拉克奖(Dirac Medal)3种重要奖项得主数据,综合肯德尔秩相关性、识别比率、平均排名等方法进行指标一致性和收敛有效性分析。研究结果表明,颠覆性被引量和颠覆性h指数与传统指标高度一致,并且在收敛有效性上全面优于基准测度指标。颠覆性影响力能够反映学者的创新水平和潜力,二元测度框架可以对学者影响力进行准确划分,对未来创新科学家的早期识别、学者绩效与奖励制度的改革、基金项目的评审与评价、科研激励政策的制定等具有重要意义。
2023 Vol. 42 (12): 1412-1423 [摘要] ( 223 ) HTML (151 KB)  PDF (3174 KB)  ( 228 )
1424 我国数据治理相关政策量化剖析:发展脉络、政策主体、政策渊源与政策工具 Hot!
霍帆帆, 霍朝光, 马海群
DOI: 10.3772/j.issn.1000-0135.2023.12.003
数据治理政策关乎我国数字经济的健康发展,是数据生产要素化后,开展数据治理各项工作的重要依据。本文整合政策外部结构要素和政策内容要素,提出发展脉络、政策主体、政策渊源和政策工具四维政策分析框架,在收集我国现有中央层面1097份数据治理相关政策基础上,透过标志性政策和重要时间节点梳理其发展脉络,剖析参与政策制定的各个政策主体,追溯不同发展阶段数据治理政策的政策渊源,解析核心数据治理政策工具使用情况。研究结果发现,①部分信息管理政策主体的数据治理意识尚需强化,组建国家数据局是时代所需,是顶层设计的大手笔,各级政策主体应积极响应国家数据战略,增强数据治理理念;②数据治理政策制定时所援引的依据,应有绝对的权威性与足够的说服力,注意加强政策的长远效能和影响力;③现有数据治理政策工具结构存在一定失衡,数据治理不仅需要指导和管控手段,更需要采取基础或标杆性的强有力促进措施,在保驾护航的基础上,为我国数字经济发展注入更多活力。
2023 Vol. 42 (12): 1424-1437 [摘要] ( 288 ) HTML (139 KB)  PDF (5147 KB)  ( 276 )
1438 基金资助对杰出青年学者研究方向的影响 Hot!
陈雪怡, 潘云涛, 马峥, 张贵兰, 张柏祯, 任倩
DOI: 10.3772/j.issn.1000-0135.2023.12.004
青年人才是未来科技创新的主力军,关注科学基金对科研人员研究方向的资助导向,有助于青年人才实现创新突破、聚焦前沿。从“环境-动机-行为”视角,本文依据主题的凝聚性、合作的持续性和团队的稳定性3个维度设定了7个反映杰出青年研究方向聚焦的量化指标,以2018—2020年“北京市杰出青年科学基金”获得者为例进行实证研究。研究结果发现,在基金资助下,学者们的研究主题越发深入,与同领域学者的合作持续加强,内部的学术团队越发稳定。观测杰出青年3个阶段的综合评分,分析研究方向的变化趋势,发现在基金资助下,95%的学者研究方向趋于聚焦,包括逐渐聚焦、缓慢聚焦、聚焦稳定和延迟聚焦4类;5%的学者研究方向趋于不断拓展,与其学科演变和不断融合发展有密切关系。从基金项目管理的视角,建议通过基金项目引导学者开展兴趣驱动、目标明确的研究,为学者们提供稳定、持续的基金项目支持,以保障其不断进行深入研究。
2023 Vol. 42 (12): 1438-1447 [摘要] ( 142 ) HTML (112 KB)  PDF (1644 KB)  ( 294 )
1448 多学科交叉视角下国家安全情报体系构建研究 Hot!
王秉, 徐方廷
DOI: 10.3772/j.issn.1000-0135.2023.12.005
国家安全情报是维护国家安全的关键支撑和利器,国家安全情报体系是国家安全体系的核心组成部分。国家安全情报体系作为一个典型的多学科交叉领域,开展多学科交叉视角下的国家安全情报体系研究,既有助于从多学科视角审视和健全国家安全情报体系,亦可为推进国家安全情报体系的现代化提供新思路。首先,基于学科高度,论证国家安全情报体系的多学科交叉属性,并给出多学科交叉视角下的国家安全情报体系的内涵。其次,从国家安全学、情报学与系统科学三大学科视角出发,提取国家安全情报体系要素。最后,立足多学科交叉视角,提出国家安全情报体系现代化路径。研究结果表明,从多学科交叉视角来看,国家安全情报体系要素主要包括“国家安全学视角下的国家安全问题要素、国家安全目标要素与国家安全工作要素”“情报学视角下的国家安全情报活动要素、国家安全情报管理要素与国家安全情报技术要素”以及“系统科学视角下的国家安全情报体系中的主体集要素、国家安全情报体系中的关系集要素和国家安全情报体系的环境集要素”,国家安全情报体系现代化路径主要包括国家安全情报体系的总体化、数智化、协同化与科学化。
2023 Vol. 42 (12): 1448-1457 [摘要] ( 282 ) HTML (92 KB)  PDF (1103 KB)  ( 327 )
情报技术与应用
1458 影响不同子领域国际合作的距离因素相同吗?——来自计算机科学学科的证据 Hot!
赵毅, 章成志, 习海旭
DOI: 10.3772/j.issn.1000-0135.2023.12.006
探索影响国际科学合作的因素对于提高国际合作水平具有重要意义。然而,现有研究主要聚焦于顶层学科的分析,忽略了影响不同子领域国际合作的距离因素的异质性,研究结论无法为精细化政策的制定提供依据。为此,本文从比较视角出发,基于DBLP数据库中1990—2019年187个国家的计算机科学论文发表数据,分析了计算机科学学科不同子领域的国际合作时空演化模式,并借助零膨胀beta回归模型揭示影响不同子领域、不同时期国际合作的6种距离因素。研究结果表明,从时空分布来看,以计算机科学代表性子领域——人工智能为例,本文发现早期人工智能领域的高强度合作关系主要由美国主导,随着中国、新加坡等新兴人工智能强国逐渐涌现,国际合作模式由“一强多极”转向“多极合作”。从总体的回归结果来看,地理距离、认知距离和经济距离会阻碍所有子领域的国际合作,而认知距离的影响最大,文化距离、企业参与程度距离和政治距离只在部分领域与国际合作存在显著负向相关关系。从时间维度来看,在不同的子领域,地理距离和认知距离的边际效应呈现下降趋势,而经济距离的影响则随着时间变化而增大。
2023 Vol. 42 (12): 1458-1476 [摘要] ( 172 ) HTML (248 KB)  PDF (9755 KB)  ( 78 )
1477 基于多模态Transformer的虚假新闻检测研究 Hot!
王震宇, 朱学芳
DOI: 10.3772/j.issn.1000-0135.2023.12.007
为了减少虚假新闻给社会带来的负面影响,虚假新闻检测一直是自然语言处理中的一个重要领域。现有多模态虚假新闻检测方法通常使用预训练模型充当特征提取器,但是这些方法存在以下不足:①预训练模型参数在模型训练过程中总是会冻结,但预训练模型并不完美;②基于CNN(convolutional neural network)的图像特征提取器结构通常比基于Transformer的文本特征提取器结构更加复杂,图像特征通常被提前存储,使得这些模型的缺点被忽略。为此,本文提出基于端到端训练的多模态Transformer模型,通过使用视觉Transformer代替CNN提取图像特征,统一了不同模态的特征提取过程,利用共同注意力模块实现图像特征和文本特征交叉融合,并且在3个公开数据集上进行了对比实验。实验结果表明,本文模型性能超越了其他基线模型。
2023 Vol. 42 (12): 1477-1486 [摘要] ( 264 ) HTML (140 KB)  PDF (2622 KB)  ( 554 )
1487 ChpoBERT:面向中文政策文本的预训练模型 Hot!
沈思, 陈猛, 冯暑阳, 许乾坤, 刘江峰, 王飞, 王东波
DOI: 10.3772/j.issn.1000-0135.2023.12.008
随着深度学习的迅速发展和领域数据的快速积累,领域化的预训练模型在知识组织和挖掘中发挥了越来越重要的支撑作用。面向海量的中文政策文本,结合相应的预训练策略构建中文政策文本预训练模型,不仅有助于提升中文政策文本智能化处理的水平,而且为政策文本数据驱动下的精细化和多维度分析与探究奠定了坚实的基础。面向国家级、省级和市级平台上的政策文本,通过自动抓取和人工辅助相结合的方式,在去除非政策文本的基础上,确定了131390份政策文本,总字数为305648206。面向所构建的中文政策文本语料库,基于BERT-base-Chinese和Chinese-RoBERTa-wwm-ext,本研究利用MLM(masked language model)和WWM(whole word masking)任务构建了中文政策文本预训练模型(ChpoBERT),并在Github上对该模型进行了开源。在困惑度评价指标和政策文本自动分词、词性自动标注、命名实体识别下游任务上,ChpoBERT系列模型均表现出了较优的性能,可为政策文本的智能知识挖掘提供领域化的基础计算资源支撑。
2023 Vol. 42 (12): 1487-1497 [摘要] ( 298 ) HTML (155 KB)  PDF (1022 KB)  ( 451 )
1498 计算人文下的古籍引书研究及全文本知识库的构建 Hot!
刘浏, 齐月, 刘雏菲, 李文祺, 王东波
DOI: 10.3772/j.issn.1000-0135.2023.12.009
古籍引书是古籍计算人文研究的重要内容,是探寻传统文化传承脉络的重要方式。本文阐述了计算人文下古籍引书研究的内涵,描述了该研究视角下目录典籍、经学注疏、史书及诗词歌赋四类对象的引书和引典现象的异同,并以此为出发点,探讨了古籍引书全文本知识库构建的技术现状。本文围绕知识表示、知识标注、知识补全与消歧,描述了古籍引书全文本知识构建的框架流程,并就目录典籍、经学注疏、史书及诗词歌赋四类对象进行了引书知识库的构建尝试,分析了古籍引书知识库的应用前景。
2023 Vol. 42 (12): 1498-1512 [摘要] ( 215 ) HTML (147 KB)  PDF (2402 KB)  ( 181 )