带摘要目录

2025年 第44卷 第7期
刊出日期:2025-07-24

专题
情报理论与方法
情报技术与应用
情报综述与述评
专题
797 情报赋能国家科技安全的理论阐释与实现路径 Hot!
李纲, 孙杰, 毛进
DOI: 10.3772/j.issn.1000-0135.2025.07.001
全球科技竞争背景下,国家科技安全已成为事关国家主权、安全与发展利益的战略基石。本研究以情报赋能国家科技安全为核心命题,系统探讨情报在国家科技安全领域的理论框架、方法体系与实践路径。首先,在把握时代背景与现实需求的基础上,阐释国家科技安全的概念、特征及其风险挑战,指出情报赋能在风险防控与战略竞争中的理论内涵;其次,构建“情报赋能国家科技安全”(information empowerment for national science and technology security,IE-NSTS)的逻辑框架,从功能模块、赋能机制、系统架构等方面进行解析,提出基于动态科技安全知识图谱、多模态知识表征与推理等数据与知识融合驱动的智能情报方法体系;最后,从风险体系与预警机制、态势感知与风险画像、风险研判与应对策略、博弈推演与竞争战略四个层次,提出情报赋能国家科技安全实现路径,激发和使能情报在国家科技安全领域的“耳目、尖兵、参谋”作用,以情报赋能我国科技领域高质量发展和高水平安全。
2025 Vol. 44 (7): 797-807 [摘要] ( 34 ) HTML (1 KB)  PDF (1908 KB)  ( 27 )
情报理论与方法
808 预印本平台与新型学术交流系统 Hot!
初景利, 刘静羽, 刘敬仪, 任娇菡, 杨恒
DOI: 10.3772/j.issn.1000-0135.2025.07.002
客观认识预印本平台与学术交流系统的关系,对于推动新型学术交流的发展具有重要意义。本文结合文献调研和预印本平台建设实践,从情报学及大情报观视角,系统梳理预印本平台的定义、产生与发展情况,从“预印本对学术交流系统重构的影响和意义”及“预印本平台对学术交流系统中不同角色的价值”两个维度阐释预印本平台与学术交流系统二者之间的关系。本文提出,预印本平台的本质是新型学术交流模式,并从四个方面提出推进我国预印本新型学术交流的建议。
2025 Vol. 44 (7): 808-817 [摘要] ( 10 ) HTML (1 KB)  PDF (1045 KB)  ( 15 )
818 一种基于SimCSE有监督微调的跨语言专利文本表示优化方法 Hot!
王莉军, 李浩天, 高影繁, 王淑君
DOI: 10.3772/j.issn.1000-0135.2025.07.003
本文提出了一种跨语言专利文本表示优化方法,旨在提升中英专利文本的语义表示能力。该方法结合了SimCSE(simple contrastive sentence embeddings)对比学习算法与有监督微调策略,通过充分利用中英专利文本的平行语料数据,实现了跨语言的有效文本表示。在无监督SimCSE微调的基础上,本文引入了有监督的SimCSE微调算法,以增强模型在跨语言语义理解上的表现。具体而言,本文提出了一种正负样本挖掘策略,通过分析专利文本间的引用关系构建高质量正样本集,使模型能够捕捉到更准确的跨语言语义相似性。同时,引入RetroMAE(retrieval-oriented masked auto-encoder)二次预训练模型,针对难负例的挖掘进行优化,以进一步提高模型的区分能力和泛化性能。与传统跨语言文本表示方法相比,本文方法在处理跨语言专利文本时表现出显著优势,突破了已有方法在语义对齐和区分上的局限性,为多领域跨语言专利分析提供了更加精准有效的工具。
2025 Vol. 44 (7): 818-829 [摘要] ( 20 ) HTML (1 KB)  PDF (1048 KB)  ( 15 )
830 面向可溯源文本生成的科技文献伪反馈训练数据合成研究 Hot!
马永强, 刘家伟, 高影繁
DOI: 10.3772/j.issn.1000-0135.2025.07.004
在学术文本中插入恰当的引文标识是学术写作的基本规范,可以帮助读者验证文本内容的真实性。引文标识符可以用于实现内容溯源、保证内容可验证性。在学术场景中,现有大语言模型普遍缺乏内置的内容溯源机制,导致所生成学术文本的可验证性不足。当前,借助领域数据集来优化大模型是主流的研究思路。然而,在优化模型可溯源性方面,基于人类撰写的学术文本所构建的训练集存在内在一致性不足、引文标注行为差异性大等问题,基于大模型的数据合成方法在数据多样性方面也存在局限性。为此,本文提出了一种面向可溯源学术文本的引文标识符体系与评测方法,用于分析大模型所生成学术文本的可溯源性。然后,从训练数据的角度,针对可溯源的学术文本生成,本文提出了一种两阶段伪反馈训练数据合成方法,兼顾大模型标注文本和人类标注文本的特性,构建高质量、多样化的训练数据。研究结果表明,采用本文构建的合成数据训练的小模型,能够生成更具可溯源性的学术文本;通过第二阶段的伪反馈进一步优化数据分布和任务多样性,有助于增强模型的泛化能力。
2025 Vol. 44 (7): 830-845 [摘要] ( 15 ) HTML (1 KB)  PDF (6052 KB)  ( 49 )
846 一种基于专家反馈微调的专利文本相似性计算方法 Hot!
王淑君, 高影繁, 姚长青, 袁鸣
DOI: 10.3772/j.issn.1000-0135.2025.07.005
专利作为创新技术的重要知识载体,文本相似性计算是自然语言处理应用广泛的重要一环,专利文本相似性计算有助于挖掘潜在价值专利和支撑专利检索。本文提出了一种基于专家反馈微调的专利文本相似性计算方法,在专家评价小数据集上,利用大模型重新生成摘要文本进而实现负例文本增强,随后利用专家评价数据集对预训练模型进行微调,并在大规模数据集上重新计算得到相似专利。本文在新材料和电子信息两个新兴领域中分别继续训练BART(bidirectional and auto-regressive transformers)和BGE(Beijing Academy of Artificial Intelligence general embedding)模型,并在专家评价数据集上微调两个模型。实验结果表明,该方法的Spearman相关系数相较于初始模型分别提升了6.4%和16.9%。实证部分识别了电子信息领域企业技术竞争对手这一场景,验证了该方法在技术竞争对手识别中的优势。
2025 Vol. 44 (7): 846-858 [摘要] ( 22 ) HTML (1 KB)  PDF (2798 KB)  ( 21 )
859 融合对比学习的多阶段文献推荐双塔模型 Hot!
叶光辉, 谭启韬, 武川, 宋孝英, 李松烨
DOI: 10.3772/j.issn.1000-0135.2025.07.006
文献推荐是文献信息挖掘领域的重要研究主题之一。针对传统文献推荐方法难以有效应对长尾分布问题,以及无法充分捕获文献高维特征而导致推荐效果不佳的现状,本文提出一种融合对比学习的多阶段文献推荐双塔模型。首先,分别构建用户塔和文献塔,以有效地提取和学习用户兴趣特征及文献内容特征。其次,为进一步提升模型对高维度特征的表征学习能力,设计包含召回层与精排层两个阶段的推荐机制。召回层用于快速过滤大量无关文献,以缓解长尾分布的影响;精排层则利用细粒度的用户个性化偏好进一步提升推荐准确性。在公开的CiteUlike-a数据集上的实验结果表明,本文提出的多阶段文献推荐双塔模型能够显著提高推荐效果,有效缓解文献推荐中的长尾分布问题,其性能优于传统的单阶段推荐模型。
2025 Vol. 44 (7): 859-868 [摘要] ( 17 ) HTML (1 KB)  PDF (1631 KB)  ( 35 )
869 基于SciBERT的科研合作知识交叉测度及其对科研主体持续科研产出的因果效应 Hot!
冯小东, 黄雨杭
DOI: 10.3772/j.issn.1000-0135.2025.07.007
随着科研问题日益综合化与复杂化,科研合作及学科交叉趋势愈演愈烈,此过程中知识交叉是知识相互作用、融合、创新的过程,可能带来斐然的科研成果。突破已有学科交叉研究的学科粒度及成果静态呈现视角,本文探究了科研主体与合作者在前期动态知识经验累积上的细粒度知识交叉的测量及对其持续科研产出的影响。基于SciBERT(bidirectional encoder representations from transformers for scientific text)模型对论文句子及关键词的表示能力,利用文本挖掘方法,构建科研主体的科研合作知识交叉强度测量模型。以信息系统学科的论文发表数据为例,构建面板数据,使用广义倾向性得分匹配方法进行因果效应分析,并探究研究问题和研究方法维度上知识交叉的影响差异。研究结果表明,科研合作的知识交叉对于科研主体下一阶段的科研产出数量呈现倒U形的影响关系,科研主体在研究方法上开展科研合作的知识交叉比在研究问题上的知识交叉更能影响其后续的持续科研产出。
2025 Vol. 44 (7): 869-891 [摘要] ( 27 ) HTML (1 KB)  PDF (2731 KB)  ( 15 )
情报技术与应用
892 基于超链路预测的多元技术机会发现研究 Hot!
陈文杰, 曲建升
DOI: 10.3772/j.issn.1000-0135.2025.07.008
对特定领域的技术机会进行挖掘与分析,可以为企业“从0到1”的原始创新提供新参考和新建议。本文提出了一种基于超链路预测的多元技术机会发现方法。首先,基于技术间多元共现关系构建技术关系超网络,利用IPC(international patent classification)的引用信息和文本信息生成节点特征向量;其次,将超链路预测模型Hyper-SAGNN(a self-attention based graph neural network for hypergraphs)扩展到技术关系超网络中,预测未来多个技术融合形成技术机会的可能性;最后,基于新颖性、中心性、跨领域性等特征构建度量指标,发现潜在的、有价值的多元技术机会。以智能问答技术领域为例,验证了本文方法的科学性和有效性,有效挖掘出高价值的三元技术机会和四元技术机会,为企业的技术战略布局与创新策略提供了决策支持。
2025 Vol. 44 (7): 892-902 [摘要] ( 20 ) HTML (1 KB)  PDF (2430 KB)  ( 18 )
903 基于矩阵画像和Louvain社区发现算法的关键核心技术识别研究 Hot!
万校基, 赖静, 牟莹禧, 朱志国, 张丽萍
DOI: 10.3772/j.issn.1000-0135.2025.07.009
针对现有关键核心技术识别方法较少考虑时间因素和较难解读识别结果等问题,本文提出一种基于矩阵画像(matrix profile,MP)和Louvain社区发现算法的关键核心技术识别方法。该方法基于IPC(international patent classification)小类权重和词频分析法识别目标领域热点技术主题,结合高频IPC小类时间序列和MP算法构建技术关联网络,借助Louvain算法和社会网络分析法识别目标领域初始关键核心技术主题。基于特征筛选关键核心技术主题,并通过对技术关联子网络、原始专利数据、相关政策文件和期刊文献的深层次解读来识别目标领域关键核心技术。通过对incoPat专利数据库中2014—2023年物流领域的授权专利进行数据处理和挖掘发现,本文方法能有效识别物流领域关键核心技术,不仅有助于推动行业技术突破和创新,亦可提升国家在全球产业链和价值链中的地位。
2025 Vol. 44 (7): 903-914 [摘要] ( 19 ) HTML (1 KB)  PDF (2263 KB)  ( 9 )
情报综述与述评
915 追因溯果:信息资源管理领域因果推断方法的应用与展望 Hot!
吴江, 陶成煦, 欧桂燕, 丁杨
DOI: 10.3772/j.issn.1000-0135.2025.07.010
推断数据之中的因果关系以揭示信息资源管理现象背后的本质,是信息资源管理领域新的时代命题;探讨信息资源管理领域因果推断方法的应用与展望能够为相关研究提供参考。相较于统计推断,因果推断采用专门的设计与实验控制混淆变量与选择偏差,能够更准确地刻画因果关系。就其方法而言,在社会科学领域,潜在结果模型可以灵活应对研究数据的不同特性并揭示复杂社会问题的原因,从而被广泛应用。为此,本文首先从哲学与科学两个层面阐述因果推断的由来;其次,界定因果推断的概念,比较因果推断与统计推断的区别,梳理因果推断的相关术语;再其次,提炼潜在结果模型下信息资源管理领域因果推断方法应用的基本流程,并着重围绕方法的适用条件,分析各类方法在信息资源管理领域的应用思路;最后,针对具体领域,探讨相关研究在方法应用上的现状与不足,在此基础上,从研究方法、应用过程和应用领域三个方面,提出信息资源管理领域因果推断方法应用的前景展望。
2025 Vol. 44 (7): 915-932 [摘要] ( 21 ) HTML (1 KB)  PDF (2751 KB)  ( 44 )