带摘要目录

2025年 第44卷 第6期
刊出日期:2025-06-24

情报理论与方法
情报技术与应用
情报综述与述评
情报理论与方法
645 融合网络结构特征的学科新兴主题识别方法研究 Hot!
杨金庆, 罗曼, 程秀峰, 夏立新, 马廷灿
DOI: 10.3772/j.issn.1000-0135.2025.06.001
学科新兴主题识别是及时发现科技创新发展动态、追踪学科发展趋势的有效方法。学科新兴主题的涌现是一个复杂的过程,不仅受科学交流过程的影响还受网络自组织过程的影响。学科新兴主题的网络结构在一定程度上嵌入了其特有性质。本文在常见科学交流属性特征的基础上,融合学科主题在网络中的全局和局部网络结构特征,通过随机匹配生成标准实验数据集,先后运用多指标加权融合方法与机器学习分类方法识别学科新兴主题。研究结果表明,多指标加权融合方法对识别影响力排序靠前的学科主题表现较好。但是,P@270高影响力主题仅占60%,低于随机森林分类识别模型的最优性能64.14%,这表明机器学习分类识别方法在拟合复杂过程方面具有优势,而多指标加权融合方法更适用于关注顶尖影响力主题的任务。机器学习可解释分析结果表明,吸纳引用频次较多、网络影响力较高、论文发表较多、关注作者影响力与期刊影响力较强对高影响力主题识别起正向作用;与之相反,结构突变程度高对学科新兴主题识别有负向作用。
2025 Vol. 44 (6): 645-659 [摘要] ( 10 ) HTML (1 KB)  PDF (4054 KB)  ( 3 )
660 基于应用基础研究的新兴技术方向成熟度评估方法研究 Hot!
王春, 冷伏海
DOI: 10.3772/j.issn.1000-0135.2025.06.002
本文对基于应用基础研究的新兴技术方向成熟度客观可重复性评估开展情报分析方法研究,以期改进技术成熟度长期由专家评估、难以复制的现状,并解决因技术成熟度等级(technology readiness level,TRL)量表评级标准模糊而容易造成的评估不准确的问题。首先,本文分析了TRL量表的调整与应用现状,对技术成熟度的专家评估与情报指标评估的差异进行剖析。其次,针对学界鼓励调整和应用TRL量表以加强行业讨论的现状,对与新兴技术方向成熟度评估相关的研究类型、文献数据类型、情报指标来源数据库以及所涉及的TRL范围进行详细探讨。最后,结合多个行业和机构的TRL相关描述与应用,本文提出了将基于应用基础研究的新兴技术方向成熟度等级调整为三个阶段的假设,据此构建了“研究主题+时序演化”的情报分析框架。在此框架下,从标题信息时序聚类、摘要信息主题建模与主要研究主题判断以及语义主路径分析三个角度,开展结果一致性检验,并与专家咨询相印证,完成情报分析方法的可行性论证。在实证部分,本文以Web of Science Core Collection数据库1997年以来的磷酸铁锂电池技术方向11833篇论文为例,证实了该方向的研究已经处于新兴技术方向成熟度发展的第三阶段。新兴技术方向成熟度客观可重复性评估的情报分析方法研究是现有评估方法的有益补充,对把握技术发展脉络、科技战略资源配置、未来产业技术路线图制定以及技术创新产业发展等具有积极意义。
2025 Vol. 44 (6): 660-674 [摘要] ( 9 ) HTML (1 KB)  PDF (2851 KB)  ( 3 )
675 一种基于改进的深度学习模型的学科交叉文献识别方法 Hot!
冯岭, 潘云涛
DOI: 10.3772/j.issn.1000-0135.2025.06.003
有效地识别学科交叉文献,不仅有助于及时把握学科交叉的研究态势、实时跟踪学科交叉地带的科研活动,还能为科研决策提供有力支持。本文根据科技文献蕴含的语义交叉性,提出一种基于改进的深度学习模型的学科交叉文献识别方法。首先,通过“文本合并”获得用于学科交叉文献识别的训练数据集;其次,提出一种改进的基于深度学习的文本分类模型,并在训练集上进行模型训练;最后,基于训练好的模型,对待分析的科技文献是否为学科交叉文献进行判别。在“牙科材料学”和“计算生物学”两个数据集上,对本文方法进行实证研究。结果表明,本文方法在学科交叉文献识别上具有较好的有效性,在两个数据集上计算得到的AUC(area under the curve)值分别达到0.741和0.966。与传统的基于深度学习的文本分类方法相比,本文方法可以在不依赖任何交叉学科先验知识的情况下,基于已有的非学科交叉文献训练学科交叉文献识别模型,从而能够在新的科技文献出现时,准确地判别其是否为学科交叉文献,实现有发展潜力的前沿交叉领域的实时监测。同时,学科交叉文献识别的效果也得到了较大幅度的提高。
2025 Vol. 44 (6): 675-687 [摘要] ( 3 ) HTML (1 KB)  PDF (1765 KB)  ( 4 )
688 基于ELO模型的技术主题热度评估框架研究 Hot!
陈洪侃, 刘金昌, 步一
DOI: 10.3772/j.issn.1000-0135.2025.06.004
技术主题热度的评估对决策者了解市场动向和技术发展趋势具有重要意义。然而,传统的热点评估指标或早期技术的弱信号识别方法尚存在热点技术主题识别欠缺前瞻视角、时间间隔阈值调整主观且较困难、学科框架以及粒度需要预先确定、输出结果不易直接辅助情报工作决策等问题。为此,本文引入了基于ELO(Elo rating system)模型的期望热度概念,构建了一种新的技术主题热度评估方法。本文从理论上阐释了基于ELO模型的方法能够较为准确地反映技术主题的热度指标,并以碳纤维领域的技术主题热度识别为例,验证了本文方法的可行性与有效性。相比于传统的热度评估方法,本文提出的技术主题热度评估方法丰富了主题热度的评估内容,并为决策者提供了更多的情报支持。
2025 Vol. 44 (6): 688-701 [摘要] ( 8 ) HTML (1 KB)  PDF (2185 KB)  ( 3 )
702 引文中辍的理论基础与实证研究 Hot!
李昊, 侯剑华, 张洋
DOI: 10.3772/j.issn.1000-0135.2025.06.005
引文分析是追踪和评估科学知识扩散及其影响的重要方法。然而,现有研究往往只关注引文的扩散过程,而忽略了引文中辍(citation discontinuance)现象,即文献在首次被引后,在一定时期内未再被引用的情况。对该现象进行概念化与定量化研究,需要系统梳理引文中辍的理论基础,构建其分析框架。基于创新扩散理论、文献老化理论、科学范式转移理论和知识进化理论等,本文为引文中辍现象提供了理论解释,并解析了其内涵,区分了完全引文中辍、暂时引文中辍和间歇引文中辍三种类型的引文轨迹;在此基础上,设计了引文中辍的定量识别方法,并进行实证分析。本文提出的引文中辍概念,是对引文扩散持续性与非线性特征的进一步揭示,旨在为引文扩散建模提供新启示;本文构建的引文中辍分析框架,有助于科研机构和研究人员更好地理解科研成果的影响力和时效性,以期进一步增强引文分析方法与引文扩散研究对于文献生命周期管理、科学评价等实践的解释力度。
2025 Vol. 44 (6): 702-719 [摘要] ( 8 ) HTML (1 KB)  PDF (6186 KB)  ( 5 )
720 面向解决“卡脖子”技术困境的关键专利识别研究 Hot!
朱珈慧, 周潇, 王博, 任乔杨, 王丹
DOI: 10.3772/j.issn.1000-0135.2025.06.006
随着国外对我国芯片领域技术和产品的封锁限制,我国科技领军企业和机构正在共同助力“卡脖子”技术突破,以实现国产化替代。识别我国在“卡脖子”技术问题上具有突破潜质的关键专利、提供具有针对性的细粒度解决方案,是帮助我国实现技术突围和布局技术创新战略的重要措施。本研究在大模型生成中外专利技术功效文本的基础上,通过对标国外“卡脖子”核心专利与国内专利的技术功效文本,识别出具有解决“卡脖子”技术问题的国内关键专利。本研究的创新点主要体现在两个方面:①在技术功效文本的生成上,利用大模型作为文本生成工具,弥补了抽取方式的机械性,同时有效降低了专家的参与程度;②在识别关键专利时,考虑了“技术—解决方案”的深层对应关系,从技术底层逻辑而非技术文本表层对中外专利进行对标,使得识别出的国内关键专利更具问题导向性。最后,以AI(artificial intelligence)芯片领域为例进行实证研究,验证了本研究方法的可行性,为我国突破“卡脖子”技术困境提供了有效思路。
2025 Vol. 44 (6): 720-735 [摘要] ( 11 ) HTML (1 KB)  PDF (2834 KB)  ( 4 )
情报技术与应用
736 基于MU序列标注的古籍命名实体识别研究 Hot!
许乾坤, 王东波, 刘禹彤, 黄水清
DOI: 10.3772/j.issn.1000-0135.2025.06.007
命名实体识别任务是自然语言处理中众多下游任务的重要基础步骤。古籍作为中华文明的载体,不仅蕴含着丰富的文化遗产,更是汲取历史智慧、启迪未来的重要源泉。提高古籍文本中实体识别的准确性,有助于推动古籍文本结构化、知识体系化,助力古籍资源的智能利用和开发。首先,选取本课题组精加工的二十四史古籍作为原始数据集,使用GujiBERT_FAN预训练模型对Sequence Labeling、Sequence Labeling_CRF、Span-level Prediction方法进行微调,从而更准确地捕捉实体边界和类型,对古籍文本中的实体进行识别和预测。其次,本文引入多数投票(Majority Voting Combiner,MVC)和合并(Union Combiner,UC)的方法,与预测数据集进行整合并构建新的数据集,基于已识别实体数据集,使用MVC和UC方法结合NER(Named Entity Recognition)模型的预测结果重新生成新的数据集。最后,通过学习判断Sequence Labeling、Sequence Labeling_CRF、Span-level Prediction方法对实体的预测结果是否错误,并使用提示的思路对模型进行微调。为验证本文提出的方法,采用评估指标来验证模型的效果。实验结果表明,UC方法的加入使得实体识别的召回率显著提升,MVC方法提升了模型的F1值。
2025 Vol. 44 (6): 736-747 [摘要] ( 5 ) HTML (1 KB)  PDF (1221 KB)  ( 1 )
748 Patent-BARTKPG:基于对比学习的中文专利关键技术词生成研究 Hot!
冉从敬, 刘省身, 王浩伟, 梁玉莲, 王福新
DOI: 10.3772/j.issn.1000-0135.2025.06.008
传统的关键词抽取方法在专利关键技术词生成领域准确度不足,这主要表现为过度依赖文本中的字面内容、生成关键技术词序列中的冗余信息以及与目标关键技术词的不一致性。为此,本文结合中文专利文本特有的语料特性,深入探索如何实现更精准的关键技术词生成,提出一种两阶段的专利关键技术词抽取-生成和重排模型,并在两个阶段中引入对比学习训练策略,以进一步增强模型性能。最终,本文构建了一个中文专利关键技术词生成模型Patent-BARTKPG,实现了中文专利文本的关键技术词的精准生成。研究结果表明,Patent-BARTKPG模型在中文专利数据集上的关键技术词生成效果显著优于其他关键技术词抽取和生成模型,初步实现了中文专利领域关键技术词的高质量生成。
2025 Vol. 44 (6): 748-760 [摘要] ( 6 ) HTML (1 KB)  PDF (3961 KB)  ( 2 )
761 基于富语义词元的大模型生成策略优化 Hot!
程齐凯, 石湘, 于丰畅, 黄圣智
DOI: 10.3772/j.issn.1000-0135.2025.06.009
近年来,通用大模型技术取得了显著进展,但在科技情报领域的应用中,仍面临推理效率低下和领域任务适配性不足的问题。为此,本文系统地分析了大模型的生成机制,并提出了“富语义词元”概念,旨在描述大模型在生成过程中倾向产生的、具有语义聚合性、上下文依赖性或任务相关性的词元或词元序列。基于该概念,本文设计了一种基于生成偏好的大小模型协同生成策略。通过富语义词元的挖掘、复制机制及动态验证策略,实现在小模型与大模型之间的协同作用,推动大模型由逐词元生成向多个词元同步生成的转变,从而提升生成效率与任务适配性。本文从生成性能、泛用性和生成效率三个维度对该生成优化策略进行了评估。研究结果表明,该策略在法律、医学和新闻百科等多个领域任务中的评估指标均优于传统生成优化方法。本文为大模型生成优化、任务适配性提升以及可信可靠大模型构建提供了新的理论基础和实践路径。
2025 Vol. 44 (6): 761-782 [摘要] ( 8 ) HTML (1 KB)  PDF (4934 KB)  ( 0 )
情报综述与述评
783 科技评价中的代表作:概念、内涵及特征研究 Hot!
张震, 徐晓婷, 成颖
DOI: 10.3772/j.issn.1000-0135.2025.06.010
代表作制度是我国新时代科技评价改革的重要内容,现有研究尚缺乏对代表作全面、清晰且科学的理解。本研究搜集了多源语料,包括半结构化访谈文本、国内外文件以及网络帖文,采用扎根理论提炼了代表作的特征(基础质量、学术价值、相关性、合规性、影响力、学术竞争力),构建了特征间关系的概念模型,并归纳了代表作的定义,即代表作是满足基础质量与合规性,具有学术价值、影响力以及相关性,能展现科研人员学术竞争力的科研成果。研究结果表明,科研人员通过成果的基础质量、学术价值、相关性以及合规性形成影响力,并通过这5项展现其自身的学术竞争力。本研究深化了对代表作的理解,对践行代表作制度的科研人员、同行评议专家以及科研管理部门具有重要的理论与实践价值。
2025 Vol. 44 (6): 783-796 [摘要] ( 15 ) HTML (1 KB)  PDF (1058 KB)  ( 10 )