带摘要目录

2025年 第44卷 第4期
刊出日期:2025-04-24

情报理论与方法
情报技术与应用
情报用户与行为
情报学科发展与建设
情报理论与方法
381 政策引用视角下政策核心要素变迁与治理结构演进 Hot!
巴志超, 范呈镭, 刘蕾蕾, 李纲
DOI: 10.3772/j.issn.1000-0135.2025.04.001
识别政策体系中的核心要素与结构有助于追踪政策执政理念变迁与演进规律,揭示政策制定与设计范式和推动政策要素复用与迁移。基于政策内容挖掘和引用网络分析方法,揭示特定领域核心政策目标、工具与措施要素变迁路径和治理结构。首先,构建特定领域政策要素模板库,基于机器学习算法识别与提取政策体系中语境要素及引用关系;其次,引入政策文献特有属性和引证特征,提出节点跳转概率优化的PageRank算法以精准识别不同时期核心要素并构建时序引用网络;最后,分析政策目标、工具和措施子要素的动态排序与网络结构演进,揭示特定领域核心要素变迁路径、配置结构特征与政府治理规律。以1980—2020年中国大规模能源政策为研究样本,研究发现,考虑政策属性的PageRank算法优化更能准确评估政策体系中不同政策要素的实际影响力和重要性;能源领域政策目标呈现多层次、多样化的演进结构,政策工具注意力偏好表现出“环境型政策工具>需求型政策工具>供给型政策工具”的分布特征;政策治理手段逐渐趋于完善与合理,政策变迁呈现兼容性和渐进式的演进路径。
2025 Vol. 44 (4): 381-397 [摘要] ( 11 ) HTML (167 KB)  PDF (9791 KB)  ( 41 )
398 基于系统思维的颠覆性技术弱信号分析理论研究 Hot!
唐虎林, 苏成, 李旺雨
DOI: 10.3772/j.issn.1000-0135.2025.04.002
随着新一轮科技革命和产业变革在全球范围内加速推进,颠覆性技术的加速涌现已经成为当今社会的一个普遍趋势。颠覆性技术弱信号具有碎片化、模糊性和表现形式多样等特点,这给理解、分析和利用颠覆性技术弱信号带来了极大的挑战。系统思维提供了一种全面、整体的视角,为深入探究颠覆性技术弱信号的本质和规律提供了可能。本研究基于系统思维的研究理念,开展了颠覆性技术弱信号的理论探究,提出了颠覆性技术早期发展模型。该理论模型表明颠覆性技术在创新链的技术发展闭环中得到发展。其中,在颠覆性技术发展系统的内部要素中,概念验证的概念得到了延伸;在概念验证中,方法技术等的创新效果得以揭示,技术价值得以验证,并向外部环境要素释放重要信号;在弱信号的探测过程中,应当重点关注指示具备开创性创新成果的弱信号。该模型为基于弱信号的颠覆性技术早期识别提供了理论支撑。
2025 Vol. 44 (4): 398-413 [摘要] ( 14 ) HTML (156 KB)  PDF (1825 KB)  ( 16 )
情报技术与应用
414 基于PU学习的科技领域文献集自动降噪方法研究 Hot!
陈果, 杨泽雨, 陈晶, 邵雨
DOI: 10.3772/j.issn.1000-0135.2025.04.003
在开展领域文献分析时,通过惯用方式构造的文献集普遍存在相当比例的非领域相关文献,降低了最终结果的可靠性,因此,有必要对其开展降噪以剔除杂质。如何实现在无人工标注的前提下开展文献集的自动降噪,是保障降噪方案的领域泛化性、实践应用可行性的必要前提。本文在充分利用原始文献集自身特征的前提下,将领域文献集降噪任务转化为一个在自动构造正负样本集基础上的分类问题;其思路是利用文献集当中自然存在且易识别的一批绝对正样本集,开展PU(positive-unlabeled)分类学习,定位出一批可靠负样本集,以训练最终分类器。本文以人工智能、经济学和免疫学领域MAG(Microsoft Academic Graph)期刊文献集为例,开展了对比实验,比较了降噪方案中选择不同语义表示方法对最终降噪性能的影响,进一步构造了一个基准比较值,引入归一化折扣累积收益这一评价指标,从降噪收益、最终结果可用性以及文献降噪在科技领域情报分析多种任务场景下的有效性3个方面证明了本文方案的有效性。
2025 Vol. 44 (4): 414-424 [摘要] ( 11 ) HTML (119 KB)  PDF (2484 KB)  ( 9 )
425 基于大模型微调的生成式文献层次分类标引 Hot!
胡忠义, 税典程, 吴江
DOI: 10.3772/j.issn.1000-0135.2025.04.004
对文献进行自动的分类标引,有利于实现文献的分类存储、排列和检索。已有研究通常采用判别式模型对文献的浅层类别进行自动识别,而在深层次类别划分和准确性方面能力不足。鉴于此,本研究将文献的层次分类问题转换为文献层次类别标签的生成任务,并构建了基于大模型微调的生成式文献层次分类标引框架。首先,该框架采用自然语言的形式对文献的层次分类号进行标签解释;其次,采用高效微调技术对开源大语言模型进行有监督微调;最后,采用微调后的大模型直接生成文献的多层分类标签,通过标签映射得到文献的中图分类号。在经济、医药卫生和工业技术三类学科数据上进行实验检验,结果表明,有监督微调能够有效提升通用大语言模型在文献层次分类标引任务上的理解与推理能力,也取得了比传统判别式模型更好的分类性能;整合文献的摘要、题名和关键词,可以有效提升微调大语言模型的分类性能;通过对比不同参数规模的Baichuan2和Qwen1.5大模型,发现微调后的Qwen1.5-14B-Chat模型表现最佳,其在一级类目上能够达到98%的分类性能,在最具挑战性的五级类目上也达到了80%的准确性;典型样例分析展示了微调后的Qwen1.5-14B-Chat具备一定的纠错能力。
2025 Vol. 44 (4): 425-437 [摘要] ( 10 ) HTML (176 KB)  PDF (1606 KB)  ( 29 )
438 融合语义增强和知识蒸馏的学术文献知识实体抽取方法研究 Hot!
王玉龙, 秦春秀, 马续补, 吕树月, 李凡
DOI: 10.3772/j.issn.1000-0135.2025.04.005
准确识别和提取海量学术文献中蕴含的各类知识实体,对于精准满足科研人员的知识需求、促进细粒度知识发现具有重要意义。针对学术文献中领域知识实体数据稀疏和不均衡等问题,本研究提出一种融合语义增强和知识蒸馏的知识实体抽取改进方案。首先,本研究提出语义增强的教师模型。一方面,通过构建融合SciBERT(bidirectional encoder representations from transformers for scientific text)和ELMo(embeddings from language models)模型的嵌入表示方法,将全局语义与动态词义信息相结合生成更加全面的语义表示,从而提升教师模型对领域学术文献复杂上下文的建模能力;另一方面,基于领域预训练词嵌入模型筛选出与知识实体语义关联度最高的Top n单词或短语,并结合注意力和门控机制对增强的实体语义信息进行动态加权,以有效缓解实体数据稀疏和长尾类别建模的不足。其次,采用一组异构的单一实体教师模型,生成不同教师模型在聚合数据集下的概率分布结果,并以此来指导学生模型的训练。最后,本研究利用材料科学领域的三个公开数据集验证所提方法的有效性。实验结果表明,所提方法在材料科学领域的三个数据集上均取得了最高的micro F1和macro F1,并且在实体数据稀疏和不均衡等情境下,具有显著的鲁棒性和泛化能力。
2025 Vol. 44 (4): 438-451 [摘要] ( 10 ) HTML (233 KB)  PDF (1520 KB)  ( 23 )
452 基于汉字多模信息与象形视觉对齐增强的古籍文本命名实体识别研究 Hot!
郑旭辉, 王昊, 裘靖文
DOI: 10.3772/j.issn.1000-0135.2025.04.006
古籍的语义解析与人文计算是建设文化强国的重要组成部分,而古籍文本命名实体识别(named entity recognition,NER)是开展后续古籍知识发现与组织的前提和基础,设计一种适用于简体化文言文特性的命名实体识别模型具有重要的研究意义。汉字本身具有大量象形特征的视觉信息与发音信息,这些更贴合汉字发展历史的知识能够为识别古籍中的实体提供更多的信息以提高模型性能。基于此,本文构建了基于多模态汉字象形表示的GMAE-NER(guwen multi-information alignment enhanced NER)模型,该模型创新性地提出了汉字象形层面里图像与笔画信息的多模态特征处理和对齐方法,实现了将BERT(bidirectional encoder representations from transformers)表征与汉字视觉信息、发音信息相融合,有效增强了古籍文本命名实体识别的效果。本文将模型在纪传体史书《后汉书》上进行了大量的实验与对比,发现相较于基线模型,GMAE-NER在各个类别实体识别的F1指标上均得到了1.32~15.00个百分点的提升,并且能更好地识别出古籍文本中重叠表述的实体,消融分析结果也充分证明了该模型中视觉编码、发音编码与特征融合模块的有效性。
2025 Vol. 44 (4): 452-465 [摘要] ( 10 ) HTML (241 KB)  PDF (4266 KB)  ( 8 )
466 多模态特征影响下辟谣短视频互动效果研究:基于意见氛围中介视角 Hot!
付少雄, 曾源来, 邓胜利
DOI: 10.3772/j.issn.1000-0135.2025.04.007
短视频辟谣的关键在于提升辟谣信息互动效果。为此,分析辟谣短视频多模态特征对互动效果的影响,可为辟谣短视频辟谣效果的提升以及短视频平台内容生态治理提供依据。本研究面向社会认知理论,基于意见氛围中介视角,构建多模态特征影响下辟谣短视频互动效果研究模型。通过抓取抖音短视频平台上2846条有效辟谣短视频数据,采用回归分析,结合情感分析、图像识别与中介效应检验,探究辟谣短视频的发布者头像、内容及标题特征如何影响用户意见氛围,进而分析意见氛围对互动效果的影响。回归分析结果表明,关于外部环境因素与用户群体状态,头像清晰度显著负向影响用户意见氛围,头像真实性、短视频主题、短视频时长、辟谣主体、标题长度及标题情感极性显著正向影响用户意见氛围;关于用户群体状态与群体行为反应,用户意见氛围显著正向影响短视频互动效果。在外部环境因素对群体行为反应的影响中,用户意见氛围发挥完全/部分中介作用。本研究以意见氛围为中介,关联辟谣短视频多模态特征与互动效果,明晰了辟谣短视频互动效果的影响因素,延展了辟谣短视频的研究视角,拓展了社会认知理论的研究情境,丰富了信息行为研究的理论与实践体系。
2025 Vol. 44 (4): 466-481 [摘要] ( 7 ) HTML (226 KB)  PDF (1474 KB)  ( 27 )
情报用户与行为
482 融合学术用户多类行为序列特征的文献下载行为预测研究 Hot!
张晓娟, 郭佳润, 杨诗涵, 桂思思
DOI: 10.3772/j.issn.1000-0135.2025.04.008
在学术搜索系统中,根据某学术用户历史搜索行为对该用户在下一时间段中所需文献的数量和时间进行预测,有助于提升用户对学术文献推荐结果的满意度。本文通过挖掘学术用户各类行为序列特征提高学术用户下载行为(下一下载session中的下载次数以及距下一下载session的时间间隔)预测的准确度。首先,本文将学术用户下载行为预测问题转化为时间序列预测问题;其次,分别从学术用户查询重构行为、查询表达式与下载行为三个角度抽取特征,并在此基础上利用LSTM(long short-term memory)模型将学术用户历史session建模为时间序列,从而实现对下载行为的预测;最后,对比分析本文提出特征与已有研究提出特征的预测性能,分别探讨不同特征集合以及单个特征的预测效果。本文提出的特征能提高预测任务的准确度,基于对不同学术用户的聚类,在不同类簇上训练得到的LSTM模型具有最佳的整体预测性能。其中,查询表达式相关特征对下一下载session中的下载次数预测效果最佳,下载行为相关特征对距下一下载session的时间间隔预测效果最佳。
2025 Vol. 44 (4): 482-494 [摘要] ( 4 ) HTML (243 KB)  PDF (1266 KB)  ( 21 )
情报学科发展与建设
495 在两个IS融合基础上夯实新时代情报学的学科独立性 Hot!
肖勇
DOI: 10.3772/j.issn.1000-0135.2025.04.009
针对国内学界围绕“情报学的学科独立性”出现了质疑观点并由此引发争论的现象,本文强调,明确且夯实新时代情报学的学科独立性对于实现该学科可持续、高质量发展,尤其具有现实意义和紧迫性。在新时代情报学学科建设中,应当正视同时存在着两个IS研究这一事实,在实施有效策略推动两个IS深度融合基础上来划清学科边界并明晰专属研究领域,沿此路径进而识别确定专属核心研究领域,即“人类智能主导的、专门为解决特定问题及时提供有针对性的‘激活态/活化态’知识的智能系统运行与构成及其信息运动特殊规律”,从而最终构筑起有效支撑新时代情报学学科独立性的牢固基石。本文的研究结论清楚表明,新时代情报学的学科独立性不容置疑。
2025 Vol. 44 (4): 495-508 [摘要] ( 6 ) HTML (142 KB)  PDF (863 KB)  ( 22 )