带摘要目录

2026年 第45卷 第3期
刊出日期:2026-04-25

情报理论与方法
情报技术与应用
情报理论与方法
319 基于语义相似性的引用贡献归属:揭示直接引用中的隐性被引来源 Hot!
杨思洛, 吴丽娟, 吴碧瑶
DOI: 10.3772/j.issn.1000-0135.2026.03.001
为精准识别直接引用中未被标注的隐性贡献与隐性被引文献,本文构建基于引用标记与语义相似性的引用贡献归属方法,探讨将隐性贡献纳入学术评价的必要性,为科研贡献归因提供新视角。以CL-SciSumm 2017数据集作为实证对象,先采用两类引用贡献归属方法测算焦点文献的显性贡献,再将剩余贡献界定为其参考文献的隐性贡献,并按平等原则与语义相似性分配权重;以传统直接引用评价、引文级联评价作为对照,比较隐性被引文献的贡献得分差异。结果显示,焦点文献的参考文献对其引证文献存在隐性贡献;基于语义相似性的归属方法对隐性被引来源识别更全面,但识别精度仍需提升;本文方法与传统方法所得贡献得分差异显著,隐性贡献应被纳入文献学术贡献评价体系。
2026 Vol. 45 (3): 319-331 [摘要] ( 8 ) HTML (139 KB)  PDF (4588 KB)  ( 8 )
332 基于XGBoost-SHAP框架的科研合作频次归因分析 Hot!
彭兆祺, 石斌, 杨杰, 邓三鸿
DOI: 10.3772/j.issn.1000-0135.2026.03.002
科研合作频次的背后蕴含着复杂的合作特征,在揭示科研人员合作关系的强度与模式方面具有关键作用。本研究选取生物医学领域数据集PKG 2.0(PubMed knowledge graph 2.0)中的13220951条真实合作关系作为样本,旨在揭示不同合作频次背后的关键驱动因素和内在规律。首先,以合作频次作为表征合作关系强度的代理变量,并根据其数据分布特征将频次划分为低频、中频和高频合作;其次,选择研究相似度、成果生产模式、学术资本和个体属性等维度的10类差异性变量,作为描述作者间合作关系的特征体系,并运用XGBoost(extreme gradient boosting)算法捕捉高维特征间的复杂关联;最后,通过SHAP(shapley additive explanations)解释框架对预测模型进行归因分析,以评估特征对不同合作频次的影响程度和交互机制。本研究发现,作者间研究主题相似度在合作频次分类中发挥主要作用,其次为论文数量差异、总被引用次数差异和均被引次数差异。研究主题高相似是维持高频合作的核心要素,低频合作则更关注总量积累而非个体论文影响力。研究主题相似度、论文数量差异与H指数差异对合作频次的作用模式分别为双峰对称型、阈值稳定型及边际递减型。此外,高频合作对知识结构或影响力构成等异质性因素具有显著的包容性,其背后往往形成了以互补为导向的有效分工机制。
2026 Vol. 45 (3): 332-349 [摘要] ( 16 ) HTML (160 KB)  PDF (5671 KB)  ( 8 )
350 基于异质图神经网络的学者研究主题推荐方法研究 Hot!
霍朝光, 但婷婷, 逄增瑶
DOI: 10.3772/j.issn.1000-0135.2026.03.003
研究主题的选择对于学者科研生涯发展至关重要,但如何从海量学术资源中筛选出契合学者研究基础和研究兴趣的主题仍是一大难题。为此,本文构建了一个面向学者的个性化主题推荐模型,旨在帮助学者快速筛选契合其研究基础和研究兴趣的主题。针对现有推荐方法在学习网络中节点类型与关系类型异质性方面的不足,本文提出一种基于异质图神经网络的学者研究主题推荐模型,构建基于HAN(heterogeneous graph attention network)、HGT(heterogeneous graph transformer)、HGCL(heterogeneous graph contrastive learning)的三种学者和主题特征聚合模式,强调利用消息传递与聚合机制等学习学者与主题间的复杂交互模式,刻画主题扩散与学者选题的规律,在特征聚合基础上,通过逻辑回归、随机森林和多层感知机等分类器进行推荐判别。以Scopus数据库中6521名中国人民大学学者及其涉猎的3万多个研究主题数据为例进行实证检验,研究发现,基于HGCL整合多层感知机的推荐模型精确率最高,达到88.25%,相对于基线模型SVD提升了9.29个百分点;基于HAN整合多层感知机的推荐模型在召回率和F1值上的表现最佳,分别达到96.41%和91.92%,相对于基线模型SVD分别提升了17.21和12.56个百分点。本文首次构建学者研究主题推荐模型,强调对学者与主题节点异质性和关系异质性的表征与学习,为学者个性化选题以及主题层面的学术资源推荐提供了参考。
2026 Vol. 45 (3): 350-362 [摘要] ( 8 ) HTML (174 KB)  PDF (2667 KB)  ( 3 )
363 基于CCA的学术论文画像:理论框架与实证研究 Hot!
王心玥, 赵丹群
DOI: 10.3772/j.issn.1000-0135.2026.03.004
学术论文画像主要分为基于原文语料的静态画像和基于引文语料的动态画像两大类。本文聚焦后者,将最新的引文内容分析(citation content analysis,CCA)方法引入画像研究,通过收集同行引用语料对论文发表后产生的“学术影响”进行动态刻画和精准标识,画像成果对论文评价和学术资源检索/推荐等下游任务的解决具有重要支撑作用。首先,基于理论分析,构建“影响力-影响域-影响路径”三维度学术论文画像框架(impact power,impact field & impact path,Im-PFP);其次,选择单篇高被引文献“Co-citation in the scientific literature:a new measure of the relationship between two documents”(Small,1973)作为研究案例,运用自建的完整引文语料集,开展论文画像实证研究。实证研究检验了所提三维度画像框架Im-PFP的普适性和应用价值,其可拓展到不同学科领域的单篇或多篇高被引论文的画像研究。画像结果不仅可对案例文献的学术生命周期进行阶段划分,还可对其学术影响力、影响域和影响路径的历时性变化进行深入解读和评价分析。
2026 Vol. 45 (3): 363-375 [摘要] ( 6 ) HTML (137 KB)  PDF (4080 KB)  ( 5 )
376 基于异质图嵌入与链路预测的技术研发合作伙伴识别研究 Hot!
潘虹, 王明, 赵凯, 翟亮, 梁国强, 翟东升
DOI: 10.3772/j.issn.1000-0135.2026.03.005
技术研发合作伙伴识别是提升创新绩效的关键。针对现有方法中技术研发主体属性刻画有限、合作矩阵稀疏导致识别精度受限的问题,本文提出一种融合异质图嵌入与链路预测的技术研发合作伙伴识别模型(technology development partner identification integrating heterogeneous graph embedding link prediction,HGE-LP-TDPI)。首先,构造技术研发合作伙伴识别领域本体结构,基于大语言模型(large language model,LLM)对专利说明书进行语义抽取,生成包含技术研发主体多维技术关联的异质图。其次,设计表征技术关联的元路径,通过LSTM(long short-term memory)时序编码器与多级注意力机制聚合语义信息。最后,基于链路预测算法识别合作伙伴。电化学储能领域的实证研究结果表明:第一,HGE-LP-TDPI模型在AUC(area under curve)值等关键指标上显著优于基准模型,AUC值达95.62%,验证了多维技术关联融合与异质图嵌入对解决数据稀疏性问题的有效性;第二,元路径权重分析揭示了技术问题驱动是合作形成的核心因素,应用领域与技术功效的影响次之;第三,属性消融实验结果表明,技术维度和知识维度属性对本文模型结果贡献度最高。
2026 Vol. 45 (3): 376-392 [摘要] ( 5 ) HTML (251 KB)  PDF (3743 KB)  ( 2 )
393 锚点—成线—固网:资源依赖理论下的公共数据要素潜能释放路径 Hot!
马海群, 张斌
DOI: 10.3772/j.issn.1000-0135.2026.03.006
为实现公共数据要素潜能释放目标,本文聚焦“共享—开放—授权运营”三阶段中“数据孤岛”、标准缺失、隐私与监管不足等结构性障碍,提出以资源依赖理论统摄的“锚点—成线—固网”路径框架,旨在打通跨部门、跨行业的数据流通链条,提升制度供给与市场化配置的协同效率。构建以共享为“锚点”、以开放为“成线”、以授权运营为“固网”的分析框架,遵循“困境解构—路径重构”的逻辑,逐层识别瓶颈并提出对策:标准化与平台化联通起点,分级开放与隐私保护拓展链条,分级授权与透明监管稳固网络,并通过利益分配与流程优化提升运行绩效。研究结果表明,三个层次呈现明显的“层级依赖”和“层次加深”的关系;“锚点”经统一标准与平台化连接破除“数据孤岛”,而“成线”凭分级开放与安全机制实现高可信流通,“固网”以规范授权、强化监管与优化分配构筑稳定生态;提出制定统一的数据标准与激励政策,构建“锚点”高效连接的基础;制定分级开放政策与安全保障措施,促进“成线”路径的延展;建立规范的授权运营与监督机制,确保“固网”路径的稳健发展。
2026 Vol. 45 (3): 393-401 [摘要] ( 6 ) HTML (96 KB)  PDF (1286 KB)  ( 4 )
402 群体智能赋能的文化遗产智慧数据生成及其场景化服务模式研究 Hot!
杨思敏, 王昊
DOI: 10.3772/j.issn.1000-0135.2026.03.007
群体智能基于人机智能涌现,为文化遗产资源与服务数智化转型提供人机协同新范式。本文旨在借群体智能赋能,实现文化遗产智慧数据生成与场景服务的动态耦合,推动其数据与服务协同升级。首先,通过文献分析,梳理群体智能在智慧数据生成与场景化服务中的应用现状;其次,探讨其赋能下智慧数据“数据—学习—智慧”的生成路径,并解析其构成要素,继而围绕需求、服务与技术三个维度,阐述文化遗产智慧数据场景化服务模式逻辑;最后,以非物质文化遗产传统工艺领域预防性保护场景为案例,展示群体智能在工艺濒危与市场质量风险预警及智能决策服务中的应用效能,以期发挥群体智能在“隐性知识显性化、AI黑箱破解、跨主体协同增效”方面的作用,为数智时代文化遗产智慧化发展提供理论参考。
2026 Vol. 45 (3): 402-416 [摘要] ( 6 ) HTML (135 KB)  PDF (3988 KB)  ( 3 )
417 符号互动理论视角下融合异质超网络表示学习的社交媒体舆情用户角色识别研究 Hot!
沈旺, 孙珂, 李贺, 刘嘉宇
DOI: 10.3772/j.issn.1000-0135.2026.03.008
社交媒体舆情分析面临的核心挑战在于其多维度、异构化的信息交互机制,这使得准确识别用户角色成为理解信息扩散规律和实施精准舆情引导的关键。针对当前研究过度聚焦于高影响力用户的识别及未能有效融合语义信息与网络拓扑结构的问题,本文提出一种融合符号互动理论与异质超网络表示学习的用户角色识别方法。首先,基于符号互动理论,构建包含社交行为层、信息传播层和主题语义层的三层异质超网络模型,系统刻画用户的多维互动特征;其次,设计包含多层图注意力网络和基于“用户-信息-主题”元路径的跨网络特征融合策略的异质超网络表示学习,实现节点特征表征的增强,并生成具有语义一致性的用户融合特征向量;最后,采用k-means聚类算法实现用户角色的无监督识别,并结合t-SNE(t-distributed stochastic neighbor embedding)技术进行可视化验证。在真实社交媒体舆情数据集上的实验结果表明,本文模型能够有效融合多源异构信息,提升用户角色识别的准确性和可解释性,消融实验进一步验证了各模块的有效性。本文方法不仅为舆情分析提供了新的技术路径,其可解释的特征融合机制更为实施差异化的精准治理策略提供了科学依据。
2026 Vol. 45 (3): 417-432 [摘要] ( 4 ) HTML (207 KB)  PDF (6864 KB)  ( 5 )
情报技术与应用
433 基于语义图提示学习的篇章事件抽取框架 Hot!
余传明, 成伟
DOI: 10.3772/j.issn.1000-0135.2026.03.009
为解决现有模型主要聚焦于句子级的语义抽象,难以充分发挥AMR(abstract meaning representation)语义结构信息以及语义依赖关系优势的问题,本文提出一种基于语义图提示的篇章事件抽取框架(semantic graph prompt learning for document-level event extraction,SeGPL),通过引入多粒度AMR融合机制和自适应的图提示特征,有效增强了模型的语义建模能力。与最优基线模型TSAR(two-stream AMR-enhanced extraction model)相比,在WikiEvents数据集上,SeGPL在论元识别和论元分类任务中的head F1分数分别提升了2.16和3.36个百分点;在RAMS(richly annotated multilingual schema-guided event structure)数据集中,span F1分数和head F1分数分别提升了0.41和1.13个百分点,为解决长文本中的事件信息抽取提供了参考。
2026 Vol. 45 (3): 433-446 [摘要] ( 3 ) HTML (190 KB)  PDF (3364 KB)  ( 4 )
447 慢性病智能医疗问答系统构建与评价:一种基于GraphRAGMoE的混合建模方法 Hot!
马鑫, 王芳, 张峰, 李照川
DOI: 10.3772/j.issn.1000-0135.2026.03.010
随着慢性病成为全球公共卫生领域的核心挑战,患者对高质量、个性化、可持续的健康信息服务需求日益增长。近年来,尽管大语言模型在医疗问答任务中展现出显著优势,但现有系统在面对慢性病管理这一长期性、情境化、语义复杂的场景时,仍面临知识调度粒度粗、语义感知能力弱与模型响应一致性差等瓶颈。为此,本研究遵循“结构化知识建模—混合驱动检索—大模型协同应答”三阶段流程,提出一种融合图检索增强生成(graph retrieval-augmented generation,GraphRAG)与混合专家网络(mixture of experts,MoE)的慢性病问答系统。首先,构建覆盖疾病演化、生活方式干预和长期管理要素的多源异构专有知识图谱,通过结合关键词匹配、语义向量召回与多子图提示融合的三通道混合图谱检索机制,实现对复杂信息需求的动态知识调度;其次,初筛用户查询合法性与规范性,结合用户隐含意图与融合子图,通过MoE动态门控智能体对9种开源大模型进行指令级协同,实现语义深度与生成精度的双擎增强;最后,引入常识校验、内容完整性检查与格式化规则,精细预生成文本,确保输出结果的准确性、完整性与语言可读性。本研究自建覆盖118种慢性病与3类管理任务的测试集CdMedQA,综合采用客观指标评价和主观满意度对比两种方式验证系统性能。结果表明,本研究构建系统在准确性、清晰度、个性化及情境适应性等方面显著优于多种通用与医疗垂直大模型基线。研究结果不仅为慢性病智能化管理提供了新路径,也为多源知识驱动下人机交互优化与生成内容可信性提升提供了理论支持与技术方案。
2026 Vol. 45 (3): 447-462 [摘要] ( 6 ) HTML (195 KB)  PDF (4293 KB)  ( 2 )