带摘要目录

2024年 第43卷 第5期
刊出日期:2024-05-24

情报理论与方法
情报技术与应用
情报理论与方法
503 技术团队跨学科性对突破性创新的影响研究 Hot!
丁乐蓉, 石静, 吴柯烨, 孙建军
DOI: 10.3772/j.issn.1000-0135.2024.05.001
为探索技术团队跨学科性对突破性创新的影响,本文在PATSTAT(Worldwide Patent Statistical Database,全球专利统计数据库)生物制药专利数据的基础上,从多样性、均衡性和差异性3个维度测度技术团队跨学科性,使用突破性创新程度(D指数)和突破性创新数量量化团队突破性创新成果,采用多元线性回归方法分析技术团队跨学科性对突破性创新的影响,并通过调整引用时间窗对结论进行鲁棒性检验。研究发现:①在生物制药领域,技术团队跨学科性对突破性创新具有显著影响,具体表现为技术团队多样性水平越高,团队越倾向于产出更多高突破性的创新成果;技术团队均衡性越高,团队的突破性创新成果越符合“少而美”的特点;技术团队差异性越大,团队创新成果的突破性程度越低。②生物制药领域技术团队以10人以下小规模团队为主,其中年轻的、非跨国的小规模团队更有可能产出突破性较强的创新成果。
2024 Vol. 43 (5): 503-515 [摘要] ( 110 ) HTML (185 KB)  PDF (1351 KB)  ( 157 )
516 基于学术网络的跨学科论文推荐研究 Hot!
杜瑾, 熊回香, 向瀛泓
DOI: 10.3772/j.issn.1000-0135.2024.05.002
为满足情报学科研人员对跨学科论文的需求,本文构建了基于学术网络的跨学科论文推荐模型。首先,根据论文关键词耦合网络及作者对论文的引用网络特征,挖掘作者与论文的相关性,实现基于关键词耦合的论文推荐;其次,利用作者引文耦合网络特征及作者跨学科引用关系、论文共被引关系与论文的学科属性,分别挖掘作者与论文的跨学科性,并计算跨学科性相似度,实现基于学科相似性的论文推荐;最后,结合基于关键词耦合的论文推荐和基于学科相似性的论文推荐,实现跨学科论文混合推荐。以CSSCI(Chinese Social Sciences Citation Index)数据库中的数据对模型进行验证,实证结果表明,本文提出的推荐模型推荐结果具备跨学科性;与基于关键词耦合的论文推荐方法相比,结合跨学科特征后在作者推荐成功率、平均准确率和平均召回率上均有提高。
2024 Vol. 43 (5): 516-527 [摘要] ( 129 ) HTML (239 KB)  PDF (1232 KB)  ( 96 )
528 复杂信息环境下的情报快速反应机制研究 Hot!
苏成, 赵润博, 黄雁宁, 赵筱媛
DOI: 10.3772/j.issn.1000-0135.2024.05.003
在科技飞速发展和大国博弈日益白热化的背景下,情报成为抢占国家发展先机的重要工具之一。在复杂信息环境的情报生产新环境和决策新要求下,本文以如何实现情报支撑国家战略决策为研究问题,通过文献调研与案例分析等方法,在总结梳理相关理论和实践经验的基础上,对情报快速反应机制的内涵、特征和决策支撑场景进行深入探究。本文创新性地提出一套适用于复杂信息环境下的“3+5+9情报快速反应机制”,以“早发现、早预判、早报告、早决策、早应对”为五大核心目标,以“联动协调、信息监测、信息资源、情报分析、应急处置、技术支撑、专家协作、组织保障、跟踪评估监督”为九大支撑子体系,适用于常态化监测、回应关切和突发应急三类重要决策支撑场景的情报工作机制,以期为未来相关实践提供较为扎实的理论基础。
2024 Vol. 43 (5): 528-537 [摘要] ( 60 ) HTML (90 KB)  PDF (1007 KB)  ( 253 )
538 面向信息公开的突发公共卫生事件知识表示模型构建 Hot!
相雅凡, 刘东苏, 马续补, 秦春秀, 时莹
DOI: 10.3772/j.issn.1000-0135.2024.05.004
近年来,突发公共卫生事件频发给政府应急管理带来了极大挑战。政府及时公开事件信息有助于消除公众恐慌,对于疫情防控和社会经济发展至关重要。然而,当前突发公共卫生事件信息以碎片化、不连续、不完整方式散落在不同位置,未能较好地集成融合。如何对海量、多样、变化的信息进行描述与组织是政府应急管理的关键。因此,本文面向信息公开,融合知识图谱和事理图谱,构建突发公共卫生事件知识表示模型,并对其中的核心概念及关系进行表示,提出了一种既能刻画疫情时空演化状态,又能展示疫情信息的突发公共卫生事件信息组织方法。研究结果显示,本文构建的知识表示模型具有较好的垂直性质,能够展示较为丰富的概念关系和属性特征,大部分类能够得到实例填充。本文提出的知识表示模型为突发事件知识库构建提供新思路,扩充了突发事件信息组织的方法体系,有助于存量信息公开与价值释放,进一步满足公众的信息需求,提升应急管理效果。
2024 Vol. 43 (5): 538-552 [摘要] ( 62 ) HTML (152 KB)  PDF (2986 KB)  ( 75 )
553 基于大数据元分析的调节效应识别:基础模型与实证检验 Hot!
林伟杰, 周文杰, 魏志鹏, 杨克虎
DOI: 10.3772/j.issn.1000-0135.2024.05.005
作为实证研究中识别因果关系的一种重要方法,调节效应检验有助于揭示自变量和因变量之间的深层次关系,然而该方法存在无法获得真实效应值且外部效度低等问题。受限于原始研究与生俱来的缺陷,循证领域亟待发展出新的调节效应识别模型。本研究采用大数据循证理念,利用循环方法对控制变量进行排列组合,从而模拟了“穷尽”所有可能的原始研究设计,对全部可能的变量间关系进行了回归分析并记录所有效应值。进而,使用元分析法对全部原始效应量进行全覆盖式合并,以获得真实的效应值,以此提升调节效应结果的外部效度。最后,本研究以信息贫困研究为例,详细展示了大数据循证视角下调节效应识别的所有流程。本研究的主要贡献在于完善了大数据循证理念下的元分析方法体系,从大量原始研究效应中提取了真实效应值,提高了调节效应的外部效度与因果关系识别的可靠性。
2024 Vol. 43 (5): 553-562 [摘要] ( 74 ) HTML (129 KB)  PDF (1241 KB)  ( 84 )
情报技术与应用
563 融合SVM-LDA与加权相似度的潜在新兴技术识别研究——以人工智能领域为例 Hot!
冉从敬, 田文芳
DOI: 10.3772/j.issn.1000-0135.2024.05.006
在新一轮科技革命和产业变革加速发展的大背景下,如何在新技术不断涌现的技术大海中精准找到和识别出有颠覆性潜力的新兴技术,对于国家、企业参与主体和相关商业投资机构把握科技创新发展趋势和方向、合理配置科技资源、提前进行科技战略规划与技术布局具有重要的意义。本文提出一种基于知识增强SVM-LDA(Support Vector Machine - Latent Dirichlet Allocation)的新兴技术主题识别模型。首先,基于专家小组的先验知识,制定基础技术类别划分标准;其次,将技术类别划分标准作为先验知识输入SVM-LDA模型,得到技术主题聚类结果;再其次,基于类别主题词的加权相似度计算,确定潜在新兴关键技术;最后,以人工智能领域为例进行实证研究。采用本文模型共得到24项潜在新兴技术,主要分布在特种机器人技术、监测预警技术、视频图像处理技术、语音识别技术、自动规划和决策技术以及自然语言处理技术6个大类方向。
2024 Vol. 43 (5): 563-574 [摘要] ( 64 ) HTML (131 KB)  PDF (2511 KB)  ( 130 )
575 综合属性指标和引用关系的核心专利识别方法研究 Hot!
郭剑明, 王婧怡, 袁润
DOI: 10.3772/j.issn.1000-0135.2024.05.007
以信息论为理论基础,提出综合属性指标和引用关系的核心专利识别方法,旨在平衡专利的个体特质性和网络整体性。首先,从信息论和复杂网络角度,分析综合属性指标和引用关系开展专利信息分析的必要性和可行性,并分别构建综合属性指标和三种引用关系的核心专利识别模型;其次,构建专利指标体系、计算专利属性价值,并以PageRank和HITs(hyperlink-induced topic search)算法分别测度综合属性价值与直接引证关系、共引关系和耦合关系前后专利的重要性、权威性与枢纽性,识别核心专利;最后,尝试利用基于复杂网络鲁棒性和脆弱性的方法比较综合前后方法的识别效果。实证结果表明,①综合两类方法的识别模型增加了专利信息分析的信息量,兼顾了专利指标分析和专利网络分析方法的优点,实现了识别方法上的优势互补;②不同引用关系反映了专利价值的差异性,三种关系的识别结果均存在集中与离散的特点,少数核心专利同时具备高重要性、高权威性和高枢纽性的特点;③基于复杂网络鲁棒性和脆弱性的评价方法,是对解决专利信息分析中识别结果评价难题的有益探索。
2024 Vol. 43 (5): 575-587 [摘要] ( 45 ) HTML (137 KB)  PDF (2804 KB)  ( 78 )
588 生成式情报学术语自动抽取与多维关联知识挖掘研究 Hot!
胡昊天, 邓三鸿, 孔玲, 闫晓慧, 杨文霞, 王东波, 沈思
DOI: 10.3772/j.issn.1000-0135.2024.05.008
情报学术语承载了情报学科基础知识与核心概念。从概念维度梳理与分析情报学术语对推动学科发展、助力下游知识挖掘任务具有重要意义。面对数量快速增长的科技文献,自动术语抽取替代了人工筛选,但现有方法严重依赖大规模标注数据集,难以迁移至低资源场景。本文设计了一种生成式情报学术语抽取方法(generative term extraction for information science,GTX-IS),将传统基于序列标注的抽取式任务转化为序列到序列的生成式任务。结合小样本学习策略与有监督微调,提升面向特定任务的文本生成能力,能够在低资源有标签数据集场景下较为精准地抽取情报学术语。对于抽取结果,本文进一步开展了情报学领域术语发现及多维知识挖掘。综合运用全文科学计量与信息计量方法,从术语自身、术语间关联、时间信息等维度,对术语的出现频次、生命周期、共现信息等进行统计分析与知识挖掘。采用社会网络分析方法,结合时间维度特征,从术语角度出发,完善期刊的动态简介,探究情报学研究热点、演变历程和未来发展趋势。本文方法在术语抽取实验中的表现超越了全部13种主流生成式和抽取式模型,展现出较强的小样本学习能力,为领域信息抽取提供了新的思路。
2024 Vol. 43 (5): 588-600 [摘要] ( 66 ) HTML (152 KB)  PDF (5124 KB)  ( 110 )
601 基于SWPF2vecDJ-TextRCNN的古籍文本主题分类研究 Hot!
武帅, 杨秀璋, 何琳, 公佐权
DOI: 10.3772/j.issn.1000-0135.2024.05.009
以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人文研究范式的转型。首先,参照东汉古籍《说文解字》对文字的分析方式,以前期标注的古籍语料数据集为基础,构建全新的“字音(说)-原文(文)-结构(解)-字形(字)”四维特征数据集。其次,设计四维特征向量提取模型(speaking, word, pattern, and font to vector,SWPF2vec),并结合预训练模型实现对古籍文本细粒度的特征表示。再其次,构建融合卷积神经网络、循环神经网络和多头注意力机制的古籍文本主题分类模型(dianji - recurrent convolutional neural networks for text classification,DJ-TextRCNN)。最后,融入四维语义特征,实现对古籍文本多维度、深层次、细粒度的语义挖掘。在古籍文本主题分类任务上,DJ-TextRCNN模型在不同维度特征下的主题分类准确率均为最优,在“说文解字”四维特征下达到76.23%的准确率,初步实现了对古籍文本的精准主题分类。
2024 Vol. 43 (5): 601-615 [摘要] ( 43 ) HTML (203 KB)  PDF (2050 KB)  ( 64 )
616 二十一世纪以来美国科技政策主题分析及发展态势研判 Hot!
曹玲静, 张志强
DOI: 10.3772/j.issn.1000-0135.2024.05.010
21世纪以来,新一轮科技革命和产业变革加速演进,国际科技竞争尤其是科技强国大国间的科技竞争日益加剧。美国是国际科技竞争的主要推手,分析21世纪以来美国科技政策主题演变特点,有助于观察美国科技政策发展规律和战略重点。本研究以美国21世纪以来宏观科技政策作为研究对象,按照总统任期划分时间阶段,采用嵌入式主题模型(embedded topic model,ETM)对科技政策文本进行主题发现和分析,结合主题相似度,以可视化方式展现美国科技政策的主题演变过程,观察和分析美国科技政策演变特点及其聚焦的科技战略重点及其启示,以前瞻其未来科技发展趋向。分析结果表明,美国长期重视STEM(science, technology, engineering, mathematics)科技人才教育培养,稳定支持医疗卫生和生物科技领域,聚焦发展信息科技等关键前沿领域,注重能源和生态环境科技领域创新,前瞻布局国家战略性科技产业领域。
2024 Vol. 43 (5): 616-632 [摘要] ( 61 ) HTML (184 KB)  PDF (2905 KB)  ( 82 )