叙词表集成化体系及应用推进研究
陈瑞1 , 曾建勋2
1.武汉大学信息管理学院,武汉 430072 2.中国科学技术信息研究所,北京 100038
Research on Thesaurus Integration Systems and the Promotion of Their Application
Chen Rui1 , Zeng Jianxun2
1.School of Information Management, Wuhan University, Wuhan 430072 2.Institute of Scientific and Technical Information of China, Beijing 100038
摘要 众多叙词表及术语资源由于资源分散、更新维护慢、不能满足数据大规模应用需要,导致应用情况不理想。叙词表的集成化可对现有信息资源进行充分整合,有助于优化知识组织体系,拓展术语资源的应用范围。本文提出的叙词表集成化体系框架涵盖了标准规范体系、词表集成化支撑体系、词表集成化概念体系、叙词表集成化过程和方法以及系统服务与应用五个方面。集成化过程是在多来源术语集成构建词汇集成库的基础上,进行概念映射、概念融合与关系校验实现概念和概念关系的语义集成,构建一个覆盖多学科领域的、语义关系多样的集成化词表。最后,本文提出了推进集成资源的智能化服务和社会场景应用的具体策略,推动叙词表资源的可持续发展。
关键词 :
叙词表 ,
集成化体系 ,
集成化词表 ,
语义集成 ,
应用模式
收稿日期: 2021-01-11
基金资助: 国家社会科学基金重点项目“基于知识组织的图书馆资源发现服务体系研究”(17ATQ002)。
作者简介 : 陈瑞,女,1993年生,博士研究生,主要研究领域为数字出版、知识组织与知识服务;曾建勋,男,1965年生,博士,研究馆员,博士生导师,主要研究领域为数字图书馆与数字出版、知识组织与知识链接,E-mail:zeng@istic.ac.c;
1 薛春香. 网络环境中知识组织系统构建与应用研究[M]. 南京: 东南大学出版社, 2009. 2 Sintichakis M, Constantopoulos P. A method for monolingual thesauri merging[C]// Proceedings of the 20th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval. New York: ACM Press, 1997: 129-138. 3 赵捷, 司莉, 周李梅, 等. 国外叙词表的应用与发展趋势探讨[J]. 图书馆建设, 2012(3): 58-62. 4 常春. 网络环境下叙词表编制与发展[M]. 北京: 科学技术文献出版社, 2015. 5 吴雯娜. 我国叙词表的编制历史与发展模式[J]. 情报理论与实践, 2018, 41(6): 39-44. 6 司莉. 叙词表在网络信息组织中应用的调查分析及其优化[J]. 图书馆论坛, 2007, 27(6): 183-186, 105. 7 周晓英, 曾建勋. 主题词表的社会应用研究[J]. 数字图书馆论坛, 2014(10): 2-6. 8 曾建勋, 吴雯娜, 常春, 等. 《汉语主题词表》构建研究[M]. 北京: 科学技术文献出版社, 2020. 9 贾君枝. 面向数据网络的信息组织演变发展[J]. 中国图书馆学报, 2019, 45(5): 51-60. 10 Wake S, Nicholson D. HILT - high-level theasaurus project: building consensus for interoperable subject access across communities[J/OL]. D-Lib Magazine, 2001, 7(9). https://doi.org/10.1045/september2001-wake. 11 Mayr P, Petras V. Building a terminology network for search: the KoMoHe project[C]// Proceedings of the 2008 International Conference on Dublin Core and Metadata Applications. Dublin Core Metadata Initiative, 2008: 177-182. 12 Lindberg C. The Unified Medical Language System (UMLS) of the National Library of Medicine[J]. Journal (American Medical Record Association), 1990, 61(5): 40-42. 13 李丹亚, 胡铁军, 李亚子, 等. UMLS多词表整合机制研究[J]. 数字图书馆论坛, 2012(4): 28-36. 14 李亚子, 钱庆, 刘峥, 等. 基于UMLS的疾病知识整合框架研究[J]. 现代图书情报技术, 2011(2): 34-41. 15 李丹亚, 胡铁军, 李军莲, 等. 中文一体化医学语言系统的构建与应用[J]. 情报杂志, 2011, 30(2): 147-151. 16 吴雯娜, 鲍秀林. 国家叙词库的体系结构与数据模型[J]. 中国图书馆学报, 2016, 42(2): 81-96. 17 朱礼军, 赵新力, 乔晓东, 等. 跨领域多来源主题词表集成与服务研究[J]. 现代图书情报技术, 2007(1): 20-24. 18 曾新红. 中文知识组织系统形式化语义描述标准体系研究(一)——扩展SKOS实现传统受控词表全描述[J]. 中国图书馆学报, 2012, 38(3): 57-68. 19 赵捷, 曾建勋, 吴雯娜. 网络环境下叙词表协同编制系统的构建[J]. 图书情报工作, 2011, 55(22): 6-10. 20 孙海霞, 邓盼盼, 李姣, 等. 面向多源词表整合的概念自动更新策略研究[J]. 数据分析与知识发现, 2020, 4(1): 121-130. 21 李凌宇, 常春, 邓盼盼. 叙词表概念间语义关系发展研究[J]. 中华医学图书情报杂志, 2020, 29(1): 28-34. 22 曾建勋, 常春, 吴雯娜, 等. 网络环境下新型《汉语主题词表》的构建[J]. 中国图书馆学报, 2011, 37(4): 43-49. 23 Zeng M L, Chan L M. Trends and issues in establishing interoperability among knowledge organization systems[J]. Journal of the American Society for Information Science and Technology, 2004, 55(5): 377-395. 24 薛春香, 乔晓东, 朱礼军. KOS互操作中的术语映射研究综述[J]. 现代图书情报技术, 2010(2): 31-37. 25 鲍秀林, 吴雯娜. 语义映射质量及影响因素分析——以国家叙词库语义映射为例[J]. 中国图书馆学报, 2016, 42(5): 57-67. 26 吴雯娜, 王星. 叙词表融合方法研究[J]. 中国图书馆学报, 2012, 38(4): 110-118.