基于文献知识抽取的专题知识库构建研究——以中药活血化瘀专题知识库为例
马雨萌1 , 王昉1 , 黄金霞1 , 姜恩波2 , 张翕宇3
1.中国科学院文献情报中心,北京 100190
2.中国科学院成都文献情报中心,成都 610041
3.成都中医药大学临床医学院,成都 610072
Research on Construction of a Subject Knowledge Base based on Literature Knowledge Extraction: Using the Knowledge Base of Activating Blood Circulation and Removing Stasis as the Object
Ma Yumeng1 , Wang Fang1 , Huang Jinxia1 , Jiang Enbo2 , Zhang Xiyu3
1.National Science Library, Chinese Academy of Sciences, Beijing 100190
2.Chengdu Library and Information Center, Chinese Academy of Sciences, Chengdu 610041
3.Clinical Medical College of Chengdu University of Traditional Chinese Medicine, Chengdu 610072
摘要 大数据时代科研人员对高效获取和利用领域知识提出了更高的要求,文献作为科研人员快速准确地了解本领域研究状况的有效途径,基于文献的知识发掘已成为一种新的科研方式。专题知识库作为组织和管理某一特定领域知识的工具,能够用于挖掘和展现文献背后的知识以满足用户个性化需求。本文提出了面向特定研究问题的专题知识库建设路线,采用基于知识工程的信息抽取方法,通过抽象研究问题要素构建专题知识模型,将其作为信息抽取的知识模式,制定知识模型各节点的知识抽取策略,对文献中实体、关系及属性进行解析、抽取与关联组织,基于这些结构化知识提供知识检索、浏览、问答、可视化关联组织等一系列知识服务。然后以中药活血化瘀领域建设实践为例,详细阐述了基于文献知识抽取构建专题知识库的实施方案。系统功能测试显示,该专题知识库能够实现知识快速查询、知识与文献关联发现、知识结构梳理等预期服务场景。本研究提供了一种构建专题知识库行之有效的技术路线,能够帮助科研用户快速而准确地定位和获取文献中的深层知识,提供了数据密集型科研环境下学科化资源建设与个性化精准服务的转型方式。
关键词 :
专题知识库 ,
活血化瘀 ,
知识模型 ,
文献知识抽取 ,
精准服务
收稿日期: 2018-09-20
基金资助: 中国科学院文献情报中心改革专项“中药小分子数据专题库建设”(G170011001);中国科学院文献情报能力建设专项“开放知识资源中心体系建设(二期)”(院1850)。
作者简介 : 马雨萌,女,1989年生,硕士,馆员,主要研究领域为数据分析与服务,E-mail:mayumeng@mail.las.ac.cn
引用本文:
马雨萌, 王昉, 黄金霞, 姜恩波, 张翕宇. 基于文献知识抽取的专题知识库构建研究——以中药活血化瘀专题知识库为例[J]. 情报学报, 2019, 38(5): 482-491.
Ma Yumeng, Wang Fang, Huang Jinxia, Jiang Enbo, Zhang Xiyu. Research on Construction of a Subject Knowledge Base based on Literature Knowledge Extraction: Using the Knowledge Base of Activating Blood Circulation and Removing Stasis as the Object. 情报学报, 2019, 38(5): 482-491.
链接本文:
https://qbxb.istic.ac.cn/CN/10.3772/j.issn.1000-0135.2019.05.004 或 https://qbxb.istic.ac.cn/CN/Y2019/V38/I5/482
1 SunH. New type of library service items—Research on service based on bibliometrics[C]//Proceedings of the International Conference on Education Technology, Management and Humanities Science. Atlantis Press, 2015: 201-204.
2 黄金霞, 马雨萌. 大数据时代开放信息资源的数据服务能力思考[J]. 数字图书馆论坛, 2016(8): 54-59.
3 YarkoniT, PoldrackR A, NicholsT E, et al. Large-scale automated synthesis of human functional neuroimaging data[J]. Nature Methods, 2011, 8(8): 665-670.
4 TsuruokaY, MiwaM, HamamotoK, et al. Discovering and visualizing indirect associations between biomedical concepts[J]. Bioinformatics, 2011, 27(13): i111-i119.
5 OğuzF, ŞengünA E. Mystery of the unknown: Revisiting tacit knowledge in the organizational literature[J]. Journal of Knowledge Management, 2011, 15(3): 445-461.
6 张鸣. 知识服务方式之一——构建学科专题知识库[J]. 图书馆学刊, 2006, 28(3): 108-110.
7 咸珂. 基于本体的健康知识库自动构建方法[D]. 哈尔滨: 哈尔滨工业大学, 2015: 3-6.
8 RazmeritaL, AngehrnA, MaedcheA. Ontology-based user modeling for knowledge management systems[C]// Proceedings of the 9th International Conference on User Modeling. Heidelberg: Springer, 2003: 213-217.
9 钱智勇. 基于本体的专题域知识库系统设计与实现——以张謇研究专题知识库系统实现为例[J]. 情报理论与实践, 2006, 29(4): 476-479.
10 王昊, 谷俊, 苏新宁. 本体驱动的知识管理系统模型及其应用研究[J]. 中国图书馆学报, 2013, 39(2): 98-110.
11 许鑫, 郭金龙. 基于领域本体的专题库构建——以中华烹饪文化知识库为例[J]. 现代图书情报技术, 2013(12): 2-9.
12 王迎春, 蔡东风, 叶娜. 基于实体—属性框架的领域知识库构建[J]. 沈阳航空航天大学学报, 2011, 28(2): 69-73.
13 谈春梅, 段卫华, 曹松强. 网络专题知识库关键技术的研究与实现[J]. 现代图书情报技术, 2009(4): 70-74.
14 郭金龙, 洪韵佳, 许鑫. 中华烹饪文化领域本体构建及其应用[J]. 现代图书情报技术, 2013(12): 10-18.
15 丁玉飞, 王曰芬, 刘卫江. 面向半结构化文本的知识抽取研究[J]. 情报理论与实践, 2015, 38(3): 101-106.
16 化柏林, 刘一宁, 郑彦宁. 针对学术定义的抽取规则构建方法研究[J]. 情报理论与实践, 2011, 34(12): 5-9.
17 刘峤, 李杨, 段宏, 等. 知识图谱构建技术综述[J]. 计算机研究与发展, 2016, 53(3): 582-600.
18 CowieJ, LehnertW. Information extraction[J]. Communications of the ACM, 1996, 39(1): 80-91.
19 ElloumiS, JaouaA, FerjaniF, et al. General learning approach for event extraction: Case of management change event[J]. Journal of Information Science, 2013, 39(2): 211-224.
20 史载祥, 杜金行. 活血化瘀方药临床使用指南[M]. 北京: 人民卫生出版社, 2014: 126-213.