|
|
学术文摘创新点挖掘的认知分析方法 |
温浩, 何茜茹 |
西安建筑科技大学信息与控制工程学院,西安 710055 |
|
Cognitive Analysis Method for Mining Innovation Points in Academic Abstracts |
Wen Hao, He Qianru |
School of Information and Control Engineering, Xi'an University of Architecture Technology, Xi'an 710055 |
|
摘要 为了克服学术文摘表达创新点的多样性和丰富性带给知识挖掘算法的困难,本文提出了学术文摘创新点挖掘的认知分析方法。该方法包括:学术文摘创新点报道认知分析、词汇语义分布一致性认知分析、谓语动词语义理解认知分析、语用功能分类认知分析和句法隐含认知分析。研究结果表明,这五种认知分析可形成文摘挖掘的五个层次:信息检索层次、本体构建层次、语义挖掘层次、语用分类层次和对象隐含层次。本文的研究方法为利用机器学习算法处理自然语言表达模式提供了认知分析方法,提高了文摘创新点分类算法的准确率和覆盖率,提高了文摘“问题、方法、结果”三元组挖掘的效率,为建立基于三元组知识库的智能问答系统提供了理论和方法的指导作用。
|
|
关键词 :
创新点挖掘,
认知分析,
自然语言处理
|
收稿日期: 2020-03-13
|
基金资助:国家自然科学基金面上项目“文摘创新点挖掘的语义识别与关联发现方法研究”(71673213)。 |
作者简介: 温浩,男,1979年生,博士,副教授,主要研究方向为模式识别与智能系统、文本挖掘,E-mail:smczg@126.com;何茜茹,女,1997年生,硕士研究生,主要研究方向为数据挖; |
1 温浩, 乔晓东. 文摘创新点的语义本体模型研究[J]. 情报学报, 2017, 36(9): 964-971. 2 ISO 214-1976(E), Documentation-abstracts for publications and documentation[S]. International Organization for Standardization, 1976. 3 全国文献工作标准化技术委员会第六分委员会. GB 6447-86文摘编写规则[S]. 北京: 中国标准出版社, 1986. 4 全国文献标技会第七分会. GB 7713-87科学技术报告、学位论文和学术论文的编写格式[S]. 北京: 中国标准出版社, 1988. 5 扈畅. 科技英语文摘的文体与表达[J]. 环境科学与技术, 2007, 30(10): 112-114, 121. 6 丁金国. 语义分析[J]. 河北大学学报(哲学社会科学版), 1985, 10(4): 26-36. 7 刘继斌, 范春煜. 语义结构视域下句子形式与意义的关系[J]. 哈尔滨学院学报, 2018, 39(6): 102-105. 8 吕叔湘. 句型和动词[M]. 北京: 语文出版社, 1987. 9 袁本良. 从“N状·V·之”看古汉语语义结构分析问题[J]. 语言科学, 2004, 3(5): 70-77. 10 陈昌来. 论现代汉语句子的语义结构[J]. 烟台师范学院学报(哲学社会科学版), 2000, 17(1): 67-72, 77. 11 连淑能. 汉英句子的基本结构[J]. 厦门大学学报(哲学社会科学版), 1985(1): 155-176. 12 吴云芳, 徐艺峰, 王恺然. 汉语篇章级小句关系的标注体系[J]. 中文信息学报, 2015, 29(3): 71-81. 13 周生, 胡晓峰, 罗批, 等. 战略决策文本的语义分析研究[J]. 计算机科学, 2011, 38(2): 229-233. |
[1] |
林泽斐, 欧石燕. 多特征融合的中文命名实体链接方法研究[J]. 情报学报, 2019, 38(1): 68-78. |
[2] |
刘如, 张惠娜, 杜丽萍, 李梦辉, 吴晨生. 基于情报3.0工作思路的自动简报系统设计与实现[J]. 情报学报, 2018, 37(2): 172-182. |
[3] |
孙震, 冷伏海. 一种基于知识元共现的ESI研究前沿知识演进分析方法[J]. 情报学报, 2018, 37(11): 1095-1113. |
|
|
|
|