|
|
科技文摘创新点语义识别与分类方法研究 |
温浩 |
西安建筑科技大学信息与控制工程学院,西安 710055 |
|
Semantic Recognition and Classification Method of Innovation Points in Scientific and Technological Abstracts |
Wen Hao |
School of Information and Control Engineering, Xi an University of Architecture Technology, Xi an 710055 |
|
摘要 公开出版的科技文摘提供了科学研究活动中的问题、方法、结果的可靠语义事实数据,为创新点的传播与跨学科新知识发现奠定了坚实的基础。如何将其准确地的识别和分离出来将是利用人工智能技术实现创新点事实知识问答系统的关键问题。本文提出了一种创新点语义识别与分类方法。该方法先将科技文摘按照句法和语义功能进行6分类算法处理,然后对6分类算法结果进行了类与句子位置的数量分布统计分析、句子类型和句子语义位置结构特征的深入分析,检验了文摘句的语义语序特征,最后在此基础上进行二次分类和合并,实现了对科技文摘创新点的问题、方法、结果的分类实验,分类的准确率达到99%。人工检验验证了语义识别和分类算法的有效性。实验结果表明,这种方法具有算法简便、分类精度高、普适性好的优点。
|
|
关键词 :
科技文摘,
创新点,
语义识别,
智能分类
|
收稿日期: 2018-08-13
|
基金资助:国家自然科学基金面上项目“文摘创新点挖掘的语义识别与关联发现方法研究”(71673213)。 |
作者简介: 温浩,男,1979 年生,博士,副教授,主要研究方向为模式识别与智能系统、文本挖掘,E-mail:smczg@126.com。 |
1 引文索引[EB/OL]. [2018-6-3]. https://baike.baidu.com/item/%E5%BC%95%E6%96%87%E7%B4%A2%E5%BC%95/8017877?fr=aladdin. 2 ChangS J, RiceR E. Browsing: A multidimensional framework[J]. Annual Review of Information Science and Technology, 1993, 28(4): 231-276. 3 CanoV. Citation behavior: classification, utility, and location[J]. Journal of the American Society for Information Science, 1989, 40(4): 284-290. 4 袁慧, 马建霞, 王文娟. 期刊引用行为与影响因子的关系[J]. 中国科技期刊研究, 2017, 28(11): 1058-1064. 5 陆伟, 孟睿, 刘兴帮. 面向引用关系的引文内容标注框架研究[J]. 中国图书馆学报, 2014, 40(6): 93-104. 6 郭全中. 创新知识服务——推动出版业转型发展[J]. 出版广角, 2018, 3(9): 29-31. 7 江锦年. 出版业知识服务创新的发展策略[J]. 新闻与写作, 2017(10): 101-103. 8 张晓林. 走向知识服务——寻找新世纪图书情报工作的生长点[J]. 中国图书馆学报, 2000, 11(5): 32-37. 9 刘寅斌, 胡亚萍. 从谷歌大脑看人工智能在知识服务上的应用[J]. 图书与情报, 2017, 20(6): 112-116. 10 化柏林. 学术论文中方法知识元的类型与描述规则研究[J]. 中国图书馆学报, 2016, 42(1): 30-40. 11 温浩, 乔晓东. 文摘创新点的语义本体模型研究[J]. 情报学报, 2017, 36(9): 964-971. |
|
|
|