情报学报  2022, Vol. 41 Issue (10): 1003-1014    DOI: 10.3772/j.issn.1000-0135.2022.10.001
  情报理论与方法 本期目录 | 过刊浏览 | 高级检索 |
基于语义关联与模糊聚类的共词分析方法
陆泉1,2, 曹越1, 陈静3
1.武汉大学信息资源研究中心,武汉 430072
2.武汉大学大数据研究院,武汉 430072
3.华中师范大学信息管理学院,武汉 430079
A Co-word Analysis Method Based on Semantic Relevance and Fuzzy Clustering
Lu Quan1,2, Cao Yue1, Chen Jing3
1.Center for Studies of Information Resources, Wuhan University, Wuhan 430072
2.Big Data Institute, Wuhan University, Wuhan 430072
3.School of Information Management, Central China Normal University, Wuhan 430079
全文: PDF (3187 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 共词分析是文本内容分析的重要基础方法,但已有共词分析方法存在两方面不足,一是在关键词共词矩阵构建中未考虑词对的语义关联,二是在共词矩阵聚类分析中不支持词汇主题归属的多元性。本文提出基于语义关联与模糊聚类的共词分析方法,结合高频低频词界分公式和词频g指数抽取领域关键词,利用词嵌入模型学习关键词的语义向量表示,进而构建语义加权共词矩阵,以综合共现特征与语义关联来度量词对间相关性;结合模糊C均值聚类算法与因子降维对语义加权共词矩阵进行关键词模糊聚类,以弥补硬聚类中词汇主题归属单一化的不足,提高类团的信息质量并揭示类团之间的联系。选择“感染性疾病学和传染病学类”期刊文献开展实验,结果验证了本文方法的有效性和优越性。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
陆泉
曹越
陈静
关键词 共词分析语义关联词嵌入模型模糊C均值聚类    
收稿日期: 2021-07-20     
基金资助:国家社会科学基金重点项目“心理账户理论视角下在线健康社区精准信息服务研究”(20ATQ008)。
作者简介: 陆泉,男,1975年生,博士,教授,博士生导师,主要研究领域为数据挖掘、知识组织与知识服务研究;曹越,男,1999年生,硕士,主要研究领域为数据分析与数据挖掘研究;陈静,女,1977年生,博士,教授,博士生导师,主要研究领域为信息组织与信息检索研究,E-mail:dancinglulu@sina.com;
引用本文:   
陆泉, 曹越, 陈静. 基于语义关联与模糊聚类的共词分析方法[J]. 情报学报, 2022, 41(10): 1003-1014.
Lu Quan, Cao Yue, Chen Jing. A Co-word Analysis Method Based on Semantic Relevance and Fuzzy Clustering. 情报学报, 2022, 41(10): 1003-1014.
链接本文:  
https://qbxb.istic.ac.cn/CN/10.3772/j.issn.1000-0135.2022.10.001     或     https://qbxb.istic.ac.cn/CN/Y2022/V41/I10/1003