基于关键词重要性和近邻传播聚类的主题分析研究  
  					  										
						李海林1,2 , 万校基1 , 林春培1  
					 
															
					1. 华侨大学工商管理学院,泉州 362021;   
										
						 
   										
    					Theme Analysis Based on Keyword Importance and Affinity Propagation Clustering  
  					  					  					
						Li Hailin1,2 , Wan Xiaoji1 , Lin Chunpei1  
					 
															
						1. College of Business Administration, Huaqiao University, Quanzhou 362021;     
									
				
				
					
						
							
								
									
										
											
                        					 
												
													
													    
													    	
									 
								 
								
																										
													    
													    		                            						                            																	    摘要  鉴于传统科学计量方法存在共现分析缺少考虑关键词重要性和主题分析手段不能自适应地抽取核心主题等问题,本文提出一种基于关键词重要性和近邻传播聚类的主题分析方法。该方法依据大多数作者的潜在行为会按照与研究内容相关性的强弱顺序提供论文关键词,计算关键词在每个文献中的重要程度,构建主要关键词之间的相似性矩阵,结合能够反馈最优簇成员代表性结果的近邻传播聚类实现核心主题的提取与分析。本研究对图书情报类某刊物2012-2016年期间的文献关键词进行数据挖掘,使用新方法实现了基于重要性度量的主要关键词聚类,分析和研究了主要关键词和核心主题的演化趋势。提出的方法不仅能够考虑关键词重要性和自动识别核心主题,还可以为文献主题分析提供新的数据挖掘方法,也能有效提高期刊和学科等相关领域的主题识别效果。 
																										     
													    
													    	
															 
														 
												  		
															关键词  :
																																																																主题分析 , 
																																																																	重要性 , 
																																																																	近邻传播聚类 , 
																																																																	核心主题  
																																  
															 
																												
														
														
															
															    																	收稿日期:  2017-12-08
															    															        
															    															    															 
														 
														 																												
															基金资助: 国家自然科学基金项目“高维时间序列数据聚类分析及应用研究”(71771094); 福建省社会科学规划项目“基于时间序列数据挖掘的期刊参考文献和引证文献分析研究”(FJ2017B065) 
																											    																												
															作者简介 : 李海林,男,1982年生,博士,副教授,主要研究方向为数据挖掘和文献分析,E-mail: hailin@mail.dlut.edu.cn;万校基,男,1984年生,博士,讲师,主要研究方向为文献分析和网络借贷;林春培,男,1985年生,副教授,主要研究方向为创新管理与情报分析。 
																											
													
												 
												
												
													
																													
																 [1] 郑晓月, 牟冬梅, 琚沅红, 等. 学科知识结构主题演化模式研究——以图书情报学领域“计量学”主题为例[J]. 图书情报工作, 2017, 61(12): 32-41.