面向用户生成内容的多粒度知识组织研究
王忠义, 郑鑫, 王珂莹
华中师范大学信息管理学院,武汉 430079
Multi Granularity Knowledge Organization Model for User Generated Content
Wang Zhongyi, Zheng Xin, Wang Keying
School of Information Management, Central China Normal University, Wuhan 430079
摘要 作为大数据时代网络信息资源中的重要资源,用户生成内容(user generated content,UGC)日益受到各领域学者的广泛关注。与传统信息资源不同,UGC的海量碎片化特征导致对其进行知识组织更为困难。为解决这一问题,本文以知识元为单位,提出了一种面向UGC的多粒度知识组织模型,通过对碎片化UGC知识元进行抽取、多粒度关联以及多粒度索引的建立,对碎片化的UGC进行从点到面、从局部到整体的多粒度组织。一方面,以与“检索”相关的碎片化UGC为实验对象,开发了一个多粒度知识组织原型系统,并提供用户接口完成相关的知识检索服务;另一方面,通过实验证明了本文所提出的多粒度知识组织模型的有效性和科学性。
关键词 :
UGC ,
知识元 ,
多粒度 ,
知识组织 ,
碎片化
收稿日期: 2021-04-01
基金资助: 教育部人文社会科学研究青年基金项目“大数据环境下碎片化用户生成内容的多粒度知识组织研究”(19YJC870025);教育部人文社会科学研究规划基金项目“跨学科知识组织中学科概念跨学科关联研究”(21YJA870003)。
作者简介 : 王忠义,男,1982年生,博士,副教授,主要研究方向为知识组织与服务,E-mail:wzywzy13579@163.com;郑鑫,女,1996年生,硕士,主要研究方向为信息检索;王珂莹,女,1997年生,硕士,主要研究方向为信息组织;
1 O'Reilly T. What is Web 2.0: design patterns and business models for the next generation of software[EB/OL]. (2005-09-30) [2021-01-23]. http://oreilly.com/web2/archive/what-is-web-20.html. 2 彭兰. 碎片化社会背景下的碎片化传播及其价值实现[J]. 今传媒, 2011, 19(10): 9-11. 3 汪建基, 马永强, 陈仕涛, 等. 碎片化知识处理与网络化人工智能[J]. 中国科学: 信息科学, 2017, 47(2): 171-192. 4 张喜征, 罗文, 蔡月月. 基于知识图谱的用户生成内容平台中碎片化知识整合研究[J]. 科技管理研究, 2019, 39(5): 159-165. 5 姜宛彤, 王翠萍, 唐烨伟, 等. 构建基于知识地图的微课程研究[J]. 电化教育研究, 2016, 37(12): 93-98, 105. 6 Bliss H E. The organization of knowledge and the system of the sciences[M]. New York: Henry Holt and Company, 1929: 356-357. 7 温有奎. 基于“知识元”的知识组织与检索[J]. 计算机工程与应用, 2005, 41(1): 55-57, 91. 8 姜永常, 杨宏岩, 张丽波. 基于知识元的知识组织及其系统服务功能研究[J]. 情报理论与实践, 2007, 30(1): 37-40. 9 陈果. 基于领域概念关联的网络社区知识聚合研究[D]. 武汉: 武汉大学, 2015. 10 陈果, 肖璐. 网络社区中的知识元链接体系构建研究[J]. 数据分析与知识发现, 2017, 1(11): 75-83. 11 李锐, 王泰森. 基于知识元的知识组织与知识服务[J]. 图书馆学研究, 2008(8): 84-86, 23. 12 徐绪堪, 郑昌兴, 蒋勋. 基于粒度原理的知识组织模型构建[J]. 图书与情报, 2013(6): 8-12, 56. 13 冯儒佳, 王忠义, 王艳凤, 等. 科技论文的多粒度知识组织框架研究[J]. 情报科学, 2016, 34(12): 46-50, 54. 14 丁文姚, 韩毅. 基于FOAF的UGC用户信息组织研究[J]. 情报理论与实践, 2019, 42(8): 124-130. 15 么媛媛, 郑建程. 用户生成内容(UGC)的元数据研究[J]. 图书馆学研究, 2014(9): 68-73. 16 胡华. 基于中文UGC信息源的半自动应用本体构建研究[D]. 武汉: 武汉大学, 2014. 17 唐晓波, 胡华. 中文UGC信息源的本体概念抽取研究[J]. 现代图书情报技术, 2014(5): 41-49. 18 郑姝雅, 黄奇, 张戈, 等. 面向用户生成内容的本体构建方法[J]. 情报科学, 2019, 37(11): 43-47. 19 赵华. 在线社交网络中基于用户的知识组织模式研究[D]. 南京: 南京理工大学, 2017. 20 金碧漪. 基于多源UGC数据的健康领域知识图谱构建[D]. 上海: 华东师范大学, 2016. 21 陈晓威. 基于文本主题的社会化问答平台知识网络研究[D]. 南京: 南京大学, 2019. 22 郑鑫. 碎片化UGC的多粒度知识组织研究[D]. 武汉: 华中师范大学, 2021. 23 王忠义, 郑鑫. 基于碎片化UGC的知识元抽取研究[J]. 情报理论与实践, 2021, 44(1): 188-194. 24 Yan X H, Guo J F, Lan Y Y, et al. A biterm topic model for short texts[C]// Proceedings of the 22nd International Conference on World Wide Web. New York: ACM Press, 2013: 1445-1456. 25 Pennington J, Socher R, Manning C. GloVe: global vectors for word representation[C]// Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing. Stroudsburg: Association for Computational Linguistics, 2014: 1532-1543. 26 Brando C, Bucher B. Quality in user generated spatial content: a matter of specifications[C]// Proceedings of the 13th International Conference on Geographic Information Science. Guimar?es: AGILE, 2010: 1-8.
[1]
苏新宁. 面向知识服务的领域知识组织纵论 [J]. 情报学报, 2022, 41(9): 889-899.
[2]
边文越, 李国鹏, 周秋菊, 冷伏海. 关于ESI 研究前沿的思考和使用方法研究 [J]. 情报学报, 2022, 41(3): 254-262.
[3]
张琪, 王东波, 黄水清, 邓三鸿. 史书多维知识重组与可视化研究 [J]. 情报学报, 2022, 41(2): 130-141.
[4]
马海云, 薛翔. 面向知识服务的领域知识结构研究 [J]. 情报学报, 2022, 41(1): 73-82.
[5]
郭骅, 蒋勋, 许瑞, 侯柏屹, 张健东. 协同视角下的跨域突发事件应急情报组织模式 [J]. 情报学报, 2021, 40(7): 697-713.
[6]
孙震, 冷伏海. 一种基于知识元迁移的ESI 研究前沿知识演进分析方法 [J]. 情报学报, 2021, 40(10): 1027-1042.
[7]
王忠义, 黄容, 郑鑫, 黄京. 数字图书馆多粒度集成知识服务研究 [J]. 情报学报, 2019, 38(2): 143-158.
[8]
宋英华, 刘含笑, 蒋新宇, 杨丽娇. 基于知识元与贝叶斯网络的食品安全事故情景推演研究 [J]. 情报学报, 2018, 37(7): 712-720.
[9]
孙震, 冷伏海. 一种基于知识元共现的ESI研究前沿知识演进分析方法 [J]. 情报学报, 2018, 37(11): 1095-1113.