面向数字人文的出土陶器器形知识匹配方法与应用研究
韩牧哲1,2 , 高劲松2 , 李钰3 , 付家炜2
1.江苏大学科技信息研究所,镇江 212013 2.华中师范大学信息管理学院,武汉 430079 3.四川大学考古文博学院,成都 610225
Knowledge Matching of the Shape of Unearthed Potteries as a Perspective on Digital Humanities
Han Muzhe1,2 , Gao Jinsong2 , Li Yu3 , Fu Jiawei2
1.Institute of Science and Technology Information, Jiangsu University, Zhenjiang 212013 2.School of Information Management, Central China Normal University, Wuhan 430079 3.School of Archaeology and Museology, Sichuan University, Chengdu 610225
摘要 出土陶器作为考古学文化的重要标识物,对其进行知识揭示和有效利用,对于展现中华文明起源和发展脉络、承载社会记忆、构建文化认同具有重要意义。着眼于考古文化研究中的现实问题,本文提出出土陶器器形的知识匹配方法,对促进相关领域知识重用和共享、解决人文学者在研究过程中的信息冗余和知识迷航等问题均有重要作用。首先,本文通过对出土陶器与考古学文化的关联路径的分析,明确了针对出土陶器器形的知识匹配方法在替代传统人文研究中的隐性知识关联环节的可行性和现实意义。其次,通过知识结构解析和知识向量表示,展示了针对出土陶器器形进行知识组织的方式和效果;针对陶器器形,从属种和整部两种维度分别提出不同的相似度计算方法,以及对陶器器形知识匹配程度进行量化评分的具体方法。最后,以从察吾呼遗址、焉不拉克遗址和莫呼查汗遗址中抽选的20座墓葬的出土陶器器形数据为例,验证上述方法在史前文化分期研究问题上的作用。研究结果表明,20个目标墓葬的分期结果与考古学界综合出土陶器类型和墓葬形制得出的矫正分期结果的吻合度达84.21%,这充分证明了本文方法的可行性和有效性。
关键词 :
数字人文 ,
知识匹配 ,
关联路径 ,
出土陶器
收稿日期: 2023-02-20
基金资助: 教育部人文社会科学研究规划基金项目“计算人文视角下文化遗产数字资源多模态知识组织与价值共创研究”(22YJA870008)。
作者简介 : 韩牧哲,男,1990年生,博士,讲师,主要研究方向为数字人文;高劲松,通信作者,女,1966年生,博士,教授,博士生导师,主要研究方向为数字人文、知识管理,E-mail:jsgao@ccnu.edu.cn;李钰,女,1990年生,博士研究生,主要研究方向为考古学;付家炜,男,1994年生,博士研究生,主要研究方向为数字人文;
引用本文:
韩牧哲, 高劲松, 李钰, 付家炜. 面向数字人文的出土陶器器形知识匹配方法与应用研究[J]. 情报学报, 2024, 43(1): 76-94.
Han Muzhe, Gao Jinsong, Li Yu, Fu Jiawei. Knowledge Matching of the Shape of Unearthed Potteries as a Perspective on Digital Humanities. 情报学报, 2024, 43(1): 76-94.
链接本文:
https://qbxb.istic.ac.cn/CN/10.3772/j.issn.1000-0135.2024.01.007 或 https://qbxb.istic.ac.cn/CN/Y2024/V43/I1/76
1 Petrie W M F. Methods & aims in archaeology[M]. New York: Macmillan, 1904: 16. 2 王巍. 中国考古学大辞典[M]. 上海: 上海辞书出版社, 2014: 7. 3 李济. 西阴村史前的遗存[M]. 北京: 清华学校研究院, 1927. 4 梁思永. 山西西阴村史前遗址的新石器时代的陶器[M]// 三晋考古(第二辑). 太原: 山西人民出版社1996: 287-325, 338-341. 5 Categories for the description of works of art[EB/OL]. (2022-01-24) [2022-10-10]. http://www.getty.edu/research/publications/electronic_publications/cdwa/. 6 Library of Congress. VRA core[EB/OL]. [2022-10-10]. http://www.loc.gov/standards/vracore/. 7 文物数字化保护元数据标准规范征求意见稿发布[EB/OL]. (2017-05-11) [2023-08-10]. https://www.lib.pku.edu.cn/portal/cn/news/0000001494. 8 CIDOC CRM[EB/OL]. [2022-10-10]. https://cidoc-crm.org/. 9 Zhang C X, Cao C G, Gu F, et al. Domain-specific formal ontology of archaeology and its application in knowledge acquisition and analysis[J]. Journal of Computer Science and Technology, 2004, 19(3): 290-301. 10 夏翠娟. 面向人文研究的“数据基础设施”建设——试论图书馆学对数字人文的方法论贡献[J]. 中国图书馆学报, 2020, 46(3): 24-37. 11 陈涛, 刘炜, 单蓉蓉, 等. 知识图谱在数字人文中的应用研究[J]. 中国图书馆学报, 2019, 45(6): 34-49. 12 梁艳琪. 基于关联数据的文物数字资源语义融合与服务研究[D]. 武汉: 华中师范大学, 2017. 13 王晓光, 侯西龙, 程航航, 等. 敦煌壁画叙词表构建与关联数据发布[J]. 中国图书馆学报, 2020, 46(4): 69-84. 14 Dutia K, Stack J. Heritage connector: a machine learning framework for building linked open data from museum collections[J]. Applied AI Letters, 2021, 2(2): e23. 15 夏翠娟. 文化记忆资源的知识融通: 从异构资源元数据应用纲要到一体化本体设计[J]. 图书情报知识, 2021(1): 53-65. 16 吕科. 基于物体轮廓的曲线匹配技术研究[D]. 西安: 西北大学, 2003. 17 王梦婷. 基于卷积神经网络的文物识别系统的研究与实现[D]. 北京: 北京邮电大学, 2020. 18 段继霞. 基于边缘检测算法的文物识别研究与应用[D]. 太原: 中北大学, 2020. 19 孙家泽. 群体智能算法及在三维文物虚拟拼接中的应用[D]. 西安: 西北大学, 2015. 20 曲爱妍, 马乐军. 基于多特征融合技术的文物图像识别方法研究[J]. 金陵科技学院学报, 2021, 37(3): 8-12. 21 韩牧哲, 高劲松, 李钰. 面向考古类型学的出土陶器器形的知识表示与语义关联构建[J]. 图书情报工作, 2022, 66(12): 92-107. 22 张发平, 李丽. 基于多维层次情境模型的业务过程知识推送方法研究[J]. 计算机辅助设计与图形学学报, 2017, 29(4): 751-758. 23 Giunchiglia F, Shvaiko P. Semantic matching[J]. Knowledge Engineering Review, 2003, 18(3): 265-280. 24 Giunchiglia F, Shvaiko P, Yatskevich M. Discovering missing background knowledge in ontology matching[C]// Proceedings of the 17th European Conference on Artificial Intelligence. Amsterdam: IOS Press, 2006: 382-386. 25 Euzenat J, Valtchev P. Similarity-based ontology alignment in OWL-lite[C]// Proceedings of the 16th European Conference on Artificial Intelligence. Amsterdam: IOS Press, 2004: 333-337. 26 Doan A, Halevy A Y. Semantic integration research in the database community: a brief survey[J]. AI Magazine, 2005, 26(1): 83-94. 27 韩姣红. 基于本体的甲骨文文献语义检索模型研究[J]. 图书馆学研究, 2013(7): 51-57. 28 高劲松, 付家炜, 李珂. 敦煌壁画叙词表关联数据实体语义相似度计算方法与实验[J]. 图书情报工作, 2021, 65(8): 97-106. 29 李惠, 陈涛, 侯君明, 等. 钩玄提要——古籍目录智能分析工具构建[J]. 中国图书馆学报, 2021, 47(4): 97-112. 30 Assael Y, Sommerschield T, Shillingford B, et al. Restoring and attributing ancient texts using deep neural networks[J]. Nature, 2022, 603(7900): 280-283. 31 Roueché C. AI minds the gap and fills in missing Greek inscriptions[J]. Nature, 2022, 603(7900): 235-236. 32 Chang X, Chao F, Shang C J, et al. Sundial-GAN: a cascade generative adversarial networks framework for deciphering oracle bone inscriptions[C]// Proceedings of the 30th ACM International Conference on Multimedia. New York: ACM Press, 2022: 1195-1203. 33 俞伟超. 考古类型学的理论与实践[M]. 北京: 文物出版社, 1989. 34 秦小丽, 张萌. 陶器研究的理论与方法[M]. 上海: 复旦大学出版社, 2022. 35 新疆文物考古研究所. 新疆察吾呼——大型氏族墓地发掘报告[M]. 北京: 东方出版社, 1999. 36 高劲松, 韩牧哲. 考古发掘资料图数据库的语义关联构建研究[J]. 图书情报工作, 2021, 65(9): 105-116. 37 韩牧哲, 高劲松, 方晓印, 等. 面向叙事的考古发掘登记资料的语义关联模型构建研究[J/OL]. 数据分析与知识发现, (2023-07-20). https://kns.cnki.net/kcms/detail/10.1478.G2.20230720.1026.002.html. 38 Causevic D. Tree kernels: quantifying similarity among tree-structured data[EB/OL]. [2022-03-20]. https://www.kdnuggets.com/2016/02/tree-kernels-quantifying-similarity-tree-structured-data.html. 39 新疆维吾尔自治区文化厅文物处, 新疆大学历史系文博干部专修班. 新疆哈密焉不拉克墓地[J]. 考古学报, 1989(3): 325-362, 395-402. 40 新疆维吾尔自治区文物考古研究所. 新疆莫呼查汗墓地[M]. 北京: 科学出版社, 2016. 41 邵会秋. 新疆史前时期文化格局的演进及其与周邻文化的关系[M]. 北京: 科学出版社, 2018.
[1]
武帅, 杨秀璋, 何琳. 多视图融合DJ-TextRCNN 的古籍文本主题推荐研究 [J]. 情报学报, 2024, 43(1): 61-75.
[2]
张强, 高劲松, 龙家庆, 杨晓燕, 夏红玉, 蒋智慧. 基于知识重构的词人时空情感轨迹可视化研究 [J]. 情报学报, 2023, 42(6): 729-739.
[3]
李佩琪, 王昊, 任秋彤, 范涛. 融合结构特性的语义增强式古籍句读识别方法研究 [J]. 情报学报, 2023, 42(2): 150-163.
[4]
刘浏, 齐月, 刘雏菲, 李文祺, 王东波. 计算人文下的古籍引书研究及全文本知识库的构建 [J]. 情报学报, 2023, 42(12): 1498-1512.
[5]
张琪, 王东波, 黄水清, 邓三鸿. 史书多维知识重组与可视化研究 [J]. 情报学报, 2022, 41(2): 130-141.
[6]
许鑫, 陈路遥, 杨佳颖. 数字人文研究领域的知识网络演化——基于题录信息和引文上下文的关键词共词分析 [J]. 情报学报, 2019, 38(3): 322-334.
[7]
王东波, 高瑞卿, 沈思, 李斌. 基于深度学习的先秦典籍问句自动分类研究 [J]. 情报学报, 2018, 37(11): 1114-1122.