5月10日晚,首都师范大学甲骨文研究中心莫伯峰教授应邀于人文学院四楼会议室为师生们带来一场题为“计算甲骨学的新发展”的讲座。本次讲座由陈年福教授主持,相关专业老师和同学到场聆听。
讲座伊始,莫伯峰教授以“从上路到出发”的引言介绍了纪念中国古文字研究会成立四十周年国际学术研讨会,提到了利用深度神经网络进行甲骨文单字识别和检测的初步测试,以及经国家批准成功立项“利用神经网络进行甲骨卜辞字体分类的初步研究”,还分享了面向大众的字形辨别“古金识辨”“字鉴”等应用,他相信未来的古文字研究可以与人工智能相结合,并取得长足进步发展。莫教授从“甲骨文特殊构形辨析:甲骨文数据库建设”的研究论题入手,论述了古文字研究与计算机技术结合的机遇与挑战,认为在数字时代的“计算古文字学正在路上”。莫教授指出,大型语言模型可运用于古文字研究中的智能功能:第一类是甲骨文字识别,输入大量文字资料,对人工智能进行特征识别的训练和测试,利用计算机技术实现古文字识别的目标;第二类是甲骨拼合,面对一些甲骨因边缘并不完全相同而不能完美缀合的问题,莫教授讲解了最优的办法即观察甲骨的曲折和波折程度,寻求可缀合的位置,这也反映了计算机与人类记忆甲骨形状和边缘形成相辅相成的互补作用;第三类是甲骨校重,面对原本需要较长时间的去重工作,莫教授阐明了通过对计算机进行自监督学习,加大已知的甲骨局部图像训练来完成难度较大的相同甲骨去重。
紧接着,莫教授论述了古文字研究与人工智能从“耦合”到“结合”的发展过程,首先是“辨字”,突破识别古文字的难题,并在此基础上分组分类,建立了甲骨文摹本字体分类演变系统,进而达到认识字体和刻写者的要求。其次是“去噪”,莫教授指出要去除干扰性因素,加强模型对单色字体的识别,使模型框架将注意力转移到字形,便于计算机识别甲骨字形字体和笔画,从文字检测走向文字提取,实现甲骨与人工智能的密切结合。再次是“补合”,将各有优长的两个甲骨文拓本通过补合手段进行贴合,因而也增加了很多新材料。同时,莫教授还说明了利用扩散模型来解密甲骨文语言的方法。
随后,莫教授指出,未来的计算甲骨学要以“多模态大模型”推动中国古文字研究的发展。针对中国古文字的性质,可使用偏旁分析法测试人工智能语料库,针对人工智能存在对甲骨文字重复切分等问题,可以使用字形比较法和辞例归纳法进一步提升人工智能介于视觉模态和语言模态的多模态的识别能力。
讲座尾声,现场师生积极提问,莫伯峰教授就“如何努力推进人工智能与古文字研究的进一步发展”“如何解决研究的合作与交流”“在语言模型中如何结合古文进行句读”等问题进行了解答。至此,本次讲座在热烈的掌声中圆满结束。
(文:赵乐倩/ 图: 鲍知秋)