6月19日下午,加拿大多伦多大学亚述学博士、国际楔形文字数字图书馆(CDLI)合作负责人Émilie Pagé-Perron研究员应浙江师范大学人文学院的邀请,通过腾讯会议为师生们带来了一场题为“数字亚述学:从数字化到人工智能辅助处理与分析”的讲座。本场讲座由刘昌玉教授主持,相关专业教师及同学在线聆听。

讲座伊始,Émilie Pagé-Perron研究员系统介绍了亚述学的基本内涵。她指出,亚述学以研究两河流域的楔形文字文化为核心。楔形文字诞生于公元前3200年左右的两河流域(今伊拉克及周边地区),延续至公元前后,跨越三千多年,被用来记录十余种语言。这些文字刻写在泥板、砖块、纪念碑和滚筒印章上,内容涵盖文学、行政、数学、王室铭文等多种类型。此外,她重点介绍了国际楔形文字数字图书馆(CDLI)项目。该项目拥有二十多年历史,致力于楔形文字文物的数字化、整理、保存和分析,收集的数据包括元数据、图像、文本及注释。目前全球约有50万件楔形文字文物,CDLI已数字化超过43万件,并收集约265万行转写,是全球规模最大的楔形文字数字数据库。Pagé-Perron研究员特别强调,CDLI坚持开放获取,所有数据均可免费访问,界面已实现阿拉伯语本地化,并计划增加中文内容。

随后,Pagé-Perron研究员详细阐述了CDLI的数字化实践。CDLI管理元数据、文本和图像三类核心数据。在图像采集方面,CDLI开发了高效低成本的平板扫描法,可快速完成大批量泥板的数字成像,极大提高了文物覆盖率。针对滚筒印章等精细文物,则采用高动态范围摄影和反射变换成像(RTI)技术。后者通过穹顶内LED灯从不同角度打光,生成可在软件中自由调整光源方向的图像,从而清晰观察印章纹饰和刻痕。在文本数据方面,CDLI收集楔形文字的转写、音译、部分翻译以及语言学注释。她强调,语言学注释对计算分析至关重要,有了词性和句法标注,研究者可以进行更复杂的量化检索和文本分析。
在人工智能部分,Pagé-Perron研究员分享了由她主导的“楔形文字语言机器翻译与自动分析(MTAC)”项目。该项目以苏美尔语书写的乌尔第三王朝行政文书为研究对象,这类文书约10万篇,格式高度标准化,是测试自动化方法的理想语料。面对古代语言训练数据稀缺导致的数据稀疏难题,团队综合运用合成数据生成、传统规则系统与机器学习多种策略,最终构建出准确率约83%的翻译系统,并通过引入命名实体识别技术进一步提升了翻译精度。在图像识别方面,她指出从泥板照片中自动识别楔形文字符号是当前研究热点,三维压痕虽带来巨大挑战,但合成数据训练和计算机视觉技术的进步正推动该领域不断取得突破。她强调,数字技术和人工智能始终是学者的辅助工具,无法取代亚述学家深厚的语言功底与历史洞察力。未来的亚述学研究不是传统与数字的二选一,而是要通过完善基础设施、构建高质量数据集和推动跨学科合作,实现二者的深度融合。
在互动交流环节,师生踊跃提问,围绕“在亚述学研究中,数字化技术与人工智能的应用范畴”“中国学者在亚述学和古代文明研究领域所做出的贡献”“亚述社会网络分析的研究方法与前沿”等问题深入探讨。Pagé-Perron研究员结合自身丰富的实践经验逐一答疑解惑。本次讲座立足数字人文与人工智能的国际学术前沿,既展现了数字技术为楔形文字研究带来的全新变革,更深刻阐释了传统学术功底在亚述学等人文学科研究中不可替代的核心价值,极大拓宽了在场师生的国际视野。至此,本次讲座在热烈的学术交流氛围中圆满落幕。
(文:史莹莹 / 图:潘安吉)