当前位置:首页 > 科技资讯 > 正文

Aeneas:AI助力历史学家解读古代铭文

爱在西元前的歌词中吟唱:「当古文明只剩下难解的语言,传说就成了永垂不朽的诗篇。」如今,DeepMind推出的生成式AI工具Aeneas,为考古学家解读古代碑文带来了新曙光。

Aeneas在古希腊神话中是位流浪英雄。

而在7月24日Nature主刊中亮相的Aeneas,则是一个多模态生成式神经网络,它助力历史学家更好地解读、归属和修复残缺文本。

Aeneas:AI助力历史学家解读古代铭文 Aeneas 生成式AI 考古学家 古代铭文 第1张

试想,考古学家在欧洲发现了一块刻有古代文字的铭文,文本残缺不全、部分文字被风化或被故意破坏。

没有语境信息,恢复、确定年代和定位这块铭文的出处变得几乎不可能,尤其是在比较相似的铭文时。

考虑到在罗马世界,文字无处不在——从帝国纪念碑到日常用品,无不刻有文字。从政治涂鸦、爱情诗篇和墓志铭,到商业交易、生日邀请和魔法咒语。

Aeneas:AI助力历史学家解读古代铭文 Aeneas 生成式AI 考古学家 古代铭文 第2张

图1展示了由Aeneas修复的公元113/14年来自萨丁岛的青铜军事命令,这是皇帝Trajan授予一艘战船上的水手。

这些铭文为现代历史学家提供了丰富的见解,揭示了罗马世界日常生活的多样性。

但也增加了考古工作的难度,考古学家需要依赖其专业知识检索自身积累的数据库,方可识别相似文本——这些文本在措辞、句法、标准化公式或来源方面具有相似性。

然而检索相似的信息,为文章确定上下文,正是生成模型擅长的任务。

于是Aeneas应运而生,它能够跨越数千份拉丁铭文进行推理,在几秒钟内检索出文本和语境相似文本,这样的加速度,让考古学家从检索文本这项复杂且耗时的工作中解脱出来。

如今他们能快速地拿到对古代铭文的解释,并基于模型的发现进行进一步研究。

Aeneas:AI助力历史学家解读古代铭文 Aeneas 生成式AI 考古学家 古代铭文 第3张

Aeneas的丰富功能

在Aeneas出现之前,2022年Deepmind推出了Ithaca,这是一个基于深度神经网络预测古希腊铭文年代,并补全缺失文本的工具。

Aeneas:AI助力历史学家解读古代铭文 Aeneas 生成式AI 考古学家 古代铭文 第4张

Aeneas则更进一步,它能帮助历史学家解读文本,通过提供上下文,赋予孤立片段意义,从而得出更丰富的结论,并整合对古代历史的更好理解。

具体来看,它在庞大的拉丁铭文集合中搜索平行文本。通过将每个文本转化为一种历史指纹,Aeneas可识别出文本间的深层联系。

在年代和出处预测方面,Aeneas能够将文本置于历史学家提供的日期范围内13年内,以72%的准确率将铭文归入62个古代罗马行省之一。

作为首个利用多模态输入确定文本地理来源的模型。它可同时分析文本和视觉信息,例如铭文图像。

不同于只能预测单个词的Ithaca,Aeneas能够修复文本中缺失长度未知的段落。

Aeneas能以73%的准确率修复最多十个字符缺失的损坏铭文。当修复长度未知时,准确率也会有58%。

这使得它成为处理严重损坏材料的史学家的更通用的工具。

工作原理和典型案例

为了训练Aeneas,Deepmind的研究者精心策划了一个庞大且可靠的数据集,借鉴了数十年来历史学家的工作成果来创建数据集,其中包括了古希腊和罗马时代铭文的文本和图像。

Aeneas使用了NLP领域的大杀器transformer来处理碑文文本输入,并通过解码器检索相似的碑文,并按相关性排序。

Aeneas:AI助力历史学家解读古代铭文 Aeneas 生成式AI 考古学家 古代铭文 第5张

接下来看Aeneas解析古代文本的一个典型例子。

古罗马皇帝奥古斯都以第一人称成就记述《功业记》,这是古罗马历史中一块著名的石碑。这份铭文由奥古斯都亲自撰写、是其自我夸耀的终身成就的总结。

Aeneas:AI助力历史学家解读古代铭文 Aeneas 生成式AI 考古学家 古代铭文 第6张

参考资料

"