“AI解读了这些古老的化石卷轴上的文字下面是它的内容”

AI解读古老化石卷轴中的文字,揭秘其内容

根据一个开源AI项目,现在可以解读公元79年维苏威火山爆发时被石化的“赫库兰尼恩纸卷”。计算机科学学生卢克·法利托在今年八月成为“两千年来第一个从未开启的卷轴中看到一个完整单词的人”,根据“维苏威挑战赛”,该赛事为那些能够理解卷轴内容的人提供现金奖励。

赫库兰尼恩纸卷看起来像一个圆柱形的木炭。

除了研究人员之前的发现外,这些里程碑的实现还得益于开源的方式。参赛者使用的机器学习技术并不是特别新颖。但正是通过“开源思维方式进行学术项目”,才使得这些快速进展成为可能,比赛发言人JP Prosma表示:“通过公开数据并设定适当的奖励机制,参赛者能够探索比一小组学术研究人员在同一时间框架内可以做到的更多想法。” Posma继续说道。

AI如何用于解读古代文本?

这场比赛旨在加速肯塔基大学的布伦特·西利斯博士领导的研究小组在2015年使用计算机视觉“打开”这些卷轴之后对其进行研究和发现。火山灰将这些卷轴石化保存了下来,但也使得它们过于脆弱,无法展开。2019年,三维CT扫描能够生成卷轴的完整虚拟图像,随后企业家纳特·弗里德曼和丹尼尔·格罗斯资助了今年的一个竞赛,以开源这项研究。

点击链接了解更多信息:维苏威挑战赛

法利托借鉴了另一个参赛者凯西·汉德默的“墨迹裂纹图案”之前的发现。法利托训练了一个机器学习模型来学习这些图案,并将其变成了改善模型识别能力的数据。最终,法利托的模型找到了一个由字母组成的词“porphyras”,在古代文本中的意思是紫色。

发现第一个单词的法利托获得了4万美元的奖金。另外一位参赛者、生物机器人学学生尤塞夫·纳德使用了一种涉及对数据进行无监督预训练模型,然后对“片段标签”进行数据微调的方法。纳德找到了可能形成“achieving”和“similar”的字母,获得了1万美元的奖金。

卷轴扫描图显示出几个以紫色高亮显示的符号

“这些卷轴的内容可能包含了古代伊壁鸠鲁学派哲学家菲洛德米的文本”,Posma表示。通过使用这项技术,研究人员希望解读位于该遗址的其他石化卷轴,这将使我们拥有的古代文学作品数量翻倍。

现在,谜题的一个重要组成部分已经解开,接下来要竞相破解剩下的部分。维苏威挑战赛将向能够阅读卷轴中的“四段文本”的人授予70万美元的大奖。有兴趣参与的人可以在挑战赛网站和Kaggle上获得更多信息,并在Github上获取代码。关于维苏威挑战赛还有一场热烈的讨论正在Discord上进行。