公元79年10月24日,意大利的维苏威火山爆发,一天之内就毁灭了两万多人的庞贝古城。

火山灰掩盖了整座城市,其中有一栋房子存放了各种书籍。直到18世纪,这栋房子才重新被发现,下面是考古学家的建筑复原图。

房子里面的1800多卷纸莎草古书,都已经完全碳化。

考古学家试图展开这些烧焦的古书,但是纸张一碰就碎。

每一页的碎片就像下面这样。

没有人能从这些烧焦的古书上,读出一个字。

2019年,一位美国科学家提出了一种新方法,使用短红外高光谱成像技术,对这些古卷进行 3D 扫描,然后虚拟建模,在不接触古卷的情况下,就可以展开或压平每一页,从而复现上面的笔迹。

下面是扫描后的页面结果。

问题是上面的笔迹还是很模糊,无法确定是哪一个字母,更不要说读出句子了。

2023年3月,在一些风险投资者的资助下,古卷保管单位举办了一次比赛,邀请全世界的程序员参加,要求使用机器学习,认出上面是什么字母,破解古卷的内容,奖金总额高达100万美元。

主办单位原以为,一年之内成功的可能性不到30%。但是,2023年10月,21岁的内布拉斯加大学的学生卢克·法里托(Luke Farritor)就读出了第一个单词 ΠΟΡΦΥΡΑϹ(紫色)。

后来,他与正在柏林读博士的纳德(Youssef Nader)、瑞士苏黎世理工学院的机器人专业的学生席里格(Julian Schilliger),组成了一个团队,致力于建立一个完整的 AI 模型识别这些古书。

他们最终在比赛的截止日期前(2024年1月1日)识别出了2000个字符。

下面就是采用他们的模型,识别出来的碎片,内容已经清晰还原出来了。

2月5日,主办单位宣布,他们获得了本次比赛的第一名。

由于比赛结果令人鼓舞,主办单位扩展了自己的目标,接下来将对90%的维苏威古卷,进行扫描和识别,彻底破解两千年前的罗马人在书里写了什么。

他们所用的模型,已经全部开源,就放在 GitHub。任何人都可以安装和运行,尝试改进他们的模型,获得更好的结果。

现代科技的发展,真像神话一样,烧成灰的纸都能辨认出文字。


<
Previous Post
生产力是形容机器,不是形容人
>
Next Post
凯州新城规划展览馆