公元79年10月24日,意大利的维苏威火山爆发,一天之内就毁灭了两万多人的庞贝古城。
火山灰掩盖了整座城市,其中有一栋房子存放了各种书籍。直到18世纪,这栋房子才重新被发现,下面是考古学家的建筑复原图。
房子里面的1800多卷纸莎草古书,都已经完全碳化。
考古学家试图展开这些烧焦的古书,但是纸张一碰就碎。
每一页的碎片就像下面这样。
没有人能从这些烧焦的古书上,读出一个字。
2019年,一位美国科学家提出了一种新方法,使用短红外高光谱成像技术,对这些古卷进行 3D 扫描,然后虚拟建模,在不接触古卷的情况下,就可以展开或压平每一页,从而复现上面的笔迹。
下面是扫描后的页面结果。
问题是上面的笔迹还是很模糊,无法确定是哪一个字母,更不要说读出句子了。
2023年3月,在一些风险投资者的资助下,古卷保管单位举办了一次比赛,邀请全世界的程序员参加,要求使用机器学习,认出上面是什么字母,破解古卷的内容,奖金总额高达100万美元。
主办单位原以为,一年之内成功的可能性不到30%。但是,2023年10月,21岁的内布拉斯加大学的学生卢克·法里托(Luke Farritor)就读出了第一个单词 ΠΟΡΦΥΡΑϹ(紫色)。
后来,他与正在柏林读博士的纳德(Youssef Nader)、瑞士苏黎世理工学院的机器人专业的学生席里格(Julian Schilliger),组成了一个团队,致力于建立一个完整的 AI 模型识别这些古书。
他们最终在比赛的截止日期前(2024年1月1日)识别出了2000个字符。
下面就是采用他们的模型,识别出来的碎片,内容已经清晰还原出来了。
2月5日,主办单位宣布,他们获得了本次比赛的第一名。
由于比赛结果令人鼓舞,主办单位扩展了自己的目标,接下来将对90%的维苏威古卷,进行扫描和识别,彻底破解两千年前的罗马人在书里写了什么。
他们所用的模型,已经全部开源,就放在 GitHub。任何人都可以安装和运行,尝试改进他们的模型,获得更好的结果。
// GitHub 识别维苏威古卷源码
https://github.com/younader/Vesuvius-Grandprize-Winner
// 备用地址直链下载
https://chenqiwei.lanzn.com/iP6Y41rjdhyh
密码:yyds
现代科技的发展,真像神话一样,烧成灰的纸都能辨认出文字。