科普信息網(wǎng)

人工智能技術(shù)被用來破譯失傳已久的古文字

發(fā)布時(shí)間:2019-07-11 15:24:45 來源:澎湃新聞 責(zé)任編輯:caobo

澎湃新聞見習(xí)記者 張唯

人工智能技術(shù)正在被用來破譯失傳已久的古文字。

近日,麻省理工學(xué)院和谷歌人工智能實(shí)驗(yàn)室的研究人員提出了一種自動(dòng)破譯失傳文字的神經(jīng)網(wǎng)絡(luò)算法。這一算法首次實(shí)現(xiàn)了古希臘邁錫尼文明時(shí)期“線形文字B”的自動(dòng)翻譯,準(zhǔn)確地把67.3% 的線形文字B同源詞翻譯成了希臘語。下一步,人工智能和機(jī)器學(xué)習(xí)技術(shù)可能會(huì)被用來解密至今仍未被破譯的古文字。

線形文字B大約出現(xiàn)在公元前1400年后,于1953年被語言學(xué)家邁克爾·文特里斯破譯。麻省理工學(xué)院和谷歌人工智能實(shí)驗(yàn)室的實(shí)驗(yàn)是自動(dòng)翻譯線形文字B的首次嘗試。

據(jù)《麻省理工科技評(píng)論》報(bào)道,1886年,英國考古學(xué)家阿瑟·埃文斯(Arthur Evans)偶然發(fā)現(xiàn)了地中海克里特島上的大量刻字石頭和石碑。后續(xù)研究中,他和其他研究者認(rèn)定這些石頭和石碑由兩種不同文字寫就。更古老的那一種后來被稱作“線性文字A”,可追溯到公元前1800年至公元前1400年,另一種被命名為“線形文字B”,大約出現(xiàn)在公元前1400年后。

針對(duì)這兩種文字的早期破譯工作都宣告失敗。直到1953年,一位業(yè)余語言學(xué)家邁克爾·文特里斯(Michael Ventris)成功破譯了線形文字B。他的成功源于兩個(gè)重要的推斷。首先,文特里斯推測(cè)線形文字B詞匯表中許多重復(fù)單詞是克里特島上的地名,這一推測(cè)后來被證明是正確的。其二,他假設(shè)線形文字B記錄了古希臘與的早期形式,這個(gè)想法隨即幫助他破譯了剩余的文字。

這次,麻省理工學(xué)院人工智能實(shí)驗(yàn)室博士羅佳鳴、麻省理工學(xué)院教授Regina Barzilay和谷歌大腦的曹原以歷史語言學(xué)中記錄的語言變化模式為依據(jù),利用序列對(duì)序列表達(dá)模型捕獲同源詞之間的字符級(jí)對(duì)應(yīng)關(guān)系,建立了一種自動(dòng)破譯失傳古文字的神經(jīng)網(wǎng)絡(luò)算法。

論文介紹,研究人員在模型中輸入失傳文字和已知相關(guān)語言中的非并行語料,模型再根據(jù)失傳文字與已知語言中的對(duì)應(yīng)詞之間的對(duì)齊精度進(jìn)行評(píng)估。

這種方法不僅準(zhǔn)確地把67.3% 的線形文字B同源詞翻譯成了希臘語,還被用來翻譯公元前15世紀(jì)的烏加里特語,翻譯結(jié)果比傳統(tǒng)方法提升了5.5%。

研究人員表示,他們的方法也顯示了對(duì)羅馬語言翻譯工作的改進(jìn)作用。

標(biāo)簽:

上一篇:AI系統(tǒng)處理“情感漫步”從走路姿勢(shì)就能分辨情緒
下一篇:全球152個(gè)汽車品牌1300余輛汽車在中國“汽車城”集中亮相

新聞排行