近日,據外媒報道,最新研究表明:直接連接到大腦的人工語音設備在未來的某個時刻或成現實。這也意味著失去說話能力的人有望開口說話。
著名的科學作家Kelly Servick,介紹了發表在BioRxiv雜志上的三篇論文。這三篇論文課題由三組不同的研究人員進行研究,但他們都得出了一個研究結論:可以從神經元放電的記錄中解碼人類語音。
在每一項研究中,當腦外科患者講話或大聲朗讀單詞的時候,直接放置在大腦上的電極就記錄神經活動。在每一種情況下,研究人員都能將大腦的腦電波活動轉化為至少可以理解的聲音文件。
2018年10月10日發表在BioRxiv雜志上的第一篇論文,描述了這樣一項實驗:研究人員在實驗中向正在做腦部手術的癲癇病人播放了語音錄音。(實驗中記錄的神經活動必須非常詳細才能得到更好地解釋。因此只有當大腦暴露在空氣中,電極直接放置在空氣中時,才能獲得這種程度的細節,比如在腦外科手術中。)
當病人聽聲音錄音時,研究人員記錄了病人大腦中處理聲音的部分神經元的放電情況??茖W家們嘗試了多種不同的方法將神經元放電數據轉化為語言。而且研究人員發現,擁有深度學習能力的計算機或多或少能在無人監督的情況下解決這一問題,而且效果不錯。
當他們通過一個合成人類聲音的聲碼器為11名聽眾播放語音時,這些人在75%的時間情況下都能正確地解釋單詞。
2018年11月27日發表在BioRxiv雜志上的第二篇論文,描述了這樣一項實驗:研究人員記錄了接受腦腫瘤摘除手術的病人的神經活動。當病人大聲讀出單音節的單詞時,研究人員記錄了病人口中發出的聲音和在他們大腦中產生言語的區域。
這些研究人員沒有對每個病人進行深入的計算機培訓,而是教授了一種人工神經網絡,將神經記錄轉換成音頻,這表明這些結果至少是合理的,而且類似于麥克風的錄音。
2018年8月9日發表在BioRxiv雜志上的第三篇論文,提出了這樣一個結論:大腦的一部分神經元決定了一個人說話的特定詞語通過肌肉運動轉化出來。
雖然這一實驗的錄音文件無法在網上找到,但研究人員說,他們能夠重建整個句子(也是在腦外科手術期間記錄到的),而且在83%的時間里,聽過這些句子的人能夠在多項選擇測試中正確地解釋這些句子(10種選擇中的一種)。該實驗的方法依賴于識別產生單個音節所涉及的模式,而不是整個單詞。
所有這些實驗的目標是有一天使那些失去說話能力的人開口說話。科學報道說,解釋一個人的神經模式,僅僅是想象一個人的講話,這要比解釋一個人聽或產生講話的模式要復雜得多。(然而,第二篇論文的作者說,解釋那些想象演講的人的大腦活動是可能的。)
同樣值得注意的是,這些都是小范圍的研究。第一篇論文所依據的數據僅來自五名患者,而第二篇則以六名患者為研究對象,第三篇僅為三名患者。并且所有的神經記錄都沒有持續超過一個小時。
盡管如此,科學仍在向前發展,直接連接到大腦的人工語音設備在未來的某個時刻似乎會成為現實。
標簽: 人工語音
新聞排行
圖文播報
科普信息網 - 科普類網站
聯系郵箱:85 572 98@qq.com 備案號: 粵ICP備18023326號-39
版權所有:科普信息網 www.www44bkbkcom.cn copyright © 2018 - 2020
科普信息網版權所有 本站點信息未經允許不得復制或鏡像,違者將被追究法律責任!