科普信息網(wǎng)

百度輸入法AI探索版亮相 SMLTA加持超行業(yè)水平15%

發(fā)布時(shí)間:2019-01-17 10:58:19 來源:TechWeb 責(zé)任編輯:caobo

1月16日,百度輸入法AI探索版今日正式亮相,這是一款默認(rèn)輸入方式為全語音輸入,并可以調(diào)動(dòng)表情、肢體等進(jìn)行全感官輸入的全新輸入產(chǎn)品。

這款A(yù)I輸入法采用了百度語音技術(shù)突破性創(chuàng)新:流式截?cái)嗟亩鄬幼⒁饬δP?mdash;—Streamingtrancatedmulti-layerattention(SMLTA),在線語音識(shí)別精度相比行業(yè)最高水平又提升了15%,并完美支持方言輸入、中英文混說輸?shù)榷喾N語音輸入方式。

百度中文輸入法負(fù)責(zé)人蔡玉婷介紹,截至2018年底,百度輸入法月活躍人數(shù)已達(dá)5億,語音日請(qǐng)求量峰值突破5.5億,AR表情使用次數(shù)超過1億。同時(shí),百度海外輸入法全球安裝量超過1億,支持120種語言,覆蓋全球190個(gè)國家地區(qū),并已與超過100個(gè)全球知名IP達(dá)成合作。

現(xiàn)場,百度高級(jí)副總裁王海峰表示,輸入法是離用戶最近的產(chǎn)品之一,也是AI落地的“橋頭堡”,百度全方位的AI能力正在不斷賦能輸入法,讓輸入法更“聰明”。他認(rèn)為,未來的輸入法將應(yīng)用于各種智能設(shè)備與用戶的交互,連通包括智能家居、車聯(lián)網(wǎng)等多種終端場景。

AI探索版特色功能

蔡玉婷介紹,相較2016年,百度輸入法日均語音請(qǐng)求量增長了8倍,語音輸入法的場景也從聊天和搜索拓展到游戲、娛樂、購物等眾多場景。百度輸入法AI探索版是百度AI落地應(yīng)用的又一重要成果,全語音交互是它最大的特點(diǎn)之一。

尤其值得一提的是,借助SMLTA,百度AI輸入法突破了業(yè)界普遍認(rèn)為較難實(shí)現(xiàn)的中英文混說識(shí)別,在完全不影響中文語音輸入準(zhǔn)確率的情況下,能高精準(zhǔn)的中英文混合語音識(shí)輸入。

此外,百度輸入法將普通話和六大方言融合成一個(gè)語音識(shí)別模型,實(shí)現(xiàn)了方言與方言、方言與普通話的混合語音輸入。現(xiàn)場分別演示了百度輸入法AI探索版接收四川、西北、東北等6地方言的語音輸入,識(shí)別準(zhǔn)確率均表現(xiàn)不俗。

據(jù)介紹,百度輸入法是目前唯一實(shí)現(xiàn)了高精度“中英自由說”和“方言自由說”的輸入法產(chǎn)品。

此外,蔡玉婷介紹,目前百度輸入法已經(jīng)支持6地方言的語音輸入識(shí)別,尚不支持粵語,未來將陸續(xù)更多地方方言。

除了語音輸入,百度輸入法AI探索版還推出了拍立活、秀場、凌空手寫等新功能玩法。

SMLTA技術(shù)加持在線語音識(shí)別精度再提高15%

當(dāng)前語音領(lǐng)域主流的Attention模型(注意力模型)提出已有好幾年。注意力模型的核心思想,是通過機(jī)器學(xué)習(xí)的方法,把一句話中每個(gè)音節(jié)或者漢字的音頻特征,從整句話的音頻特征中,通過機(jī)器學(xué)習(xí)的方法,自動(dòng)的挖掘出來。直接實(shí)現(xiàn)了語音和文本一體化的端到端建模,從而公認(rèn)的有更高的建模精度。

但是截止目前,注意力模型在在線語音服務(wù)中的大規(guī)模使用,一直鮮有成功案例。

百度語音技術(shù)部負(fù)責(zé)人高亮向TechWeb等介紹,流式截?cái)嗟亩鄬幼⒁饬δP?SMLTA)是基于CTC的尖峰信息對(duì)語音流進(jìn)行截?cái)啵缓笤倜恳唤財(cái)嗟恼Z音小段上進(jìn)行當(dāng)前建模單元的注意力建模,把全局的Attention的整句識(shí)別變成了局部的Attention的流式識(shí)別,并且引入多層的Attention,實(shí)現(xiàn)特征層層遞進(jìn)的更精準(zhǔn)的特征選擇。

這使得語音識(shí)別的識(shí)別率超越傳統(tǒng)的全局Attention建模,同時(shí)計(jì)算速度和傳統(tǒng)CTC技術(shù)持平,實(shí)現(xiàn)全CPU流量的大規(guī)模線上服務(wù)。這是全世界范圍內(nèi),第一次基于attention技術(shù)的在線語音識(shí)別服務(wù)的大規(guī)模上線。這項(xiàng)技術(shù)的突破促使百度輸入法“在線語音”相對(duì)準(zhǔn)確率領(lǐng)先業(yè)界15%。

同時(shí),百度語音技術(shù)團(tuán)隊(duì)優(yōu)化了輸入法上嵌入式識(shí)別的deeppeak2系統(tǒng),大幅提升了離線語音識(shí)別準(zhǔn)確率。據(jù)介紹,目前百度輸入法“離線語音”輸入準(zhǔn)確率已高于行業(yè)平均水平35%。

高亮介紹,嵌入式識(shí)別、中英文混合識(shí)別、方言識(shí)別,這三個(gè)技術(shù)體現(xiàn)了百度語音的技術(shù)制高點(diǎn)。

標(biāo)簽: 百度輸入法 AI

上一篇:澳大利亞5G服務(wù)未能如期推出,或與華為禁令有關(guān)
下一篇:無人駕駛汽車已經(jīng)出現(xiàn) AI接管船舶還會(huì)遠(yuǎn)嗎?

新聞排行