科普信息網(wǎng)

亮相冬奧會完成全民科普,風(fēng)口飛了一年的數(shù)字人如何照進(jìn)現(xiàn)實(shí)?

發(fā)布時間:2022-02-18 11:58:10 來源:觀瀾財經(jīng) 責(zé)任編輯:caobo

毫無懸念地,2022北京冬奧會成了虎年的第一場流量盛宴。這項全民關(guān)注的體育賽事不僅僅是運(yùn)動員的競技場,也是各路新科技的秀場,風(fēng)口上飛了一年的數(shù)字人也扎堆來此亮相。其中出鏡率最高的,或許就是央視新聞推出的AI手語主播了。

經(jīng)歷了去年的鵲起與火爆,以央視AI手語主播為代表的數(shù)字人們,正試圖借助奧運(yùn)會完成一次全民科普。

01.

冬奧會迎來AI手語主播

2月4日冬奧會正式開幕,央視新聞的AI手語主播正式上崗,她就是一位由手語翻譯引擎和自然動作引擎驅(qū)動的數(shù)字人。此后,這位主播就在冬奧會的新聞播報、賽事直播和現(xiàn)場采訪中帶來實(shí)時的手語翻譯,讓聽障人士也能夠共享冰雪運(yùn)動的激情與精彩。

要在冬奧會這樣全民矚目的場合做手語播報,必須要有過硬的專業(yè)能力。在這位主播正式上崗之前,央視新聞專門安排了一次高難度的“面試”,派出了曾經(jīng)讓多位手語老師崩潰的播音員朱廣權(quán)。

只見朱廣權(quán)說了一段語速超快、專業(yè)名詞超多的冬奧貫口,直接把翻譯難度拉到滿級。而這位AI手語主播氣定神閑,左右手快速做出對應(yīng)手勢,再配合口型和肢體動作,用連貫、流暢的表達(dá)完全拿捏了這一段播報。

AI手語主播能夠有如此精彩的表現(xiàn),要?dú)w功于背后的語音識別、自然語音理解等多項技術(shù)的應(yīng)用。

根據(jù)央視披露的信息, AI手語主播長時間、系統(tǒng)性地學(xué)習(xí)了《國家通用手語詞典》,另外還學(xué)習(xí)了百萬量級的標(biāo)準(zhǔn)手語平行語料數(shù)據(jù)和超8500條影視級手語動作數(shù)據(jù),從而做出了精準(zhǔn)、流暢的手語解說,手語動作精準(zhǔn)度達(dá)95%以上。

此外,它還專門學(xué)習(xí)了冬奧相關(guān)語料數(shù)據(jù),并且參考了“自然手語”的邏輯,才能最終呈現(xiàn)符合聽障人士表達(dá)習(xí)慣的手語。而作為一個在電視轉(zhuǎn)播中出現(xiàn)的數(shù)字人,實(shí)時的視頻渲染與顯示也很重要,在4D掃描技術(shù)的加持之下,口型合成準(zhǔn)確率達(dá)到98.5%,并且表情自然生動,出色地勝任了手語的工作。

將數(shù)字人技術(shù)應(yīng)用在手語翻譯中,既是對特殊人群的人文關(guān)懷,也為新技術(shù)開拓了落地場景。數(shù)據(jù)顯示,全球約4.3億人有中度及以上程度的聽力障礙,中國現(xiàn)有聽障人士超2700萬。自這次冬奧會上崗之后,央視的AI手語主播將全年無休地工作,繼續(xù)服務(wù)廣大聽障人士。

02.

數(shù)字人的一次全民科普

除了AI手語主播之外,冬奧會的賽場內(nèi)外還出現(xiàn)了多位數(shù)字人的身影。比如,谷愛凌的數(shù)字分身“Meet GU”直接走進(jìn)咪咕的演播室與主持人實(shí)現(xiàn)“虛實(shí)互動”,向觀眾介紹谷愛凌參賽的自由式滑雪女子大跳臺項目。

而在2月2號舉行的冬奧會文化節(jié)開幕式上,中國虛擬歌手洛天依身著中式旗袍,以花樣滑冰動作為舞步,獻(xiàn)唱歌曲《Time to Shine》為冬奧會應(yīng)援。

新華社的特約“數(shù)字人”記者冬冬,還去逛了一圈滿是“冰墩墩”的冬奧會特許商品店,更會在晚上客串直播間賣貨。

多種不同類型的數(shù)字人集體亮相,成功借助冬奧會這個全民熱點(diǎn)完成了一次全民科普——原來數(shù)字人離我們的生活這么近!

過去的一年,隨著元宇宙概念大熱,與之密切相關(guān)的數(shù)字人也熱度飆升,并趁勢在多個行業(yè)和場景中得到應(yīng)用。數(shù)字人在社交、媒體傳播、營銷、傳統(tǒng)產(chǎn)業(yè)等領(lǐng)域的價值正在逐漸顯現(xiàn)。

國投美亞基金投資副總裁楊天蔚告訴觀瀾財經(jīng),數(shù)字人在冬奧會前后扎堆亮相,背后是上下游的云計算、NLP、邊緣計算、實(shí)時渲染等技術(shù)已經(jīng)發(fā)展到一個節(jié)點(diǎn),在應(yīng)用層面取得突破是水到渠成的事。國投美亞基金作為由國投智能和美亞柏科(300188)發(fā)起的產(chǎn)業(yè)投資基金,一直專注于新一代信息技術(shù)領(lǐng)域的產(chǎn)業(yè)投資與賦能。美亞柏科(300188)本身更是深耕于數(shù)據(jù)治理、數(shù)據(jù)智能及數(shù)據(jù)安全領(lǐng)域的行業(yè)龍頭。

楊天蔚分析,數(shù)字人的概念早已有之,它一方面滿足了企業(yè)與用戶互動方式變遷、升級的需求,成為新一代的企業(yè)門戶;另一方面也滿足了企業(yè)形象代言人的需求。企業(yè)與用戶互動方式,經(jīng)歷了從官網(wǎng)到公眾號、視頻號等新媒體的變遷,但這些都是單向輸出。相比之下數(shù)字人有更強(qiáng)的智能性與互動性。同時,數(shù)字人不會“塌房”,這么看也是更合理的經(jīng)濟(jì)賬。

他認(rèn)為數(shù)字人在階段鮮有商用的核心原因,是目前大部分的企業(yè)數(shù)據(jù)智能化的能力尚還處于建立的階段,且數(shù)字人的技術(shù)落地依然是高度定制化,應(yīng)用落地存在相當(dāng)高的門檻。“也就冬奧會這樣級別的場景才有這個預(yù)算,數(shù)字人背后都是經(jīng)費(fèi)在燃燒。”

他補(bǔ)充道,數(shù)字人的未來具有很大市場空間,但如果從加德納技術(shù)成熟度曲線(Gartner Hype Cycle)來看,數(shù)字人目前仍處在快速成長的爆發(fā)期,離真正的成熟還有很長的距離要走。“數(shù)字人背后的基礎(chǔ)技術(shù)要達(dá)到普惠級別,才會趟過破滅期進(jìn)入平穩(wěn)發(fā)展期。”

也正因此,目前數(shù)字人的嘗鮮者多數(shù)都是B端的客戶,這也與本次冬奧會所呈現(xiàn)的產(chǎn)品與應(yīng)用相吻合。

03.

數(shù)字人先在B端照進(jìn)現(xiàn)實(shí)

與國投美亞基金的觀察類似,廈門黑鏡科技有限公司(下稱:黑鏡科技)認(rèn)為,在需求尚未發(fā)掘的B端市場,數(shù)字人已經(jīng)具備解決若干問題的能力,比如制作基于數(shù)字人的企業(yè)內(nèi)容、虛擬員工等。

黑鏡科技將數(shù)字人技術(shù)應(yīng)用到企業(yè)SaaS服務(wù)上,利用自身的全棧虛擬化技術(shù),幫助企業(yè)低成本、低門檻地創(chuàng)建數(shù)字人,并用這些數(shù)字人進(jìn)一步創(chuàng)作虛擬內(nèi)容,服務(wù)企業(yè)的新聞發(fā)布、培訓(xùn)、銷售等需求,降低虛擬人力成本。

SaaS (Software as a Service,軟件即服務(wù)) 是云計算的一種服務(wù)模式。在SaaS服務(wù)模式下,服務(wù)提供商將應(yīng)用軟件統(tǒng)一部署在自己的服務(wù)器上,用戶無需管理和控制底層的基礎(chǔ)設(shè)施,通過互聯(lián)網(wǎng)按需定購指定的應(yīng)用軟件服務(wù),并根據(jù)服務(wù)量、服務(wù)時間或其他方式支付費(fèi)用。

黑鏡科技創(chuàng)始人、董事長陳軍宏表示,當(dāng)前數(shù)字人應(yīng)用的一大痛點(diǎn)是成本高,這包含了創(chuàng)建的成本和使用的成本;另外一大痛點(diǎn)是門檻高,不僅技術(shù)門檻高,內(nèi)容門檻也高。這使得數(shù)字人應(yīng)用難以快速普及,“無法做到平民化”。

針對這兩個痛點(diǎn),黑鏡科技推出了完全云原生、無代碼前端的數(shù)字人生產(chǎn)及內(nèi)容創(chuàng)建工具M(jìn)etaMaker ,實(shí)現(xiàn)了“一站式”與“一鍵式”的自動化操作,無需專業(yè)培訓(xùn)就可以快速上手,完成過去需要十多個專業(yè)軟件協(xié)同才能夠勝任的復(fù)雜工作。

基于自身全棧的AI虛擬化技術(shù),黑鏡科技的MetaMaker 僅用一張真人的照片就可以生成不同風(fēng)格的3D數(shù)字人,不僅可以完全自定義五官、皮膚、頭發(fā)、服飾等細(xì)節(jié),還能智能計算人體自然的動作與口型,并做到鏡頭的運(yùn)動切換。

在這個“孿生”的數(shù)字人的基礎(chǔ)上,MetaMaker 還可結(jié)合具體的內(nèi)容與場景,進(jìn)一步為數(shù)字人添加相應(yīng)的肢體動作、手勢和表情,并利用TTS引擎給數(shù)字人配音,從而制作完整的視頻內(nèi)容,服務(wù)企業(yè)的新聞發(fā)布、培訓(xùn)、銷售等真實(shí)場景。

在MetaMaker 這個工具產(chǎn)品之外,黑鏡科技還將數(shù)字人的技術(shù)能力封裝為一個SDK,涵蓋3D人臉重建、自定義捏臉、自適應(yīng)服飾系統(tǒng)、動作驅(qū)動、聲音驅(qū)動、圖片驅(qū)動等多種解決方案,可以應(yīng)用到車載數(shù)字人系統(tǒng)、智能音箱數(shù)字人系統(tǒng)、企業(yè)數(shù)字人客服系統(tǒng)等領(lǐng)域。

陳軍宏透露,目前黑鏡科技的產(chǎn)品和技術(shù)已經(jīng)獲得了愛奇藝、科大訊飛、一汽奔騰、新氧、中國經(jīng)濟(jì)網(wǎng)等客戶。

此外,黑鏡科技的全棧技術(shù)能力也獲得了業(yè)界認(rèn)可。在量子位發(fā)布的《2021年虛擬數(shù)字人深度產(chǎn)業(yè)報告》中,黑鏡科技成為數(shù)字人產(chǎn)業(yè)鏈中游的代表企業(yè),并與百度、小冰公司、字節(jié)跳動等大廠一同被列為國內(nèi)的主要玩家。

觀瀾財經(jīng)還注意到,黑鏡科技的團(tuán)隊很早就涉足數(shù)字人,是當(dāng)時國內(nèi)最優(yōu)秀的團(tuán)隊之一,曾做過一個紅遍全球的產(chǎn)品“小偶”。

這個C端的產(chǎn)品一度在全球51個主要國家的 App Store 免費(fèi)榜里排名第一,在91個國家進(jìn)入前五名,并且在100多個國家進(jìn)入了前十名,更俘獲了一眾歐美及日韓的偶像明星。Lady Gaga、神奇女俠主演蓋爾·加朵等都在自己的 Instagram 帳號上發(fā)布了用小偶制作的視頻。

小偶的成功表明,基于數(shù)字人的內(nèi)容是用戶喜聞樂見的。但如何把數(shù)字人的創(chuàng)建及內(nèi)容能力賦能給更多企業(yè),從而讓企業(yè)利用數(shù)字人技術(shù)解決生產(chǎn)、銷售等各種環(huán)節(jié)的問題,這是陳軍宏和黑鏡科技正在探索的新課題。

對于數(shù)字人在企業(yè)中應(yīng)用的未來,國投美亞基金投資副總裁楊天蔚補(bǔ)充道,數(shù)字人誕生之后還要靠大量的數(shù)據(jù)來“喂養(yǎng)”,才能逐漸完善為一個逼真的人設(shè),具備對外輸出形象和服務(wù)的能力,這就要求企業(yè)需要具備數(shù)據(jù)治理以及數(shù)據(jù)智能化的能力。

“數(shù)字人未來就是企業(yè)的‘Jarvis’,數(shù)字人對數(shù)據(jù)安全也會提出更高的要求,萬一數(shù)字人被劫持綁架了呢?”楊天蔚說。

標(biāo)簽: 央視新聞

上一篇:
下一篇:

新聞排行