科普信息網(wǎng)

NIPS 2018人工智能假肢挑戰(zhàn)賽 百度團(tuán)隊(duì)奪得第一

發(fā)布時(shí)間:2018-11-14 11:52:50 來源:雷鋒網(wǎng) 責(zé)任編輯:caobo

距 NIPS 2018 召開還有不到一個(gè)月的時(shí)間,NIPS 2018 上的各種技術(shù)挑戰(zhàn)賽也接近尾聲。

在上周結(jié)束的 2018人工智能假肢挑戰(zhàn)賽(AI for Prosthetics Challenge)中,來自百度 NLP 團(tuán)隊(duì)的 Firework 一舉擊敗全球 400 多支參賽團(tuán)隊(duì),以 9980.46 的得分奪得冠軍,領(lǐng)先第二名高達(dá) 30 多分。

NIPS 2018人工智能假肢挑戰(zhàn)賽結(jié)束,百度Firework團(tuán)隊(duì)奪得第一

人工智能假肢挑戰(zhàn)賽是由斯坦福大學(xué)神經(jīng)生物實(shí)驗(yàn)室與 EPFL 聯(lián)合舉辦的強(qiáng)化學(xué)習(xí)賽事,旨在通過將強(qiáng)化學(xué)習(xí)應(yīng)用到人體腿部骨骼仿真模擬模型的訓(xùn)練,從而加快人體假肢領(lǐng)域的相關(guān)研究,并開創(chuàng)該領(lǐng)域的研究的新方法。

自今年 7 月份啟動(dòng)以來,來自全球 400 多技術(shù)團(tuán)隊(duì)都參與其中。其中既有上屆冠軍、由 “RNN之父”Juergen Schmidhuber 創(chuàng)立的 NNAISENSE,也有阿里巴巴、Yandex 等巨頭。

今年的比賽中,賽會(huì)組織者提供了一個(gè)人體骨骼-高仿模型,該模型是斯坦福國家醫(yī)學(xué)康復(fù)研究中心研發(fā)的 Opensim 高仿模型,擁有人類腿部絕大多數(shù)真實(shí)骨骼、關(guān)節(jié)和肌肉的精細(xì)仿真。參賽者需要根據(jù)該模型中多達(dá) 100 個(gè)以上的狀態(tài),來決定模型肌肉的信號(hào),然后控制該模型的肌體行走。

在去年的第一次挑戰(zhàn)賽上,比賽規(guī)則圍繞誰能讓模型肌體行走速度最快。而今年除了將整個(gè)模型運(yùn)動(dòng)控制從 2D 改為 3D 外,還引入帶有假肢的模型,同時(shí)模型的假肢不可控制,模型肌體行走的速度也有要求,并且還需要在第二輪比賽中按照事先未知的指定速度進(jìn)行切換。

相較而下,今年的比賽難度再次增加。比如對(duì)模型肌體有效信息的判斷上,由于實(shí)際狀態(tài)空間和動(dòng)作空間稠密并且非常大,導(dǎo)致基于強(qiáng)化學(xué)習(xí)的算法無法準(zhǔn)確把握模型肌體的行走姿勢(shì);更進(jìn)一步,由于規(guī)則要求不斷切換速度,更增加了模型控制難度。

在此次比賽中,百度首先通過上千臺(tái)機(jī)器的 CPU 集群來加速模擬環(huán)境,利用 RPC 機(jī)制進(jìn)行機(jī)器間通信,從而能在高性能 GPU 上進(jìn)行高效的模型訓(xùn)練。

其次,利用Target Driven Deep Deterministic Policy Gradient (Target Driven DDPG),使得模型能夠應(yīng)對(duì)較大空間和連續(xù)動(dòng)作空間的挑戰(zhàn),最終也使得一個(gè)單一模型能夠?qū)W習(xí)多種速度和姿態(tài)。

第三,在算法層面,通過 multi-head bootstrapping,能夠更高效的對(duì)巨大的解空間進(jìn)行探索(Exploration),同時(shí)還將旋轉(zhuǎn)不變性等各類特征處理方式,以及不斷實(shí)驗(yàn)累計(jì)的各類 reward shaping 方法應(yīng)用其中。

正是這些關(guān)鍵技術(shù)的綜合應(yīng)用,讓百度能以 9980 的高分一舉奪冠。據(jù)悉,早在本次比賽以前,百度已經(jīng)將強(qiáng)化學(xué)習(xí)技術(shù)應(yīng)用于信息流推薦、廣告展現(xiàn)、搜索排序等大規(guī)模工業(yè)級(jí)場(chǎng)景。而本次比賽中所展現(xiàn)出的技術(shù)實(shí)力,再次證明了百度在強(qiáng)化學(xué)習(xí)相關(guān)技術(shù)上的積累也能夠進(jìn)一步推廣到復(fù)雜機(jī)器人控制、自動(dòng)駕駛等更多工業(yè)領(lǐng)域。

標(biāo)簽: 人工智能 百度團(tuán)隊(duì)

上一篇:三星電子加入全球人工智能研究小組
下一篇:2018AI和機(jī)器學(xué)習(xí)界的12個(gè)重大收購案

新聞排行