目前全球汽車行業公認由美國高速公路安全管理局(NHTSA)和國際自動機工程師學會(SAE)提出的的分級制度,把自動駕駛分成 L0 到 L5 級,分別承擔相應的職責,而 L4 作為級別第二高的無人駕駛,是指在特定場景下(如高速公路)可以在完全沒有人干預時進行全自動無人駕駛,到現在為止,實現 L4 無人駕駛依舊是人工智能領域最具挑戰性、最復雜的難題之一。
近日,在雷鋒網 AI 研習社第 4 期職播間上,中國最高估值自動駕駛創業公司 Momenta M4U 技術負責人陳凱深度分享了自動駕駛獨角獸 Momenta 如何「打造自動駕駛大腦」,并解讀實現 L4 級別的自動駕駛需要怎樣的技術與人才。
陳凱:Momenta L4 技術負責人,中國科學技術大學博士,RoboCup@Home League 2014 世界冠軍,多年從事機器人研究和相關工作。
分享主題:
從人才角度看 L4 無人駕駛的實現(附 Momenta 招聘解讀)
分享提綱:
1、Momenta 團隊介紹:打造自動駕駛大腦
2、三大平臺實現大數據與 AI 算法的反饋閉環
3、Momenta 核心技術的實現:基于深度學習的環境感知、高精度地圖、駕駛決策算法
4、實現 L4 級別的自動駕駛需要怎樣的技術與人才
雷鋒網 AI 研習社將其分享內容整理如下:
今天主要在這里跟大家分享一下 Momenta 的技術路線,另外會重點介紹一下 L4 級別無人駕駛的人才需求。
Momenta 團隊介紹:打造自動駕駛大腦Momenta 的公司定位是打造自動駕駛大腦,簡單來說,大腦就是跑在無人駕駛系統中的軟件。下圖是公司的核心團隊:
CEO 曹旭東,清華大學畢業,在人工智能行業積攢了近 10 年的研發和管理經驗。他曾在 CVPR/ICCV/ECCV 等計算機視覺頂級會議發表論文數十篇,并曾在美國 National Data Science Bowl 比賽拿下全球亞軍。在創辦 Momenta 之前,曹旭東曾任商湯科技執行研發總監,率領百人研發團隊,具有豐富的管理經驗及產品落地經驗。在加入商湯科技之前,曹旭東任職微軟亞研研究員,其研發技術廣泛用于 Xbox、Bing、How-old 等知名產品,其中現象級產品 How-Old 有著數億用戶。
研發總監任少卿,中國科技大學和微軟亞洲研究院聯合培養博士。任少卿先生是當前最流行的物體檢測框架 Faster-RCNN 的第一作者、當前最有影響力的深度學習網絡結構 ResNet 的第三作者,同時也曾獲得 ImageNet 2015 物體檢測、圖像分類、物體定位冠軍,MS COCO 2015 多項比賽冠軍,及 CVPR 2016 最佳論文等眾多榮譽。
研發總監夏炎,中國科技大學和微軟亞洲研究院聯合培養博士,深度學習和大數據領域專家。在 Bing 等知名產品中,都有應用夏博士的研發成果。
研發總監孫剛,中國科學院計算機視覺博士,高性能并行計算系統專家,大規模圖像識別專家。孫剛先生曾獲 ImageNet 2016 場景分類亞軍、ImageNet 2017 圖像分類冠軍,并曾參與設計世界上首個針對深度學習的 GPU 訓練集群。
此外,Momenta 的團隊成員主要來源于 MIT、CMU、清華大學、北京大學、中國科學技術大學等國內外高校及研究機構,以及 Google、Amazon、Facebook、微軟亞洲研究院、騰訊等知名高科技公司,擁有深厚的技術積累、極強的技術原創力和豐富的行業經驗。
Momenta 是一家擁有世界級研發能力的公司。下面是深度學習領域中比較有名的三項成果,都出自于 Momenta 的核心團隊成員。
第一個是 SENet,它是業界性能最好的深度學習網絡單元,Momenta 也憑借 SENet 獲得 2017 年 ImageNet 圖像分類世界冠軍。
第二個是 Faster R-CNN,任少卿是其作者,它是引用頻率最高的物體檢測框架,Momenta 在此基礎上做了很多改進。
第三個是 ResNet,它是當前最有影響力的深度學習網絡結構,這篇論文也獲得了 2016 年 CVPR 的 Best Paper。
這 3 項研究成果相關的論文引用數已經超過 17000 次;同時,團隊還拿下 ImageNet 2015 物體檢測、圖像分類、物體定位冠軍,MS COCO Challenge 2015 冠軍,ImageNet 2017 圖像分類冠軍等一系列國際頂級賽事的獎項。
Momenta 的定位是打造自動駕駛大腦,始終專注于在人工智能方面的軟件和算法的實現上。
Momenta 的技術包括三大模塊:
基于深度學習的環境感知。
它主要解決的問題就是,無人駕駛車輛可以感知它身邊的一些物體,包括靜態的路面、路牌以及動態的車輛、行人、自行車等等。
高精度地圖。
不同于人類司機,無人駕駛汽車在道路上運行時非常依賴于高精度地圖,這樣它才能知道其正處于什么樣的位置、要到達的位置與當前位置有什么樣的關系,并根據定位和信息去做較為精準的導航,最終自動前往目的地。
駕駛決策算法。
駕駛決策由數據推動,類似于建立一個擁有 1000 億公里駕駛經驗的智能司機。通過眾包路測,Momenta 獲得了高精度語義地圖中海量的駕駛軌跡。通過對海量駕駛軌跡的學習,Momenta 的算法可以根據當前環境感知和高精度地圖信息,做出駕駛決策規劃。
基于這些技術,Momenta 開發了不同級別的自動駕駛方案,而底層技術之前是有很強的通用性的,后面我再具體介紹。
底層平臺實現大數據與 AI 算法的反饋閉環接下來介紹一下如何運用大數據和大計算平臺實現大數據與 AI 算法的反饋閉環。
1. 大計算平臺,它是支撐 Momenta 去訓練得到一個比較好的模型所需要的基礎能力,主要是針對深度學習的 GPU 訓練系統。在創立以來的兩年多時間里,團隊不斷優化訓練平臺,在 2018 年上半年,Momenta 的自有平臺已有數千塊的 GPU,這個數量在創業公司以及大公司內部都是一個非常大的規模。不過僅擁有這么多數量的 GPU 是遠遠不夠的,團隊也設計了一種分布式深度學習訓練系統 ROCS,它針對深度學習做了很多優化,包括跨服務器間高速信息傳輸、優秀的存儲優化,其基于該系統和 SENet,助力了加速產品迭代過程。這一訓練系統的幾大特點是:穩定、高效、軟硬件協同優化、易用。
2. 大數據平臺,指的是百億公里數據采集能力。Momenta 利用眾包的思路積累駕駛相關的數據。不同車輛所面臨的路況、天氣和光照情況在不同的城市千差萬別,積累下來的數據能更好地助力感知算法的研發。數據來源于產品,通過多渠道收集來的數據,能讓技術得到更好的迭代,有助于提升產品的質量和性能,最后形成良性的閉環。
拿到這么多數據后,并不能直接接到大數據平臺,中間會有一些步驟:
第一步是數據采集,通過產品采集數據;
第二步是數據篩選,數據回收后,其中有一些數據是沒用的,所以需要將一些沒用的、模糊的數據挑選出來去掉;
第三步是對有效數據的數據標注,數據系統實際已經使用了 Momenta 精準的算法去進行檢測,而這些算法能大大提高標注效率,不需要從 0 開始進行標注;
第四步,數據接入到 Momenta 的大數據平臺上,進行模型訓練。
訓練過程其實是非常需要消耗存儲和計算資源的,因此內部也有一套在線遠程眾包數據標注系統,能利用訓練結果模型幫助數據篩選,并用算法輔助數據半自動化標注。加入 Momenta 的同學也有機會接觸到這些項目,自己的一些想法也有機會去實踐并驗證。
另外值得一提的是深度學習算法模型,Momenta 能將性能好的模型更好地集成到產品中。在模型精度幾乎不受損的情況下,讓模型計算速度提升 10-100 倍,同時將模型尺寸壓縮 100 倍,讓模型在時間和空間上都有兩個數量級的提升,并讓訓練出來的模型更好地放入車載嵌入式平臺等低計算、低功耗的平臺上,從而更易于產品化。
此外,公司內部還有仿真平臺,用到了非常專業的物理仿真引擎,可對車輛動力進行真實仿真,也可以對在道路上添加動態和靜態障礙物進行仿真,能幫助高級別無人駕駛進行在線測試。
Momenta 核心技術的實現具體介紹一下 Momenta 的環境感知能力,它對不同類型障礙物進行檢測和識別。
道路上最常見的障礙物就是車輛,Momenta 現在可以識別多種車型,而且檢測的不僅僅是外邊框,還能通過一些方法去還原出車輛本身接近 3D 的姿態、輪胎位置等,有了這些信息,就能對障礙物的相對速度、離相機的位置進行一個比較好的估計,從而更好地判斷車與周圍其他車輛的相對關系。
除了車輛,人也是道路上非常常見的障礙物。環境感知能對人體的 17 個關節點進行追蹤檢測,識別每個路人的姿態和動作,例如識別人是在騎車還是走路,人如果走路的話,就要檢測其是否走到車道等與車輛行駛相關的位置上了;人如果在騎車的話,就會檢測其速度和 3D 姿態。
除了這些動態障礙物,靜態障礙物對于車輛也非常重要,包括車道線、路口引導線、交通標識牌、紅綠燈等。例如一些豎著的路燈桿,由于遮擋可能只被識別出一部分,但是環境感知算法會估計出它們的長度,并利用一些先驗信息確定路燈桿的 3D 位置。另外,車道線也是非常有幫助的語義信息,在這些信息基礎上,再加上交通牌等信息,它可以構建基于視覺的語義地圖。
Momenta 也針對中國場景,對感知算法進行了優化,對有國內特色的車輛采集了一些數據,并對這些數據進行針對性的訓練,以更好適應路況、道路上不同類型的障礙物等。
基于車道線、標識牌等信息,Momenta 可以構建一個高精度語義地圖。為什么要構建一個高精度語義地圖?相對于傳統的地圖而言,Momenta 高精度語義地圖具有如下優勢:
第一個是支持更快的更新。對于同類型道路,車輛只需要使用眾包設備上的相機進行道路采集,就可以更新當前所面臨的情況。另外,如果因為道路維修以及發生了一些變化情況,車輛也能通過攝像頭采集相關信息,對其進行很好的維護;
第二個是高度壓縮。高精度語義地圖的空間存儲占用非常小,此外,還具有更好的魯棒性。一些比較底層的特征,勢必由于受到光線、觀測角度等因素,對 2D 特征的提取產生不利影響,而高精度語義地圖就能減少這些因素的影響;
第三個是建圖精度和定位精度,高精度語義地圖從不同視角、不同時間、多攝像頭采集到數據,能最大化地保證地圖的精度,天時能實現定位精度誤差小于 10 cm。
實現 L4 級別的自動駕駛需要怎樣的技術與人才目前 Momenta 累計完成融資超過 2 億美金,估值超過 10 億美金。Momenta 的技術領先性及產品落地能力除了為資本市場廣泛認可外,也深受行業合作方的認可。
接下來針對想加入的小伙伴,介紹一下 Momenta 的成長空間。
Momenta 是一家非常開放、具有分享精神的公司,大家加入公司后都有機會參加國際頂級會議,聆聽行業專家的分享。另外 Momenta 的培養機制也非常健全,包括:
以下是 Momenta 的熱招崗位,感興趣的話可以直接掃描右下方二維碼投遞簡歷。
首先,Momenta 非常通用的崗位就是無人駕駛軟件開發工程師(C++)。不同于一般的軟件開發,無人駕駛系統方向的算法和軟件開發對數據結構、算法優化能力的要求非常高,需求量非常大但是要求也非常高。不過這個崗位有很多機會接觸到系統架構、算法優化的實踐,而在這些項目中,大家都需要去跟同事進行深入的溝通和交流,才能將相關工作做得非常出色。
Planning 算法工程師也是需求量比較大的崗位,負責無人駕駛汽車的行為預測、路徑的決策與規劃,因此需要用到自動化和規劃學習的一些方法。不同的優化和算法都有各自的優勢和局限性,因此,這個崗位需要很好地去運用策略,使得駕駛系統對不同場景能進行更好地處理。
傳感器融合與環境建模算法工程師,需要利用感知來構建精確的車輛周圍動態和環境信息。該崗位需要對多相機、毫米波雷達、超聲和激光物體檢測的數據進行融合,以提高靜態、動態障礙物位置、速度的估計精度,從而構建環境感知模型。
無人駕駛仿真系統工程師,這個崗位除了仿真器相關工作,還有很多數據方面的工作,另外還需要使無人駕駛系統在仿真器上更好地還原所看到的情景,對強化學習和機器學習方面的能力都有一些要求。這個崗位會與仿真開發的同事進行協作,一起去實現更真實的仿真系統開發。
除了研發相關的崗位,Momenta 還有一些測試崗位——無人駕駛測試工程師,我希望任職這一崗位的人有相應的背景知識,從而更好地了解無人駕駛產品怎樣更好地進行系統層面的測試,分析不同的測試結構,并定位模塊,更好地推動開發團隊去改善相關問題。
新聞排行
圖文播報
科普信息網 - 科普類網站
聯系郵箱:85 572 98@qq.com 備案號: 粵ICP備18023326號-39
版權所有:科普信息網 www.www44bkbkcom.cn copyright © 2018 - 2020
科普信息網版權所有 本站點信息未經允許不得復制或鏡像,違者將被追究法律責任!