【今日頭條】北京理工大學(xué)龔建偉:多元大數(shù)據(jù)遷移學(xué)習(xí)類人駕駛決策與控制技術(shù)
發(fā)布日期:2017-12-14 供稿:來源:今日頭條 編輯:薛喬丹 審核:王征 閱讀次數(shù):
原文標(biāo)題:北京理工大學(xué)龔建偉:多元大數(shù)據(jù)遷移學(xué)習(xí)類人駕駛決策與控制技術(shù)
非常高興有這么一個機(jī)會和大家一起分享,我今天演講的題目是多元大數(shù)據(jù)遷移學(xué)習(xí)類人駕駛決策與控制技術(shù)。那為什么要提多元大數(shù)據(jù)呢,?我們前面一直在說個性化的學(xué)習(xí),,就是如何利用一些小樣本的數(shù)據(jù)來達(dá)到學(xué)習(xí)效果,之所以一直利用小樣車數(shù)據(jù),,這實際上有一個障礙沒有克服,,那就是不知道怎么樣如何去利用海量數(shù)據(jù)進(jìn)行學(xué)習(xí)訓(xùn)練,數(shù)據(jù)量一多也就不知道怎么樣處理了?,F(xiàn)在我們的數(shù)據(jù)越來越多了,,我們在進(jìn)行數(shù)據(jù)采集時,單一行駛場景下的少量數(shù)據(jù),,我們很快就可以處理下來,,用于機(jī)器學(xué)習(xí)也可以達(dá)到一定的學(xué)習(xí)效果。但是如果是一臺車跑一天,,數(shù)據(jù)量就非常多,,那這些數(shù)據(jù)該如何利用,用來進(jìn)行提升無人駕駛車輛的智能水平,,如何進(jìn)行學(xué)習(xí)訓(xùn)練,?
小樣本數(shù)據(jù)學(xué)習(xí),就不可能實現(xiàn)持續(xù)的優(yōu)化學(xué)習(xí),,還有可能會造成學(xué)習(xí)的負(fù)遷移,,比如剛開始一個駕駛技術(shù)很好的駕駛員數(shù)據(jù)學(xué)習(xí),但是又把一個很差的駕駛員的數(shù)據(jù)放進(jìn)來的話,,這個樣本就可能把前面的訓(xùn)練結(jié)果損壞,,那么怎么樣去做這個工作?此外,,成百上千個駕駛員,,怎么樣去實現(xiàn)自動駕駛智能水平的提升,?數(shù)據(jù)如何采集?數(shù)據(jù)如何分類,?怎么樣分析這些數(shù)據(jù),,這是大量數(shù)據(jù)處理并用于機(jī)器學(xué)習(xí)時很關(guān)鍵的一個問題。
下面我結(jié)合一些研究實踐來介紹我們數(shù)據(jù)來源,。北京理工大學(xué)機(jī)械與車輛學(xué)院車輛系有無人車技術(shù)工業(yè)和信息化的重點實驗室,、地面無人機(jī)動武器平臺國防科技創(chuàng)新團(tuán)隊、電動車輛工程實驗室,、新能源車輛國家監(jiān)管平臺等,,隨著新能源車輛的發(fā)展,結(jié)合無人駕駛車輛領(lǐng)域二十多年的研究積累,,我們有條件采集大量駕駛員行為數(shù)據(jù),,以后更可以把行駛場景數(shù)據(jù)結(jié)合起來?目前可以得到北京市部分公共交通車輛駕駛行為數(shù)據(jù),,再結(jié)合我們團(tuán)隊自動駕駛測試車輛數(shù)據(jù),,具備了進(jìn)行大量數(shù)據(jù)學(xué)習(xí)研究的基本條件。
將來如果實現(xiàn)5G無線通信,,目前這些研究成果就完全可以把道路場景,、包括實時檢測結(jié)果都放進(jìn)來。類人駕駛行為學(xué)習(xí)的整體架構(gòu),,也是我們準(zhǔn)備了很長時間的問題,,現(xiàn)在從環(huán)境數(shù)據(jù)到交通場景的理解、運動規(guī)劃和車輛狀態(tài)數(shù)據(jù)都能夠結(jié)合起來,,一方面進(jìn)行基于我們前期的研究成果,,進(jìn)行基于模型的學(xué)習(xí);另一方面我們也在嘗試端到端的學(xué)習(xí)方法,,但是目前端到端的輸出結(jié)果,,還不是確定性的,無法實現(xiàn)預(yù)期的輸出,,目前只是做一些簡單的嘗試,。
在實現(xiàn)方法上,測試車輛具備自動駕駛能力,,能夠感知周圍行駛場景數(shù)據(jù),,并把這些數(shù)據(jù)進(jìn)行在線或離線的分析、提取,,同時采集駕駛員操作控制信息,,以及車輛狀態(tài)特性數(shù)據(jù)。測試車輛并不一定需要自動駕駛,,我們可以讓駕駛員去開車,,這樣的話,就可以得到大量的樣本數(shù)據(jù),,分析人類駕駛員在各種行駛場景下的行為決策和操縱控制,。我們通過數(shù)據(jù)平臺的采集,一直是利用單個駕駛員數(shù)據(jù)來進(jìn)行學(xué)習(xí),,現(xiàn)在正在采集更多的駕駛員的數(shù)據(jù),,實現(xiàn)多元大數(shù)據(jù)的機(jī)器學(xué)習(xí)。
數(shù)據(jù)來源,,一方面我們從大量智能駕駛測試項目開發(fā)工作中采集,,另一方面利用實際道路和交通場景,進(jìn)行有目的的人類駕駛員數(shù)據(jù)采集,??梢灾苯硬杉部梢岳镁W(wǎng)聯(lián)車輛的數(shù)據(jù),。結(jié)合行駛場景,,特別是地圖數(shù)據(jù),比如北京市北三環(huán)路段的數(shù)據(jù),,還有京承高速的數(shù)據(jù),,有了這些地圖數(shù)據(jù)場景加上直接的數(shù)據(jù)來源,也可以做很多的機(jī)器學(xué)習(xí)工作,。
近期我們完成了一些專線運營場景的示范運行,,同時在一些測試試驗場。
自動駕駛系統(tǒng)的構(gòu)成,,包括環(huán)境感知,、規(guī)劃決策與控制、人機(jī)交互,、電動線控底盤等子系統(tǒng),。其中有一個很重要的問題,就是車輛如何實現(xiàn)精確定位,,而且能夠做到低成本,,位置信息結(jié)合周圍環(huán)境數(shù)據(jù),對數(shù)據(jù)的學(xué)習(xí)利用非常重要,。
常用導(dǎo)航定位方式有很多,,包括標(biāo)線/標(biāo)志、衛(wèi)星導(dǎo)航,、航跡推算,、地圖導(dǎo)航等。每一種導(dǎo)航定位方式都有自己的優(yōu)缺點,。視覺車道線檢測受環(huán)境影響較大,、衛(wèi)星定位則容易受到遮擋和多路徑效應(yīng)影響,,比如橋洞、隧道,、樓群等場景就可能沒有信號,,還有航跡推算大部分情形下需要用高精度慣導(dǎo),成本太高,,也不是非常合適的定位方式,。如果自動駕駛系統(tǒng)的決策規(guī)劃與控制技術(shù)完全依賴高精定位,那就無法實現(xiàn)了,。
再就是高精度的地圖,,如果不是長期運營,成本也非常大,,目前我們可以用數(shù)據(jù)采集的工作,,后期處理工作較多,更多是依靠人工處理,。同時要進(jìn)行精定位數(shù)據(jù)我們都要進(jìn)行定位的工作,,還要進(jìn)行精確的測點,例如用人工每一個點定位五分鐘,,就可以得到該點較為精確的坐標(biāo),,找?guī)讉€點能夠形成所謂的定位閉環(huán),定位精度可以就高了,。
我們之所以要特別強(qiáng)調(diào)定位,,因為我們數(shù)據(jù)學(xué)習(xí)對位置高精度的依賴性比較高,較高的位置精度可以充分利用車載傳感器的檢測信息,,方便離線處理,。最終的方案實現(xiàn)多源信息的綜合定位,充分利用激光雷達(dá),、視覺傳感器等信息,,結(jié)合地圖定位,包括矢量地圖,、特征地圖和點云地圖,,實現(xiàn)低成本的精確定位。
目前關(guān)鍵技術(shù)問題是動態(tài)干擾對定位結(jié)果影響比較大,,解決這個問題,,有可能形成一套低成本的定位系統(tǒng),目前的高清度衛(wèi)星慣導(dǎo)組合導(dǎo)航定位系統(tǒng)動則五六十萬,。
其他交通要素的檢測,,包括周圍車輛檢測,目的是對周圍車輛的行為進(jìn)行分析。樣本數(shù)據(jù)中其他車輛的換道等行為,,對本車行為決策結(jié)果是會有影響的,。自動駕駛車輛如何和周圍的車輛進(jìn)行協(xié)作,目前的工作還是比較膚淺的,。比如是有人駕駛時候,,我們一個手勢就可以做到交互了,,但要機(jī)器去理解這些情景就非常困難,,今后有可能通過車車交互數(shù)據(jù)去實現(xiàn)。
另一個數(shù)據(jù)來源是仿真數(shù)據(jù),。這些仿真數(shù)據(jù)包括超車換道等行為數(shù)據(jù),。仿真數(shù)據(jù)也可以是完全的由軟件來做,目前我們的仿真架構(gòu)和嵌入式的軟件完全是一模一樣的,。
道路模型,、地圖屬性是環(huán)境模型的重要組成部分,我們在學(xué)習(xí)的樣本里面都是需要用到數(shù)據(jù)模型,,包括這些數(shù)據(jù)和環(huán)境檢測識別結(jié)果,。還需要結(jié)合車輛網(wǎng)聯(lián)數(shù)據(jù),網(wǎng)聯(lián)信息例如路基的紅綠燈信息通過廣播,,自動駕駛車輛得到路口數(shù)據(jù),,能夠?qū)崿F(xiàn)自動速度規(guī)劃和避讓,從節(jié)能和交通效率優(yōu)化的角度來進(jìn)行評價,。
在共性優(yōu)化基礎(chǔ)上的個性化,,所謂的個性化,我們希望每一臺自動駕駛車輛,,能夠?qū)W會每個駕駛員的優(yōu)點,,經(jīng)驗和知識越來越豐富。同時能夠適應(yīng)某個駕駛員特定的駕駛風(fēng)格,,實現(xiàn)所謂的個性化,。
我們現(xiàn)在要實現(xiàn)多個駕駛員在多個場景下的學(xué)習(xí),對這些數(shù)據(jù)的處理,,首先是基元建模,。提出了一個駕駛基元的概念,我們把所有的數(shù)據(jù)分為一個一個的數(shù)據(jù)基元,,可以把各種甚遠(yuǎn)數(shù)據(jù)進(jìn)行組合,,通過組合優(yōu)化,就可以實現(xiàn)其他的場景的遷移,。比如說一個道路的環(huán)境,,我可以根據(jù)道路的曲率和彎道分幾種基元,通過駕駛員的操控數(shù)據(jù),,把基礎(chǔ)的基元利用起來,,再把這些基元進(jìn)行組合,,我們就可以進(jìn)行相應(yīng)的學(xué)習(xí)。這是包括了橫向,、轉(zhuǎn)向,、縱向的速度可以對應(yīng)起來,再和環(huán)境的數(shù)據(jù)對應(yīng)起來,,很多的數(shù)據(jù)都可以進(jìn)行不同的組合優(yōu)化,。
一些非常簡單的場景,也在做端到端的場景輸出,,這個還很不靠譜,,所以目前我們主要是基于學(xué)習(xí)的模型來做,希望可以做出比較好的水平,。
那關(guān)鍵的問題,,組合優(yōu)化的算法怎么樣達(dá)到比較好的學(xué)習(xí)效果,怎么樣實現(xiàn)在不同的場景里,,有一個度量和遷移的關(guān)系,,分層的進(jìn)行學(xué)習(xí),包括一些端到端的方法進(jìn)行學(xué)習(xí),、仿真和構(gòu)建,。
這是我們整個的基元的提取,到基元的遷移和組合的優(yōu)化,,目前已經(jīng)走了兩三年的時間了,,這對于整個后續(xù)系統(tǒng)的提升會有很大的幫助和提升。
我今天就先分享這些,,謝謝大家,!
分享到: