自動(dòng)駕駛行業(yè),因?yàn)橐粋€(gè)人的離職,要被改變了。
他是Andrej Karpathy,作為特斯拉AI大主管,在7月13日宣布自己從特斯拉離職。
(資料圖片)
作為AI的負(fù)責(zé)人,他五年前加入特斯拉,擔(dān)任神經(jīng)網(wǎng)絡(luò)和計(jì)算機(jī)視覺專家。五年時(shí)間內(nèi)迅速晉升,成為特斯拉Autopilot團(tuán)隊(duì)的重要一員,在特斯拉開發(fā)FSD的過程中也發(fā)揮了非常重要的作用。
有多重要?我可以說,Andrej從特斯拉離職的真正原因,會(huì)決定自動(dòng)駕駛行業(yè)技術(shù)接下來的發(fā)展方向。
為什么一個(gè)人僅僅離職就能對(duì)行業(yè)有影響?
因?yàn)锳ndrej在特斯拉工作期間,并沒有讓特斯拉跟隨著行業(yè)內(nèi)卷起的激光雷達(dá)上車熱潮,而是為自動(dòng)駕駛行業(yè)踏出了一個(gè)全新、純視覺實(shí)現(xiàn)自動(dòng)駕駛的方向。
實(shí)現(xiàn)純視覺自動(dòng)駕駛不難,難的是讓這項(xiàng)技術(shù)真正可以在城市開放街道上實(shí)現(xiàn)。
馬斯克一直以來都堅(jiān)信純視覺自動(dòng)駕駛,因?yàn)樵谶@位硅谷鋼鐵俠看來既然人可以通過兩只眼睛來駕駛車輛,那么機(jī)器一定也可以。他還曾經(jīng)表示馬就是自動(dòng)駕駛,而人和馬的眼睛里,并不會(huì)射出激光。
Andrej在特斯拉成功證明純視覺自動(dòng)駕駛這條技術(shù)路線是可行的,意義并不是幫特斯拉的量產(chǎn)車省下了兩顆或幾顆激光雷達(dá)的成本,而是在眾多自動(dòng)駕駛發(fā)展路線中,成功證明了從L2發(fā)展到L5的可能性。
和以往通過攝像頭抓取的2D圖像進(jìn)行識(shí)別交通參與對(duì)象不同——在Andrej為特斯拉開發(fā)的新版FSD中,特斯拉通過布置在車周身的8個(gè)攝像頭,將獲取到的8個(gè)方向的二維平面圖像數(shù)據(jù)通過算法即時(shí)生成了車身周邊“4D向量空間”。
“4D向量空間”是什么?
本質(zhì)上講是在生成的虛擬三維空間基礎(chǔ)上再增加一個(gè)時(shí)間軸,這樣就可以根據(jù)其他車輛的過去行為來預(yù)測(cè)標(biāo)記物體在未來時(shí)間的運(yùn)動(dòng)。
通過Andrej的這套處理方案,讓機(jī)器幫人類駕駛汽車這件任務(wù),從一個(gè)識(shí)別平面圖并做預(yù)測(cè)圖片中物體會(huì)怎么變化的工作,變成了一個(gè)怎么在三維空間中規(guī)劃行駛路線的“游戲”。
更厲害的是,從特斯拉官方釋放的信息來看,這個(gè)為FSD設(shè)計(jì)的“游戲”內(nèi),事物、場(chǎng)景的精度會(huì)精確到像素級(jí),也就意味著理論上它的精度甚至可以追趕上高精地圖——足夠精細(xì)的3D空間,也意味著對(duì)于特斯拉來說確實(shí)不需要激光雷達(dá)了。
行業(yè)里所追求的激光雷達(dá),到了特斯拉手上,作用就只是裝在部分測(cè)試車上去做3D生成場(chǎng)景的“校準(zhǔn)”——通過激光雷達(dá)的數(shù)據(jù)和車自己生成3D場(chǎng)景數(shù)據(jù)的對(duì)比,來加強(qiáng)這一套從二維平面換算到三維空間的算法的精準(zhǔn)度。
在自動(dòng)駕駛最重要的兩個(gè)核心技術(shù):感知和決策上,Andrej僅僅依靠純視覺的方式,就讓特斯拉的自動(dòng)駕駛在感知方面的精度提高了幾十倍甚至上百倍。
感知精度上的提升,反過來也會(huì)幫助車進(jìn)行更快、更準(zhǔn)確的決策。
比如搭載了兩顆前向激光雷達(dá)的小鵬P5,對(duì)前方的物體的感知能力,就比沒有搭載激光雷達(dá)的P7車型要強(qiáng)很多,這讓P5在涉及到前方的交通場(chǎng)景中可以比P7更快速、果斷做出決策,但對(duì)于激光雷達(dá)檢測(cè)不到的側(cè)后方,P5的感知能力就和P7保持在同一水平,決策方面也就和P7一致,無法做到比P7更準(zhǔn)確、果斷。
Andrej賦予了特斯拉用視覺比拼激光雷達(dá)的能力后,也就意味著感知不再是短板的特斯拉,理論上可以逐漸追上Waymo、Cruise、Argo AI、百度Apollo這些用了激光雷達(dá)的廠商所達(dá)到的無人駕駛水平。
感知的能力獲得巨大提升后,在決策方面特斯拉同樣有所創(chuàng)新。
這個(gè)創(chuàng)新要從自動(dòng)駕駛行業(yè)存在的一個(gè)大問題講起:在AI決策方面,隨著訓(xùn)練里程數(shù)的增加,遇到問題場(chǎng)景的數(shù)量也在大幅度降低。
表面上看這似乎意味著自動(dòng)駕駛AI能夠迅速進(jìn)步,但隨著簡(jiǎn)單高頻的場(chǎng)景逐個(gè)被解決,待解決的低頻場(chǎng)景成為了抵達(dá)終點(diǎn)前的絆腳石——從幾百公里遇到一個(gè)問題變成幾千甚至幾萬公里才遇到一個(gè)問題時(shí),意味著訓(xùn)練AI到我們所需要水平的時(shí)間、里程會(huì)以指數(shù)級(jí)增長(zhǎng),而這一過程沒有盡頭。
這就是為什么行業(yè)里每年都在說距離全自動(dòng)駕駛的美好場(chǎng)景還有五年,但我們一直無法實(shí)現(xiàn)的原因。
要解決這個(gè)問題,就必須有更多的“問題場(chǎng)景”來提供給自動(dòng)駕駛AI訓(xùn)練。
對(duì)于這個(gè)問題,特斯拉以訓(xùn)練自動(dòng)駕駛AI的需求為基礎(chǔ),開發(fā)了名為Dojo的超級(jí)計(jì)算機(jī),在Dojo中,一方面會(huì)用autopilot現(xiàn)實(shí)中遇到的困難場(chǎng)景的4D向量空間數(shù)據(jù)生成虛擬的世界,讓Autopilot在這里面反反復(fù)復(fù)訓(xùn)練,另一方面特斯拉也會(huì)自己制造更多的復(fù)雜、罕見場(chǎng)景用于自動(dòng)駕駛AI訓(xùn)練。
特斯拉的AI訓(xùn)練模式,從發(fā)現(xiàn)問題——解決問題,就變成了自己制造問題——解決問題,毫無疑問,這樣對(duì)于Autopilot而言不必等現(xiàn)實(shí)世界中低頻次問題的發(fā)生,而是只需要讓特斯拉的工程師不斷在虛擬世界中創(chuàng)建問題就可以了。
“問題場(chǎng)景”出現(xiàn)頻次會(huì)隨著訓(xùn)練而降低,從而導(dǎo)致AI訓(xùn)練效率斷崖式下跌的問題被解決后,特斯拉打造的感知+決策+練系統(tǒng)已經(jīng)實(shí)現(xiàn)了完整的閉環(huán),目前使用完全自動(dòng)駕駛(FSD)Beta的客戶車隊(duì)已經(jīng)行駛了超3500萬英里的里程,并且這個(gè)速度正在加快。
接下來Andrej Karpathy要面對(duì)的問題就簡(jiǎn)單了:由AI生成的場(chǎng)景能否把特斯拉的自動(dòng)駕駛訓(xùn)練到L5級(jí)別?
如果能,那么一切交給AI自主訓(xùn)練就好,Andrej不需要做什么了。
如果不能,以馬斯克的性格來看, Andrej需要把AI開發(fā)工作交給下一個(gè)有能力的人。
——從這個(gè)角度來看,無論結(jié)果如何,Andrej都似乎沒有必要留在特斯拉了。
雖然對(duì)于Andrej來說他成功把自動(dòng)駕駛推向了新的高度,但對(duì)于整個(gè)自動(dòng)駕駛行業(yè)而言,Andrej的離職無異于一個(gè)威力巨大的深水炸彈,如今整個(gè)自動(dòng)駕駛行業(yè)都陷入到巨大的不確定性中:
如果特斯拉的純視覺方案可行,那么國(guó)內(nèi)外其他公司就沒有必要在純視覺的技術(shù)路線上追趕特斯拉了——用戶量、數(shù)據(jù)量差的太遠(yuǎn),它們只能尋找其他可行的方案追趕特斯拉。
如果特斯拉的純視覺方案由于不知名的問題受阻,那么意味著整個(gè)自動(dòng)駕駛行業(yè)會(huì)面臨一個(gè)巨大的困境——自動(dòng)駕駛的落地將會(huì)遙遙無期,資本的耐心也會(huì)一點(diǎn)一點(diǎn)損失殆盡。
不管特斯拉能否成功,自動(dòng)駕駛行業(yè)都需要尋找新的出路。
自動(dòng)駕駛的出路可能在哪里?
馬斯克已經(jīng)給我們做了極好的示范:當(dāng)一個(gè)行業(yè)/領(lǐng)域遇到困難時(shí),可以嘗試從第一性原理出發(fā)思考可能的解決方法,比如方才提到的FSD新方案,就是馬斯克基于第一性原理得出的答案:全世界的道路,是為人類駕駛設(shè)計(jì)的,開車的是人而不是機(jī)器。
很顯然馬斯克對(duì)自動(dòng)駕駛一貫堅(jiān)持的觀點(diǎn)是人可以通過兩只眼睛來駕駛車輛,那么機(jī)器一定也可以,這才有了依靠純視覺方案依然能吊打用了一堆用雷達(dá)方案友商的特斯拉。
目前自動(dòng)駕駛似乎花樣繁多,但本質(zhì)上需要解決前面提到過的兩件事:感知和決策。
對(duì)于感知而言,機(jī)器遇到的最大困難并不是對(duì)周圍環(huán)境識(shí)別的精準(zhǔn)程度,而是如何才能讓機(jī)器理解它感知到的畫面。
目前主流的方案是簡(jiǎn)單粗暴給不同物體打上標(biāo)簽,然后再讓AI去訓(xùn)練。
這種方式很明顯只是表層模仿了人類的學(xué)習(xí)方式,這就導(dǎo)致了AI只能依據(jù)圖形的相似情況來判斷物體的種類,然而同一種物體的模樣有千千萬萬,再結(jié)合場(chǎng)景的變化,AI即便訓(xùn)練很長(zhǎng)時(shí)間,也很難做到100%完全識(shí)別。
從更深一層去感知物體的,是用語義地圖的方式。
從人類角度而言,我們通常會(huì)對(duì)整個(gè)圖像進(jìn)行理解,也就是利用上下文信息(context)對(duì)整個(gè)場(chǎng)景進(jìn)行建模,構(gòu)成了一個(gè)場(chǎng)景模型后再進(jìn)行相應(yīng)的處理(碰撞預(yù)警、自動(dòng)巡航等):
語義識(shí)別是通過一個(gè)整體去理解局部,在以前傳統(tǒng)的識(shí)別車輛,車位線框這些元素的基礎(chǔ)上,再增加諸如墻壁接地線、柱子、行人、懸空物的識(shí)別就要比用傳統(tǒng)的算法容易得多。
例如小鵬的VPA停車場(chǎng)記憶泊車功能就采用了這個(gè)方案。原因是地下停車場(chǎng)中各種設(shè)施和管路會(huì)嚴(yán)重干擾毫米波雷達(dá)的運(yùn)行,所以在地下停車場(chǎng)中小鵬就不得不采取了近乎純視覺方案的自動(dòng)駕駛。
但語義地圖仍然是局限在了畫面分割后再識(shí)別的模式上,AI并不具備“聯(lián)想”能力。
——同樣一個(gè)錐桶,僅僅是轉(zhuǎn)換一個(gè)拍攝角度,或微調(diào)一些肉眼無法觀察的像素點(diǎn),人工智能很有可能就識(shí)別失敗,但人類的兒童,卻只需要一張看圖識(shí)字的卡片,便能輕易分辨出在路邊的錐桶和人類手拿的錐桶都是同一個(gè)東西,但它們代表了不同的含義。
從最本質(zhì)出發(fā),自動(dòng)駕駛要想達(dá)到L5級(jí)別,得先具備和兒童識(shí)別物體一樣的能力。也就是說,人工智能模型應(yīng)該可以從 M 個(gè)樣本中學(xué)習(xí)到 N 個(gè)類別,其中 N 可以遠(yuǎn)遠(yuǎn)大于 M。
人類兒童具備這項(xiàng)能力,本質(zhì)上是從出生一刻開始就在不斷的訓(xùn)練、學(xué)習(xí),學(xué)習(xí)的過程中,不僅僅包括了對(duì)各種事物的辨認(rèn),還包括了語言的學(xué)習(xí)——事實(shí)上,全世界各地不同人類的思考方式會(huì)根據(jù)他(她)所掌握的語言而不同而有不同的思考模式。
那么對(duì)于自動(dòng)駕駛的AI而言,我們可能還需要賦予AI一種“語言”來替代現(xiàn)有的標(biāo)簽去讓AI在進(jìn)行深度學(xué)習(xí)的同時(shí),還兼顧學(xué)習(xí)了這門“用于描述交通的語言”,一旦AI可以用這門語言將物體一一對(duì)應(yīng)起來,并自己總結(jié)出交通規(guī)則時(shí),AI或許也能具備融會(huì)貫通分辨物體的能力。
事實(shí)上在AI領(lǐng)域經(jīng)常提到的“神經(jīng)網(wǎng)絡(luò)”,本質(zhì)上就是模仿了人類大腦中的神經(jīng)元和突觸的作用,因此按照第一性原理來看,讓AI真正掌握人類的某個(gè)語言還很困難,但讓AI去真正學(xué)會(huì)一套“專門用于交通的語言”是可行的。
感知部分講明白后,決策部分同時(shí)也可以直接得到答案。
對(duì)于決策而言,機(jī)器遇到的最大困難是如何合理、相對(duì)準(zhǔn)確預(yù)測(cè)參與交通所有對(duì)象想做什么,并讓自己參與到其中——特斯拉的做法是不但車有自己的行駛規(guī)劃(plan),也會(huì)給路面上每一個(gè)參與交通的物體賦予一個(gè)行駛規(guī)劃,然后結(jié)合計(jì)算后,會(huì)讓車選擇風(fēng)險(xiǎn)最低的規(guī)劃結(jié)果。
這跟人類的思維模式很像了,但不同之處在于,目前主流的解決方案更多的是按照物體的屬性結(jié)合行動(dòng)規(guī)律做出的預(yù)測(cè),而如果我們可以讓AI真正學(xué)會(huì)一門“交通語言”,那么理論上就可以讓AI同時(shí)學(xué)會(huì)道路交通中其他參與者的“思考模式”,例如兩輪電瓶車往往會(huì)更靈活且遇到障礙物時(shí)大多不會(huì)看后方是否有來車,反而選擇直接繞行。這時(shí)候一個(gè)“通曉多種交通工具”的AI,就可以更快地做出更正確的駕駛決策。
但這么做的困難在于其他交通工具,甚至人類本身目前并沒有相同級(jí)別的“自動(dòng)駕駛”方案。
目前從整個(gè)行業(yè)來看,看上去指望一家企業(yè)去為每一個(gè)交通參與對(duì)象都創(chuàng)建一套自動(dòng)駕駛AI并把它們?nèi)诤掀饋矸浅2滑F(xiàn)實(shí),但其實(shí)還是有可能做到的:如果能用數(shù)字孿生(digital twin)技術(shù)創(chuàng)建一個(gè)更加真實(shí)的虛擬世界,讓多種交通工具,包括行人本身一起在這個(gè)世界中進(jìn)行訓(xùn)練,最終一定可以得到一個(gè)在決策方面更強(qiáng)的自動(dòng)駕駛AI。
雖然前面我們一直在說因?yàn)锳ndrej Karpathy從特斯拉的離職造成的蝴蝶效應(yīng),可能會(huì)導(dǎo)致自動(dòng)駕駛行業(yè)需要尋找新的出路,也分析了未來技術(shù)可能的發(fā)展方向。
但對(duì)于整個(gè)行業(yè)而言,就像人類出生后要先學(xué)會(huì)爬,然后才是走,最后才是奔跑一樣,現(xiàn)在要想直接在社會(huì)道路上實(shí)現(xiàn)自動(dòng)駕駛對(duì)AI來說仍然過于復(fù)雜了。所以一部分車企選擇了在商業(yè)園區(qū)、礦山這樣環(huán)境相對(duì)簡(jiǎn)單的地區(qū)嘗試落地自動(dòng)駕駛。
但嘗試一段時(shí)間后,無論是園區(qū)還是礦山,都出現(xiàn)了意想不到的問題。
園區(qū)面臨的問題是“走不出去”:如今在園區(qū)自動(dòng)行駛的車大都是低速自動(dòng)駕駛,對(duì)于快遞車而言還需要為其規(guī)劃專門的停車位,以目前的自動(dòng)駕駛水平來說,它們很難直接投放到社會(huì)上去。
經(jīng)常被大眾認(rèn)為是最容易規(guī)模商業(yè)化的自動(dòng)駕駛場(chǎng)景之一的礦山場(chǎng)景,雖然不受道路法規(guī)限制,也不存在“走出去”的問題,但存在很多普通大眾完全想不到的現(xiàn)實(shí)問題:
保證5G信號(hào)覆蓋帶來的網(wǎng)絡(luò)成本、露天礦的生產(chǎn)方式要不停的移動(dòng)設(shè)備位置、工程車的智能化、多種機(jī)械設(shè)備的混編問題、環(huán)境粉塵會(huì)影響自動(dòng)駕駛感知的問題……多如牛毛的問題導(dǎo)致自動(dòng)駕駛并未能在這個(gè)領(lǐng)域落地開花。
雖然這些嘗試讓自動(dòng)駕駛落地的嘗試都沒有真正成功,但這些落地方式都有一個(gè)值得稱贊的共同點(diǎn),那就是“從場(chǎng)景出發(fā)”。
“場(chǎng)景”是一個(gè)使用頻率很高,但在汽車行業(yè)內(nèi)卻是剛剛開始應(yīng)用起來的詞。
傳統(tǒng)汽車確定產(chǎn)品配置的時(shí)候,一般是從每一個(gè)配置對(duì)應(yīng)一個(gè)特定功能,再到對(duì)應(yīng)用戶的某一個(gè)需求出發(fā)來定制產(chǎn)品配置的方式。這種方式在汽車市場(chǎng)上體現(xiàn)的是以部分配置和競(jìng)品形成差異化的打法,這種打法過去很好用,但在“自動(dòng)駕駛”這項(xiàng)功能上就失效了。
一方面是要實(shí)現(xiàn)自動(dòng)駕駛所需的配置方案多種多樣,另一方面是除了硬件到位,軟件上的開發(fā)也必不可少,這就導(dǎo)致了在配置表“Feature list”上“智能輔助駕駛”雖然只有寥寥幾項(xiàng),但它涉及的人力物力并不比造一臺(tái)新車少。
——“自動(dòng)駕駛”可以包含很多的功能應(yīng)用,而要實(shí)現(xiàn)這些功能的應(yīng)用,主要取決于用戶使用的場(chǎng)景。如果我們能把用戶的場(chǎng)景盡可能的拆解、細(xì)分之后,就可以先針對(duì)某一些場(chǎng)景去開發(fā)對(duì)用戶 “真正有用”的自動(dòng)駕駛功能,比如可以在用戶不舒服的時(shí)候讓AI接管,在川流不息的道路上找到合適的機(jī)會(huì)停車靠邊打雙閃這樣的功能就很實(shí)用。
這樣做不但可以在相對(duì)短的時(shí)間內(nèi)先把自動(dòng)駕駛這個(gè)產(chǎn)品真正落地,從整個(gè)市場(chǎng)競(jìng)爭(zhēng)的角度來看,有了好用的功能,產(chǎn)品的定位也會(huì)更清晰。
目前市面上已經(jīng)有不少車企正在做基于細(xì)分場(chǎng)景的自動(dòng)駕駛開發(fā)了,但都主要集中在了跑高速、自動(dòng)泊車這兩個(gè)場(chǎng)景上(也還不夠好),整體上用戶仍然有很多的真實(shí)需求并沒有滿足:
先做地庫(kù)全自動(dòng)行車、泊車場(chǎng)景(有-小鵬汽車、威馬汽車)
先做停車場(chǎng)召喚場(chǎng)景(有-特斯拉)
先做應(yīng)急停車場(chǎng)景(無)
先做高速場(chǎng)景(有-小鵬汽車、蔚來汽車、理想汽車、特斯拉)
先做擁堵跟車場(chǎng)景(無)
先做用戶需要臨時(shí)分神的輔助場(chǎng)景(無)
所以從比礦山、物流更細(xì)分、更細(xì)微的場(chǎng)景出發(fā),是自動(dòng)駕駛落地的一個(gè)方向。
雖然我們還不知道Andrej Karpathy接下來會(huì)去哪里,但毫無疑問的是,除了特斯拉之外的其他廠商,需要努力為它們的技術(shù)路線尋找到新的落地方向。
在這眾多的方向選擇中,為自動(dòng)駕駛AI開發(fā)一套專用的語言幫助它們理解世界,并用數(shù)字孿生(digital twin)的方式去讓他們學(xué)習(xí)到所有交通工具甚至人類的行動(dòng)邏輯,這或許是自動(dòng)駕駛能真正開始落地的道路。
關(guān)鍵詞: 激光雷達(dá)
網(wǎng)站首頁(yè) |網(wǎng)站簡(jiǎn)介 | 關(guān)于我們 | 廣告業(yè)務(wù) | 投稿信箱
Copyright © 2000-2020 www.xnbt.net All Rights Reserved.
中國(guó)網(wǎng)絡(luò)消費(fèi)網(wǎng) 版權(quán)所有 未經(jīng)書面授權(quán) 不得復(fù)制或建立鏡像
聯(lián)系郵箱:920 891 263@qq.com
主站蜘蛛池模板: 免费特级黄毛片| 一进一出抽搐呻吟| 黑人巨茎大战俄罗斯美女| 天天天天做夜夜夜做| 日本japanese丰满护士| 波多野结衣一区二区| 日本免费三区| 波多野结衣痴女系列88| 国产免费久久精品99久久| 九九九精品视频免费| 色播在线电影| 久久国产一区二区三区| 欧美婷婷六月丁香综合色| 黑人中文字幕| 小镇姑娘hd电影在线观看| 日韩精品武藤兰视频在线| 欧美性猛交xxxx乱大交| 在线观看亚洲一区| 日本哺乳期xxxx| 在线观看v片| 亚洲一卡二卡三卡四卡无卡麻豆| 夫妇交换性2国语在线观看 | 把她抵在洗手台挺进撞击视频| a级毛片视频免费观看| 亚洲免费福利视频| 国产精品久久久久久久久齐齐| 日韩美女hd高清电影| 99精品视频在线免费观看| 美女把腿扒开让男人桶爽了| 国产va免费精品观看精品| 女的和男的一起怼怼| 97av视频在线播放| 老司机午夜在线视频免费| 国产高清日韩| 精品一区二区久久久久久久网站| 色牛影院| va在线观看| 色偷偷人人澡人人爽人人模| 妞干网免费观看视频| 亚洲欧美综合另类| 污小说总裁整夜没拔出|