4月24日,華為召開發布會,推出乾崑ADS 3.0智能駕駛解決方案,圍繞提升駕駛安全性和為用戶釋放時間兩大目標,致力于打造讓AI像人一樣開車的智駕系統。
乾崑ADS3.0背后的技術邏輯,成為智駕從業人員及團隊領導者關心的話題。
乾崑ADS3.0是對傳統智能駕駛技術的一次創新。華為智能駕駛解決方案總裁李文廣對虎嗅智庫表示:華為在智能駕駛領域雖然算是后來者,但他們有信心并敢于挑戰一些別人未曾嘗試過的事情,做到領先。
這些創新,主要體現在ADS3.0全面摒棄BEV,完全基于GOD網絡實現對道路結構、目標障礙物的感知以及場景的理解,同時,使用PDP神經網絡,實現預測決策和規劃,做到模塊化的端到端網絡架構。而同期的業界技術現狀還停留在BEV+transformer的感知范式,對于通用障礙物的識別上存在很大缺陷,要通過白名單的機制實現中國這種復雜場景的泛化是不現實的,GOD網絡很有效的解決了這個問題。
值得一提的是,ADS3.0不僅是一個前沿的技術解決方案,更是一個面向消費者的產品。華為智駕團隊運用IPD(集成產品開發)流程管理體系,并將其與華為一貫的為用戶創造價值的企業文化相結合,進行ADS3.0的開發管理,確保產品的質量和用戶體驗。
為了更深入了解華為乾崑ADS3.0背后的技術邏輯,以及華為是如何運用IPD流程管理體系進行產品開發管理的,虎嗅智庫與華為智能駕駛解決方案總裁李文廣進行了深度對話。
以下為華為智能駕駛解決方案總裁李文廣對話精華部分:
01.把激光雷達用深用好,是多感知融合方案成功的關鍵
虎嗅智庫:華為做自動駕駛解決方案的初衷是什么,圍繞這樣的初衷,華為選擇了怎樣的技術路線?
李文廣:回歸本質,自動駕駛解決方案也是一個to C的產品,我們內部討論多的是它作為一個產品,能給用戶帶來的核心價值是什么??傮w來看,是為了達成兩個目標,一個是通過減少碰撞提升安全性,一個是幫用戶釋放時間。
基于這些考量,我們做了很多工作,從傳感器能力提升到算法優化,再到數據采集和專題訓練等,都有配套相應的措施。華為做智能駕駛的時候,特斯拉已在智駕行業里投入了十幾年,是領頭羊,他走的是純視覺路線。但我們基于安全考量,強化安全屬性,還是選擇走多傳感器融合的技術路線,一開始就采用了激光雷達、視覺和毫米波雷達融合的方式。這一點很好理解,在黑夜,特別是對向來車開大燈的場景,視覺檢測能力很受限,而這時激光雷達卻可以正常工作。
做內部技術決策前,我們也研究了大量碰撞案例,看到很多碰撞案例都是在這種場景下發生的,我們如果選擇純視覺路線,肯定也會遇到同樣的問題。這只是視覺不足的一種場景,視覺在明暗快速變化、目標與背景色差不明顯以及空間深度感知上都存在不足。加上華為在光產品技術和產品化上有很好的積累,通過自研的激光雷達可以做到ADS系統軟件和傳感器硬件的深度協同,所以我們選擇了多傳感器融合的技術路線。
虎嗅智庫:多傳感器融合的技術路線,國內一些新勢力車企也在做,華為的融合感知方案跟他們有哪些不同之處?
李文廣:多傳感器融合也有很多種方案,包括國內一些新勢力也都在走這條路線,但是各家差別也很大,主要是對激光雷達的使用方法和深度不同。簡單舉個例子,2022年,我們合作激光雷達的伙伴公司跟我們講,他們的激光雷達在其他車型上都用了大半年,已經很成熟了。結果我們拿來一用,發現很多問題,比如很多場景下存在大量的噪聲,如果要深度使用根本就不行的,后來通過持續優化很長時間才解決。
伙伴說其他車企沒有反饋這些問題,不知道華為為啥有這么多問題。這個事情說明各家拿到激光雷達的用法不一樣,可能華為用的更深度一些。
各家對激光雷達的使用方法和深度不一樣,主要體現在對通用障礙物的檢測和判斷方面。我舉個例子,我們的GOD 2.0網絡里面深度使用了激光雷達,通過多傳感器的融合做通用障礙物的檢測,雖然不能識別出障礙物具體是什么,但是它能夠告知系統,做出反應動作。這點從主動安全的測試結果就可以看出,都帶激光雷達的車AEB表現卻差別很大,因為有的車的激光雷達在這種場景下并沒起作用。道理都知道,但要讓激光雷達深度參與并發揮好作用其實并不容易,這涉及到如何消除激光雷達的各種干擾,涉及到大量的軟件和傳感器硬件的協同,這塊是我們的強項。
虎嗅智庫:GOD網絡跟特斯拉的Occupancy Network這一套方案有什么不同之處?
李文廣:二者想達到的目的應該是一樣的。因為特斯拉也發現通過視覺白名單的形式,通過純視覺技術路線很難識別出各種物體,所以想要通過視覺加上時序的關系來壘。但純視覺方案天然就不如激光雷達好,因為它對位置的準確性、深度的判斷等方面,尤其是在晚上,或者在眩光的情況下都會有很大的問題,激光雷達能很好的克服這些問題。
GOD2.0網絡使用了激光雷達,會比Occupancy Network在適用范圍、準確度等各個方面表現更好。這一點其實很重要,因為系統準確度或置信度不高的話,就會產生一些誤剎或漏報,比如誤啟動AEB,風險很大,所以把這個東西做準很重要。
02.無圖方案需提升自車感知能力,車位到車位是今年智駕比拼重點
虎嗅智庫:是否去高精地圖仍是業內討論熱點,目前華為的解決方案是怎樣的,跟其他車企或自動駕駛方案解決商有何不同?
李文廣:是否使用高精地圖也是個很重要的技術路線差異,包括是不是走端到端的技術路線。
先說高精地圖,其實華為走高精地圖這條路線,在城區開應該是國內做的好也是早的,我們是在2022年推出的。高精地圖方案其實對車端的道路結構認知的要求降低了,相當于不用看路都能夠知道前方的靜態結構,包括紅綠燈、桿子、路沿等要素。但我們在做的過程中也發現很多其它問題,比如地圖變更很頻繁,且是不可控的,高精地圖方案雖然精準,但如果一旦變更就會很危險,因為它要求車端不斷的識別出它的變更。
其實二者是有點悖論的,一方面是按照圖來開就行,對靜態結構感知能力要求不高,另一方面又要能夠把道路變更都識別出來,這其實對感知能力要求又很高。我們就想:系統有這么強的感知能力了,是否可以不需要高精地圖了?再加上高精地圖推進上,投入大,周期也長,更可怕的是花半年好不容易完成制圖的城市,上線時就已經變了許多。從這兩個方面考量,我們更希望做一個通用化的東西,靠自車感知能力就能夠開,所以我們選擇去掉高精地圖。
智駕行業不存在無圖方案,起碼導航地圖是需要的。無圖只是去高精地圖的一種說法。對于如何去高精地圖也有很多做法,ADS在這塊做的與行業不太一樣。友商基本是找國內圖商合作,做的可能是比高精地圖弱化一些,如HD-,或者是比導航地圖更精細,車道級的,如SD+,基于這樣一個圖上去開。我們當時定的方案是完全基于導航地圖,更多的依賴自車感知能力來開,屬于難度大的一條路線,實際落地時間比原計劃有點延期,原計劃是到去年底全網開通,延期到了今年2月。
做智駕是個持久的過程,技術路線的選擇我們還是要看什么樣的技術路線能夠更好的支撐好用戶的安全和體驗訴求。智能駕駛的需求和方向是明確的,歸根結底我們還是要把自身的能力建好,這才是重要的。
虎嗅智庫:AI大模型在這套方案當中發揮了怎樣的作用?
李文廣:我們在車端叫推理,云端叫訓練,現在云端會做一些大模型的處理。車端實時跑出來的一些數據,其實要做一些大量的數據標注和訓練,數據的標注和模型的訓練對車端跑的結果很關鍵。這些用于訓練的數據,對正確性要求很高,數據標注錯誤率越高,訓練的結果越差,我們就需要思考怎么把這些數據標注的更真更準確,這時候可能就會用大模型去做一些標注,實現自動化和泛化,因為有時候數據量太大了,你也不可能都用人來做。
我們當時做高精地圖,需要做大量的數據標注。2022年峰值的時候,僅標注人員就有上千人。后面如果真正的要全國都能開,涉及到的數據量更大,單純靠人已經應付不過來了,所以我們用大模型來做一些自動標注。
虎嗅智庫:前不久剛剛更新的ADS2.0方案,所有搭載了華為智駕的這些車型,在全國之內一下子都能開了,底層能力來源于哪里?
李文廣:第一,很關鍵的就是車端的感知能力要足夠的強。我們花了大量的時間把車端的感知能力,尤其是在道路結構認知各方面的能力做好,當然在規控方面,也要針對各種場景把預測和決策的能力提升上來。
第二,就是要把學習能力提升上來。因為剛開始時,基本能力可能只需要保證用戶能夠在這里開,但我們想打造的是一個越開越好的系統。可能剛開始比較陌生,智駕表現一般,但是隨著時間的推移會越來越好,這也是我們車往軟件走、往AI走、往智能化走很重要的一個特點。
虎嗅智庫:商用一代預研一代是華為常走的路子,在感知能力提升方面,未來,3.0版本的融合方案將進行哪些優化?
李文廣:在2.0版本中,我們引入了GOD網絡,旨在提升智駕系統的性能。在即將到來的3.0版本中,我們將進行一次重大升級,將原有的BEV模型及傳感器融合信息全部集成到GOD網絡中。這一改進將使我們的系統能夠更準確地識別各種通用障礙物,即使對于未知物體也能保持良好的識別效果。
此外,3.0版本將大幅提高系統對物體的位置、距離、精度以及速度的判斷能力。這些性能的提升,不僅基于GOD網絡的優化,也與云端的數據處理和訓練能力密切相關。華為昇騰系統的強大性能,將為大模型的構建和智駕系統的完善提供有力支持。
我們計劃在今年推出3.0版本,與此同時,2.0版本中的泊車代駕功能預計將在6月份開展外部用戶beta。在3.0版本中,我們將進一步提升這一功能,使其可使用范圍更廣,能夠處理更多復雜情況。
目前,我們正在快速迭代城區方案,并預計在3.0版本中實現顯著的體驗提升。我們的目標是將公開道路和非公開道路完全整合,實現從車位到車位的無縫智駕。這一目標雖然已經被提出多年,但至今仍未有公司實現。我們期待在今年能夠率先達成這一里程碑。
虎嗅智庫:從單車智能來看,我們離L3的能力還有多遠,還需要克服哪些困難和難題?
李文廣:春節期間我們余總發的朋友圈,說智駕開了1300多公里無接管,但要真正做到每個人開1300 多公里都0接管,其實還是有難度,尤其是我們從后臺數據看到一些小的物體,可能是前車掉下來的,也可能是山上掉下來的,各種東西都有。針對這些小物體,要求L3能檢測出來,目前對這些特別小物體的檢出還是有難度的,我們還在研究怎樣實現。
首先想到解決方案是可以從傳感器上去想辦法,可以用特別強大的傳感器,算法和系統能力也要做提升。就像人開車,人是具備推理判斷能力的,當他感受到某些變化時能及時做出應對,比如在地庫里要轉彎的時候,看到右前方有光,就能推理出那個方向有車要過來,但前提是要能看到光。智駕也是同理,本質上講還是要先接收到這些變化的信息,不然很難推理出結果。除此之外,路上行駛容易出問題的就是cut in場景,總會有人不守規矩,在這種情況下,怎么做到比人駕好一些。
L3真正落地,我認為首先要把上面提到的兩大難題解決掉。當然L3落地還有一些其他要求,比如風險預警、系統的冗余等,這些可能在技術難度上還好一點。目前國家層面在做L3準入測試,華為也在提供支撐。我們也在為L3的落地做積極準備,預計在明年實現高速L3的商用。
虎嗅智庫:L3落地對算力的需求是怎樣的,在云端和車端的算力如何分配?
李文廣:現階段來看,L3先落地的駕駛場景應該會是高速路,高速對車端的算力要求不會太高,主要是把車端冗余能力做好,處理好我剛才說的一些異常的各種小物體、cut in這些場景。對云端的算力需求主要看算法,一般來說要幾萬倍到幾十萬倍不等,要看模型規模、數據量的大小、迭代的速度。
對于高速L3的實現,華為目前擁有的算力能力已經足夠支撐。城區道路要做到L3,對算力的要求會很高,因為城區的L3可能比高速的L5難度更大,估計還要3到4年。
03.談談華為的IPD流程管理
虎嗅智庫:華為的IPD流程管理體系是很多企業在學習的,它在智駕團隊的管理中發揮了怎樣的作用,您作為一名管理者是如何使用這些管理工具的?
李文廣:我們團隊現在大概涉及三個領域,有做傳感器的,有做算力平臺的,還有做偏軟件的ADS系統解決方案的,大的架構整體是圍繞一個智能駕駛解決方案設置的。
IPD就是集成產品開發,2000年我剛進公司的時候,華為就引入IPD試點,第一個項目就是在我的項目,做的是3G基站的試點。早是IBM搞了這一套理論,核心是告訴大家如何把一個產品開發好,需要做很多集成,把所有的領域的代表拉進來,包括制造、采購、研發等,有一個產品經理(PDT經理)在這,PDT經理帶領各個領域負責人來開展一些工作,同時對這些人的工作分不同的階段進行流程管理,包含前期的產品定義、到后面的產品開發再到上市階段的管理,不同階段有不同的投資決策的點,它是這樣一套流程管理機制。
在IBM的基礎上,華為結合中國的國情以及公司的特點,對IPD做了很多改造,到現在我們也一直在用。對于自動駕駛來說,它本質上也是個產品解決方案,用在車上對安全性要求更高,我們現在也是按照IPD這套體系進行管理,同時按照汽車行業的要求做了適配,我們叫IPD-IAS。
當然,IPD流程管理不是一個簡單的名詞,對于其他企業可能并不是一學就能會,或者是立竿見影的達到一個理想的效果。華為也是經過了幾十年的實踐,從一開始很難,到現在跟組織的和企業的文化相融合,他是需要日積月累的。
虎嗅智庫:流程管理和企業文化對于華為智駕的成功發揮了怎樣的作用?
公司做大了,就需要有一套流程用來管理和規范,但并不是說有了這套流程就能成功,流程只是起到輔助作用,不起主要作用。華為成功肯定也不是因為IPD成功了,它只是一個輔助的工具。
這跟公司的價值觀有關系,我們堅持以客戶為中心,以奮斗者為本。真正的把這個價值觀做好,我認為可能做很多行業都會成功。因為真正的幫用戶創造了價值,用戶就會喜歡你,買你的產品和服務;真正的讓員工得到了回報,員工都充滿激情,凝聚力很強。
當然,華為的技術或者方向也不一定都是正確的,比如智駕,我們畢竟是后面來的,特斯拉可能已經研究了十幾年,后來者就需要去學習,但只學習也做不到領先,所以要敢于去做一些別人沒做過的東西。
華為為什么做很多事情都能成功,就是因為聚焦在為用戶創造價值。需要想清楚價值,圍繞價值創造敢想敢干,而不是別人做什么我們就做什么,以智駕為例,用戶的終需求,一個是安全,這關系到生命;另一個是時間,從駕駛中釋放更多時間給用戶,我們就需要圍繞這兩大需求展開工作。
本文鏈接:http://www.www897cc.com/showinfo-22-91926-0.html華為乾崑智駕真的能讓AI像人一樣開車嗎
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com