日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

當前位置:首頁 > 科技  > 手機

抄不了特斯拉的作業:“蔚小理華”可咋整

來源: 責編: 時間:2024-08-26 08:25:28 99觀看
導讀 一次全行業的端到端切換,讓車企們的智駕競賽又回到同一起跑線上。隨著特斯拉基于端到端路線的 FSD v12.5 版本在北美地區已經取得了令人驚艷的效果,今年以來,國內的玩家從中領悟了智駕升級的“武功秘籍&r

一次全行業的端到端切換,讓車企們的智駕競賽又回到同一起跑線上。oTW28資訊網——每日最新資訊28at.com

隨著特斯拉基于端到端路線的 FSD v12.5 版本在北美地區已經取得了令人驚艷的效果,今年以來,國內的玩家從中領悟了智駕升級的“武功秘籍”。(關于端到端的技術原理,虎嗅汽車團隊曾在《特斯拉,要跟華為開戰了》一文中有過詳細解析)oTW28資訊網——每日最新資訊28at.com

抄不了特斯拉的作業:“蔚小理華”可咋整oTW28資訊網——每日最新資訊28at.com

在模塊化堆規則時期,代碼bug修復能力越強,智駕能力表現越好,同時場內玩家通過開城和落地速度也隨之分野。但問題在于,僅憑傳統的智駕規則無法從根本上解決現實世界的理解和推理問題,沒辦法解決許多復雜場景和 Corner case。oTW28資訊網——每日最新資訊28at.com

因此,“上限不高”的規則時代很快被大模型和端到端的到來取代,尤其是后者近乎“一日千里”的迭代速度,更是讓一眾車企紛紛其規則轉投端到端技術路徑,這其中便包括蔚小理華等玩家。oTW28資訊網——每日最新資訊28at.com

端到端已經成為智駕行業下一代共識方案,雖然沒有人能明確端到端是否是自動駕駛的終局方案,但目前沒有比端到端更好的智駕技術方案。oTW28資訊網——每日最新資訊28at.com

基于此,本期暗信號旨在梳理目前場內頭部玩家是如何進行“端到端技術路線”布局,通過不同玩家的不同做法和落地進度,窺見車企智駕能力的演進以及接下來智駕行業的競爭錨點。oTW28資訊網——每日最新資訊28at.com

理想:雙系統協同,“世界模型”外掛oTW28資訊網——每日最新資訊28at.com

理想其實是端到端路線的激進派。oTW28資訊網——每日最新資訊28at.com

抄不了特斯拉的作業:“蔚小理華”可咋整oTW28資訊網——每日最新資訊28at.com

根據理想汽車公開的技術架構,其端到端自動駕駛技術方案分為端到端模型、VLM 視覺語言模型、世界模型三部分。oTW28資訊網——每日最新資訊28at.com

基于快慢系統理論,理想汽車形成了自動駕駛算法架構的原型——oTW28資訊網——每日最新資訊28at.com

系統 1 由 One Model 端到端模型實現,通過接收傳感器輸入,并直接輸出行駛軌跡用于控制車輛;oTW28資訊網——每日最新資訊28at.com

系統 2 由 VLM 視覺語言模型實現,其接收傳感器輸入后,經過邏輯思考,輸出決策信息給到系統 1。oTW28資訊網——每日最新資訊28at.com

雙系統構成的自動駕駛能力將在云端利用世界模型進行訓練和驗證。oTW28資訊網——每日最新資訊28at.com

端到端模型的輸入主要由攝像頭和激光雷達構成,多傳感器特征經過 CNN 主干網絡的提取、融合,投影至 BEV 空間,疊加車輛狀態信息和導航信息,經過 Transformer 模型的編碼,與 BEV 特征共同解碼出動態障礙物、道路結構和通用障礙物,并規劃出行車軌跡。oTW28資訊網——每日最新資訊28at.com

目前,系統 1 的訓練數據庫已有 3 億多參數,其這一模型在實際駕駛中能夠具備更高的通用障礙物理解能力、超視距導航能力、道路結構理解能力等。oTW28資訊網——每日最新資訊28at.com

系統 2 的VLM視覺語言模型主要面向的是 5% 的特殊交通場景,如遇到分時段限行、潮汐車道等負責的交通規則理解,相當于副駕坐了個駕校的教練時刻監督駕駛行為,目前已有 22 億參數。oTW28資訊網——每日最新資訊28at.com

VLM視覺語言模型的工作原理是,將Prompt(提示詞)文本進行Tokenizer(分詞器)編碼,并將前視相機的圖像和導航地圖信息進行視覺信息編碼,再通過圖文對齊模塊進行模態對齊,終統一進行自回歸推理,輸出對環境的理解、駕駛決策和駕駛軌跡,傳遞給系統1輔助控制車輛。oTW28資訊網——每日最新資訊28at.com

在實際應用場景中,如果系統二發現行駛過程中地面路面非常坑洼不平時候,其會給系統 1 發一個降速的提醒,并會像ChatGPT一樣告知駕駛員路面信息,終輸出駕駛建議,類似“車輛將慢速行駛,以減少顛簸”。oTW28資訊網——每日最新資訊28at.com

在兩大系統之外,理想利用重建+生成式的世界模型,為自動駕駛系統能力的學習和測試創造了虛擬環境,相當于通過生成真題題庫,讓系統 1、2 在虛擬世界進行考試,以驗證和提高系統能力。oTW28資訊網——每日最新資訊28at.com

小鵬汽車:“三網融合”oTW28資訊網——每日最新資訊28at.com

小鵬聲稱是國內首個量產上車的端到端大模型,但其并非采用“一體化”的“端到端智駕大模型”,而是包括三個部分——神經網絡Xnet+規控大模型XPlanner+大語言模型XBrain。oTW28資訊網——每日最新資訊28at.com

抄不了特斯拉的作業:“蔚小理華”可咋整oTW28資訊網——每日最新資訊28at.com

其中,神經網絡XNet實現的是“感知”層面的功能,相當于眼睛。oTW28資訊網——每日最新資訊28at.com

神經網絡XNet能將攝像頭采集到的信息,通過動態XNet+靜態XNet+2K占用網絡,用超過200萬個網格重構世界,對現實世界中的可通行空間進行3D還原,包括動態障礙物(行人、車輛等)、靜態障礙物(水馬、路障等)、路面標識(箭頭、車道線等)等信息,進行純視覺感知識別。oTW28資訊網——每日最新資訊28at.com

據官網數據,其感知范圍面積可達1.8個足球場大小,同時識別50+個目標物。oTW28資訊網——每日最新資訊28at.com

基于圖像數據的感知輸入,規控大模型XPlanner負責“模塊化”智駕路線中的“決策規劃”和“控制執行”功能,類似于小腦。oTW28資訊網——每日最新資訊28at.com

相比“模塊化”智駕路線中的“決策規劃”模塊,規控大模型XPlanner的優勢在于不需要人類手寫規則代碼,完全依靠神經網絡模型,通過海量數據的不間斷訓練,優化駕駛策略,讓車輛有更類人的駕駛習慣和駕駛思維。oTW28資訊網——每日最新資訊28at.com

AI大語言模型XBrain充當“大腦”的角色,相當于給了智能駕駛輔助系統超越感知的“認知能力”。這其實與理想的系統二的功能有相似之處。oTW28資訊網——每日最新資訊28at.com

XBrain能夠認識待轉區、潮汐車道、特殊車道、路牌文字等路上交通信息。例如,面對“前方道路施工,請換道”等環境信息,其能夠看懂并理解從而讓車輛執行對應的操作。oTW28資訊網——每日最新資訊28at.com

小鵬方面表示,端到端大模型上車后,每2天進行一次迭代,18個月內小鵬智能駕駛能力將提高 30 倍。oTW28資訊網——每日最新資訊28at.com

華為:兩網協同,用安全網絡兜底oTW28資訊網——每日最新資訊28at.com

和小鵬一樣,華為的端到端技術架構同樣是分段式——感知部分采用 GOD網絡(General Object Detection,通用障礙物識別),決策規劃采用PDP網絡(Prediction-Decision-Planning,預測決策規控)實現。oTW28資訊網——每日最新資訊28at.com

抄不了特斯拉的作業:“蔚小理華”可咋整oTW28資訊網——每日最新資訊28at.com

先看感知層面。在華為 ADS 2.0 時期,其采用的是BEV+GOD+RCR網絡,BEV負責看到(BEV, Bird's Eye View,視覺為中心的鳥瞰圖),GOD負責“看懂物”(GOD, General Obstacle Detection Network,通用障礙物檢測網絡),RCR負責看懂路(RCR,Road Cognition & Reasoning,道路拓撲推理網絡),由此實現感知層面的識別。oTW28資訊網——每日最新資訊28at.com

不過,這個階段依舊是規則堆疊的階段,如果傳感器識別的路況信息是曾經訓練過的特征信息,則能夠直接輸出給規控一個正確方案,但如果遇到一些未曾訓練好的場景,智駕系統就容易出錯或是不工作。oTW28資訊網——每日最新資訊28at.com

由此到了 ADS 3.0 階段,華為將 GOD 和 RCR 的算法納入到一個完整的 GOD 感知神經網絡之中,實現了從簡單的“識別障礙物”到深度的“理解駕駛場景”。oTW28資訊網——每日最新資訊28at.com

另外,華為采用PDP(預測決策規控)網絡實現預決策和規劃一張網,基于感知數據規劃行車路線。oTW28資訊網——每日最新資訊28at.com

有了GOD+PDP 神經網絡模型之后,華為再利用云端 AI 訓練平臺進行大量的數據訓練,讓模型得以迭代升級。oTW28資訊網——每日最新資訊28at.com

華為同樣認為“讓 AI 去開車”這件事十分激進,目前的人工智能都會AI幻覺,有30%左右的錯誤率,于是其在端到端模型中加入了“本能網絡安全”進行兜底,提供誤踩油門防碰撞功能,路面自適應 AEB,在濕滑路面、雨雪路面可提前舒適制動等功能。oTW28資訊網——每日最新資訊28at.com

蔚來:引入NWM世界模型的端到端架構oTW28資訊網——每日最新資訊28at.com

關于端到端,蔚來沒有公開過這一方面的技術架構。從已有的公開消息來看,其對端到端的應用目前在主動安全功能層面。oTW28資訊網——每日最新資訊28at.com

今年7月,蔚來推送了基于端到端算法實現的AEB系統,通過讓模型學習真實環境下的優秀避險數據,覆蓋更多“不規則”的危險場景,目前已積累了超過20億公里的事故數據和緊急避險數據。相較于標準AEB,端到端架構的AEB在路口場景方面的緊急制動正確響應提升了5.2倍。oTW28資訊網——每日最新資訊28at.com

在蔚來智能駕駛研發副總裁任少卿看來,自動駕駛的大模型需要拆解成若干個層級,第一步是模型化,第二步是端到端,去掉不同模塊間人為定義的接口,第三步是大模型。oTW28資訊網——每日最新資訊28at.com

2023年,蔚來在高速NOA的規控里加入AI神經網絡,雖然任少卿曾表示蔚來的端到端智駕方案是將感知模型與規控模型合并,實現信息無損傳遞,但在其看來,只是端到端給出規劃路徑還不足夠,智能駕駛走向大模型化需要具備認知和預測能力,即預判、推演其他交通參與者行為和交通環境的變化。oTW28資訊網——每日最新資訊28at.com

由此,蔚來在今年 NIO IN 上發布了蔚來世界模型 NWM——NIO World Model。從蔚來智能駕駛技術架構NADArch 2.0來看,蔚來已在算法層升級為引入NWM世界模型的端到端架構。oTW28資訊網——每日最新資訊28at.com

抄不了特斯拉的作業:“蔚小理華”可咋整oTW28資訊網——每日最新資訊28at.com

據了解,NWM是一個多元自回歸生成式的具身駕駛模型,可全量理解數據,具備長時序推演和決策能力,能在 100 毫秒內推演出 216 種可能發生的場景。另外,作為生成式模型,NWM 能基于 3 秒的駕駛視頻,生成 120 秒的想象視頻。oTW28資訊網——每日最新資訊28at.com

目前業內對于世界模型有著不同的應用思考,國內廠商多是把世界模型作為驗證的一環,例如上述提到理想的技術架構中,就引入了世界模型以重建+生產的方式生成模擬數據,作為獨立的架構存在。oTW28資訊網——每日最新資訊28at.com

雙方對于世界模型在智駕上應用出現分歧的核心因素在于,蔚來看到了世界模型對于智駕推演、預測的可能性和可行性,但理想認為,世界模型能力還不夠成熟,例如在生成上會出現幻覺等。oTW28資訊網——每日最新資訊28at.com

可以確定的是,將世界模型引入智駕領域是車企們下一步探索的方向。oTW28資訊網——每日最新資訊28at.com

端到端沒有標準答案oTW28資訊網——每日最新資訊28at.com

透過頭部自研廠商的技術路徑可以看到,圍繞端到端這一概念,不同廠商設計出不同的技術路線和模型架構,無論是 One Model 的端到端還是分段式的“部分端到端”都有玩家押注。oTW28資訊網——每日最新資訊28at.com

由于技術仍處在探索階段,目前業內也沒有一個可供參考的實踐案例(特斯拉雖然在北美推送了 V12.5版本,但其端到端網絡架構至今還未對外披露),在當前的發展階段,行業內對端到端的路徑還沒有形成共識。oTW28資訊網——每日最新資訊28at.com

雖然沒有標準答案,但這并不妨礙車企給出各自的解題思路。oTW28資訊網——每日最新資訊28at.com

當然,空談技術路線并無過多意義,技術的價值在于落地,對于消費者來說,端到端技術的落地,帶來直觀的感受便是智駕能力的提升。oTW28資訊網——每日最新資訊28at.com

從部分早鳥用戶的使用感受以及媒體評測視頻來看,搭載端到端的車型能夠適應更多的城市路況,例如能夠在路邊開啟智駕功能、實現環島通行、在遇到障礙物時能夠借道繞行等。oTW28資訊網——每日最新資訊28at.com

與此同時,端到端帶來的“門到門”體驗也是升級的一部分。諸如小鵬、華為等玩家都已透露將推送能夠暢通ETC、小區入口檔桿、工廠內部道路等場景的智駕版本,實現從家門口到辦公室門口的“門到門”。oTW28資訊網——每日最新資訊28at.com

另外,人工接管次數也有了明顯的下降。在規則驅動時期,車輛開啟智能駕駛后,遇到規則以外的突發路況、或是稍微復雜的城市路況時都需要人工接管,但端到端大模型具備更高上限的理解能力和處理能力,能夠有效降低接管次數,更為絲滑地處理不同路況。oTW28資訊網——每日最新資訊28at.com

當然,端到端目前還只是起步階段,車企也在通過測試、迭代以優化其模型效果。可以預見的是,當下的汽車產業正迎來全新的智駕技術競賽。oTW28資訊網——每日最新資訊28at.com

相較于規則階段,端到端架構需要投入更多資源和資金。優質數據的篩選、清洗、標注、儲存,模型訓練所需的算力基礎設施,部署大模型能力等,無不需要投入。oTW28資訊網——每日最新資訊28at.com

特斯拉CEO馬斯克就曾強調過數據對端到端的重要性:“用100萬個視頻case訓練,勉強夠用;200萬個,稍好一些;300萬個,就會感到Wow(驚嘆);到了1000萬個,就變得難以置信了。”oTW28資訊網——每日最新資訊28at.com

何小鵬也曾提到,“自動駕駛有非常大的數據門檻,而且越往后越難成功,頭部效應會越來越明顯。”oTW28資訊網——每日最新資訊28at.com

數據量是一方面,對國內車企而言,算力訓練也是一大競爭維度。不同于特斯拉能夠大肆采購英偉達的顯卡儲備算力,在國內,用于云端訓練的芯片一卡難求,不少車企都在高價收購。oTW28資訊網——每日最新資訊28at.com

郎咸朋就曾在交流中透露,去年年底花了大量資金買卡。據理想汽車初步估算,要從 L2+ 走向L3,甚至是L4階段,起碼需要30 EFLOPS的算力儲備。oTW28資訊網——每日最新資訊28at.com

從算力層面來看,根據公開信息,部分廠商的訓練資源如下:oTW28資訊網——每日最新資訊28at.com

特斯拉 100 EFLOPS(預計 2024 年年末可達到)oTW28資訊網——每日最新資訊28at.com

華為 5 EFLOPS(2024 年 8 月)oTW28資訊網——每日最新資訊28at.com

蔚來 1.4 EFLOPS(2023 年 9 月)oTW28資訊網——每日最新資訊28at.com

理想 4.5 EFLOPS(2024 年 7 月)oTW28資訊網——每日最新資訊28at.com

小鵬 2.51 EFLOPS(2024 年 7 月)oTW28資訊網——每日最新資訊28at.com

資源投入背后其實也是關乎資金的戰役。小鵬汽車對外表示在AI訓練上已投入了35億費用,今后每年還將投入超過7億元用于算力訓練。郎咸朋更是直言沒有10億美元利潤,未來玩不起自動駕駛。oTW28資訊網——每日最新資訊28at.com

誰家的數據更多,誰家的數據更有價值,誰家的算力更高,迭代效果更好等,都會影響端到端路徑的實際應用表現。這是一場關乎數據量、算力和投入的戰役,車企的智駕能力終也將走向落地之時實現分野。oTW28資訊網——每日最新資訊28at.com

對用戶而言,在不久的將來,端到端技術帶來的產業變化和智駕功能升級也將有更為具象化的感知。oTW28資訊網——每日最新資訊28at.com


文章出處:虎嗅網

本文鏈接:http://www.www897cc.com/showinfo-22-109716-0.html抄不了特斯拉的作業:“蔚小理華”可咋整

聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com

上一篇: 慶祝入股引望!阿維塔華為乾崑ADS終身高階智駕包立減2萬元

下一篇: 接收到30公里外信號新紀錄!華為水下通信技術里程碑式突破

標簽:
  • 熱門焦點
  • 直屏旗艦來了 iQOO 12和K70 Pro同臺競技

    旗艦機基本上使用的都是雙曲面屏幕,這就讓很多喜歡直屏的愛好者在苦等一款直屏旗艦,這次,你們等到了。據博主數碼閑聊站帶來的最新爆料稱,Redmi下代旗艦K70 Pro和iQOO 12兩款手
  • K6:面向開發人員的現代負載測試工具

    K6 是一個開源負載測試工具,可以輕松編寫、運行和分析性能測試。它建立在 Go 和 JavaScript 之上,它被設計為功能強大、可擴展且易于使用。k6 可用于測試各種應用程序,包括 Web
  • 分布式系統中的CAP理論,面試必問,你理解了嘛?

    對于剛剛接觸分布式系統的小伙伴們來說,一提起分布式系統,就感覺高大上,深不可測。而且看了很多書和視頻還是一臉懵逼。這篇文章主要使用大白話的方式,帶你理解一下分布式系統
  • 如何使用JavaScript創建一只圖像放大鏡?

    譯者 | 布加迪審校 | 重樓如果您曾經瀏覽過購物網站,可能遇到過圖像放大功能。它可以讓您放大圖像的特定區域,以便瀏覽。結合這個小小的重要功能可以大大改善您網站的用戶體驗
  • 這款新興工具平臺,讓你的電腦效率翻倍

    隨著信息技術的發展,我們獲取信息的渠道越來越多,但是處理信息的效率卻成為一個瓶頸。于是各種工具應運而生,都在爭相解決我們的工作效率問題。今天我要給大家介紹一款效率
  • 微軟邀請 Microsoft 365 商業用戶,測試視頻編輯器 Clipchamp

    8 月 1 日消息,微軟近日宣布即將面向 Microsoft 365 商業用戶,開放 Clipchamp 應用,邀請用戶通過該應用來編輯視頻。微軟于 2021 年收購 Clipchamp,隨后開始逐步整合到 Microsof
  • 2023年,我眼中的字節跳動

    此時此刻(2023年7月),字節跳動從未上市,也從未公布過任何官方的上市計劃;但是這并不妨礙它成為中國最受關注的互聯網公司之一。從2016-17年的抖音強勢崛起,到2018年的“頭騰
  • 三星獲批量產iPhone 15全系屏幕:蘋果史上最驚艷直屏

    按照慣例,蘋果將繼續在今年9月舉辦一年一度的秋季新品發布會,有傳言稱發布會將于9月12日舉行,屆時全新的iPhone 15系列將正式與大家見面,不出意外的話
  • 中關村論壇11月25日開幕,15位諾獎級大咖將發表演講

    11月18日,記者從2022中關村論壇新聞發布會上獲悉,中關村論壇將于11月25至30日在京舉行。本屆中關村論壇由科學技術部、國家發展改革委、工業和信息化部、國務
Top 主站蜘蛛池模板: 买车| 合阳县| 商都县| 化州市| 寿宁县| 镇原县| 子洲县| 东台市| 黄冈市| 沿河| 白沙| 郸城县| 张家界市| 利辛县| 巴里| 自贡市| 灵寿县| 奇台县| 沐川县| 博湖县| 仙桃市| 达拉特旗| 临武县| 亚东县| 三亚市| 盐池县| 神池县| 柘城县| 武清区| 昭通市| 汽车| 濮阳市| 盐亭县| 建始县| 江西省| 集贤县| 灯塔市| 康定县| 尚志市| 那坡县| 绵阳市|