理想汽車CEO李想解讀VLA司機大模型 回應特斯拉FSD入華

2025-05-07 22:05:40 作者:吳啟星

  【太平洋汽車 行業頻道】5月7日晚,理想汽車推出“理想AI Talk第二季——理想VLA司機大模型,從動物進化到人類”,理想汽車創始人、CEO李想和大家分享了對于人工智能的最新思考,VLA司機大模型的作用、訓練方法和挑戰,以及對于創業和個人成長的見解。

  對于當前非常熱門的AI工具,李想將其分為三個層級,分別是信息工具、輔助工具和生產工具。李想表示目前大多數人將AI作為信息工具使用,但信息工具常伴隨大量無效信息、無效結果和無效結論,僅具參考價值。成為輔助工具后,AI可以提升效率,例如現在的輔助駕駛,但仍需人類參與。未來,AI發展為生產工具后,將能獨立完成專業任務,顯著提升效率與質量。

  李想還提到:“判斷Agent(智能體)是否真正智能,關鍵在于它是否成為生產工具。只有當人工智能變成生產工具,才是其真正爆發的時刻。就像人類會雇傭司機,人工智能技術最終也會承擔類似職責,成為真正的生產工具。”

  此外,面對AI的發展,李想認為,在AI面前所有的人性都應被保留,無論好壞,因為一切人性都是文化、生命、性格、能力的特質,也是人類真正的生命力所在。

  對于目前討論很多的智能輔助駕駛,李想直言如今的L2、L2+組合駕駛輔助仍屬于輔助工具階段,而VLA(Vision-Language-Action Model,視覺語言行動模型)能夠讓AI真正成為司機,成為交通領域的專業生產工具。對理想汽車而言, 未來的VLA就是一個像人類司機一樣工作的司機大模型”。

  李想表示:VLA的實現不是一個突變的過程,是進化的過程,經歷了三個階段。第一階段,理想汽車自2021年起自研依賴規則算法和高精地圖的輔助駕駛,類似“昆蟲動物智能”。第二階段,理想汽車自2023年起研究,并于2024年正式推送的端到端+VLM(Vision Language Model,視覺語言模型)輔助駕駛,接近“哺乳動物智能”。

  在端到端的基礎上,到第三階段,VLA將開啟“人類智能”的階段。它能通過3D和2D視覺的組合,完整地看到物理世界,而不像VLM僅能解析2D圖像。同時,VLA擁有完整的腦系統,具備語言、CoT(Chain of Thought,思維鏈)推理能力,既能看,也能理解并真正執行行動,符合人類的運作方式。

  VLA的訓練分為預訓練、后訓練和強化訓練三個環節,類似于人類學習駕駛技能的過程。預訓練相當于人類學習物理世界和交通領域的常識,通過大量高清2D和3D Vision(視覺)數據、交通相關的Language(語言)語料,以及與物理世界相關的VL(Vision-Language,視覺和語言)聯合數據,訓練出云端的VL基座模型,并通過蒸餾轉化為在車端高效運行的端側模型。

  后訓練相當于人類去駕校學習開車的過程。隨著Action(動作)數據的加入——即對周圍環境和自車駕駛行為的編碼,VL基座變為VLA司機大模型。得益于短鏈條的CoT,以及Diffusion擴散模型對于他車軌跡和環境的預測,VLA具備實時性的特點,實現了在復雜交通環境中的博弈能力。

  強化訓練類似于人類在社會中實際開車練習,目標是讓VLA司機大模型更加安全、舒適,對齊人類價值觀,甚至超越人類駕駛水平。強化訓練包含兩部分:一是通過RLHF(Reinforcement Learning from Human Feedback,基于人類反饋的強化學習)完成安全對齊,使模型遵守交通規則,貼合中國用戶的駕駛習慣;二是將純強化學習模型放入世界模型中訓練,提升舒適性,避免碰撞事故,遵守交通規則。經過預訓練、后訓練和強化訓練后,VLA司機大模型即可部署至車端運行。

  VLA司機大模型以“司機Agent(智能體)”的產品形態呈現,用戶可通過自然語言與司機Agent溝通,跟人類司機怎么說,就跟司機Agent怎么說。簡單通用的短指令由端側的VLA直接處理,復雜指令則先由云端的VL基座模型解析,再交由VLA處理。

  李想表示:模型能力越強,越需要職業性約束,以確保能力下限。為了保障VLA司機大模型能夠實現職業司機般的安全和舒適,避免學習加塞等違規行為,理想汽車在強化訓練環節投入大量資源,并于2024年底組建超過100人的超級對齊團隊,相當于為司機Agent注入職業素養。

  為解決模型的黑盒問題,理想汽車結合重建和生成兩種路徑,打造了真實、符合物理世界規律的世界模型,覆蓋所有交通參與者和要素。基于世界模型的仿真能力,VLA可以在世界模型中低成本、準確地驗證現實問題,提升解決問題的效率,有效應對模型黑盒帶來的挑戰。

  判斷司機Agent是否是個好司機,有三個關鍵標準:專業能力、職業能力和構建信任的能力。VLA司機大模型提升了專業能力,超級對齊增強了職業能力,VLA通過理解自然語言、具備記憶能力提升了構建信任的能力。

  不過理想透露,在在輔助駕駛方面,由于英偉達Orin-X芯片無法直接運行語言模型,端到端+VLM的輔助駕駛方案對部分企業來說仍具挑戰。而理想汽車依托自有編譯團隊,自研底層推理引擎,使芯片可通過INT4(4比特整型)量化的方式運行VLM。同時,憑借芯片、控制器設計和自研汽車操作系統等綜合能力,理想汽車實現了讓雙Orin-X芯片和Thor-U芯片運行同等規模的VLA司機大模型。李想表示,大型企業的基本功和能力永遠無法被逾越。

  對于特斯拉FSD進入了中國,李想也發表了自己的看法,我們認為,我們自己一個判斷的話,從實測過來的話,他們大概在用12.5之前的模型,這個模型并不是特斯拉真實能力,距離特斯拉真實能力還有巨大的差距。盡管還不是最強的版本,李想也夸贊了FSD,認為其基本功是非常扎實的,它的整個的感知的距離、運行的幀率、車輛的整個的控制的穩定性。

  此外,李想還提到:得益于DeepSeek的開源,理想汽車在VLA司機大模型的語言能力研發上提速顯著,節省了近9個月的時間和數億成本。并想表示:“我們可以站在巨人的肩膀上,但它只是其中的一部分。”。

  今年7月,理想汽車將迎來成立十周年。李想表示,創業路上苦多于甜,他選擇保留那些有價值的美好片段,用來激勵自己保持正能量。他將企業遭遇的打擊視為必須面對的挑戰,也正是這些挑戰,賦予了理想汽車更多的能力。

  回顧幾次創業經歷,李想表示,從高中創辦個人網站至今,自己的思維方式沒有什么變化:遇到問題解決問題,解決別人不愿解決的難題,解決用戶的痛點,不斷向他人學習。不同的是,如今面臨的問題更復雜、服務的用戶群體更多、公司規模和組織也更龐大。“幾次創業一路走來,最難時有人相助,遇坑也能迅速爬出,一幫人齊心協力變得更好,這是種幸運,也沒什么可后悔的。”(文:太平洋汽車 吳啟

>>點擊查看今日優惠<<

    本文導航
    熱門文章
    相關閱讀
    點擊加載更多
    主站蜘蛛池模板: 男女真实无遮挡xx00动态图120秒| 69福利视频一区二区| 欧乱色国产精品兔费视频| 农民工嫖妓50岁老熟女| 99精品众筹模特私拍在线| 大尺度无遮挡h彩漫| 久久99精品久久久久久hb无码| 欧美又粗又大又硬又长又爽视频| 公洗澡时强要了| 高清性色生活片a| 国产香蕉97碰碰久久人人| 三个黑人上我一个经过| 日韩精品亚洲人成在线观看| 亚洲欧美精品中文字幕| 精品精品国产自在97香蕉| 国产女人喷潮视频在线观看| 69精品免费视频| 天美传媒一区二区三区| 丰满妇女强制高潮18XXXX| 最近的中文字幕国语电影直播 | www.怡红院| 日本h片无遮挡在线观看| 亚洲人成无码网站久久99热国产| 狠狠色狠狠色综合网| 口工全彩无遮挡3d漫画在线| 高h视频在线观看| 国产精品亚洲а∨无码播放不卡| 99视频在线观看免费| 性XXXXBBBBXXXXX国产| 久久久99精品免费观看| 最近免费中文字幕大全 | 亚洲区小说区图片区qvod| 热久久最新视频| 午夜成人精品福利网站在线观看| 香蕉97超级碰碰碰碰碰久| 国产精品亲子乱子伦xxxx裸| 99热在线观看| 少妇人妻在线视频| 中文字幕精品一区二区精品 | 国产亚洲色婷婷久久99精品| 亚洲五月六月丁香激情|