2024年12月25日-27日,理想汽車連續(xù)三天推出“2024理想 AI Talk”,分享了對人工智能的最新思考,以及包含智能駕駛和理想同學(xué)在內(nèi)的人工智能技術(shù)的最新進展,并宣布基于自研基座大模型Mind GPT的理想同學(xué)從車機進入手機,App已于12月27日全量上線。此外,理想汽車宣布OTA 7.0版本車機系統(tǒng)將于12月底全量推送AD Max用戶,新增AI推理可視化、高速端到端等功能,并實現(xiàn)Mind GPT-3o、Mind Diffusion V2.0的能力升級。
理想同學(xué)和智能駕駛是理想汽車的兩大核心AI產(chǎn)品。理想汽車董事長兼CEO李想表示:“我們在做的理想同學(xué)和自動駕駛,通常被視作獨立的領(lǐng)域。我們的大語言模型Mind GPT是認知智能,連接數(shù)字世界;而自動駕駛被稱為空間智能,關(guān)乎物理世界。我們同時在這兩個領(lǐng)域探索,并堅信認知智能與空間智能的結(jié)合——我們稱之為VLA(Vision Language Action Model,視覺語言行動模型)——是一個更值得相信和追求的機遇?!?/p>
李想表示,理想汽車的愿景已升級為“連接物理世界和數(shù)字世界,成為全球領(lǐng)先的人工智能企業(yè)”,汽車是連接這兩個世界的最佳橋梁。
“從企業(yè)角度來看,理想汽車是一家人工智能企業(yè),我們要做的不是汽車的智能化,而是人工智能的汽車化,并將推動人工智能普惠到每一個家庭。從行業(yè)視角來看,汽車將從工業(yè)時代的交通工具,進化成為人工智能時代的空間機器人。在對整個世界的理解上,我們通過人工智能將物理世界與數(shù)字世界進行融合,讓有限的空間實現(xiàn)無限的延伸?!崩钕氡硎?。
理想同學(xué)App,隨時隨地陪伴你的智能助手
理想同學(xué)App是一款人工智能應(yīng)用,目前具備兩大功能:“知識問答”提供多領(lǐng)域的問答能力,包括汽車、出行、財經(jīng)、科技等領(lǐng)域,并能處理多種文本任務(wù),如撰寫文章、翻譯和創(chuàng)作文案等;“看世界”依靠視覺感知能力,幫助用戶識別菜單、畫作、動植物、汽車等上千種通用物品。
從車機進入手機,理想同學(xué)從智艙智能助理轉(zhuǎn)變?yōu)橥ㄓ弥悄苤帧挠脩粜枨蟮慕嵌瘸霭l(fā),這是一件順理成章的事情。很多理想汽車用戶的孩子首次接觸的人工智能產(chǎn)品就是理想同學(xué),它通過對話幫助孩子們解決各種問題,比如畫畫或?qū)懽鳂I(yè)等。理想汽車希望讓100多萬的車主及其家庭成員,不僅在汽車,還可以在手機、電腦,甚至眼鏡等穿戴設(shè)備上,體驗到一致的人工智能產(chǎn)品。其次,從長遠角度來看,理想汽車認為,在掌握基座模型的前提下,真正的大模型產(chǎn)品會覆蓋所有的設(shè)備,能讓用戶自主使用所有的服務(wù)。
目前,大模型技術(shù)尚處于發(fā)展早期,很多團隊仍停留在聊天機器人的初始階段,所有參與者都有探索未知邊界的機會。理想汽車憑借100多萬的家庭基礎(chǔ)和在自動駕駛領(lǐng)域的技術(shù)積累,能夠在追隨優(yōu)秀競爭對手的同時,實現(xiàn)更有效的投入。
L3有監(jiān)督智能駕駛,不是L2輔助駕駛的延續(xù),而是L4自動駕駛的先導(dǎo)
在自動駕駛的不同階段,L3為有監(jiān)督智能駕駛,不是L2輔助駕駛的延續(xù),而是L4高度自動駕駛的先導(dǎo)程序。
輔助駕駛只實現(xiàn)了特定功能,自動駕駛則關(guān)乎整體能力。傳統(tǒng)的L2輔助駕駛依賴上一代自動駕駛方案,通過預(yù)設(shè)條件來執(zhí)行不同場景下的智駕功能,無法窮盡所有的corner case(極端情況)。理想汽車借鑒人類駕駛技能提升的過程,用人工智能的方式做自動駕駛,推出了端到端+VLM的雙系統(tǒng)解決方案,利用Scaling Law(規(guī)模效應(yīng))不斷迭代和提升自駕能力,以適應(yīng)所有可能的駕駛環(huán)境。
自7月底推出端到端智能駕駛的內(nèi)測版以來,理想汽車以每周更新兩個模型版本的頻率,致力于在今年將綜合MPI(城市+高速平均接管里程)提升至100公里。展望未來兩年,還將逐步提升MPI至500公里甚至1000公里以上。為了達到MPI 500公里的目標(biāo),預(yù)估需要2000萬Clips(視頻片段),意味著積累50億公里甚至超百億公里的數(shù)據(jù)量。
隨著端到端+VLM雙系統(tǒng)的不斷迭代,理想汽車希望在2025年實現(xiàn)L3有監(jiān)督智能駕駛,并為用戶提供一個全場景、一體化端到端的產(chǎn)品。理想汽車認為,達到L3的前提是實現(xiàn)“車位到車位”的智能駕駛,這將自動駕駛服務(wù)從干道提前到小區(qū)車位,解決最先100米和最后100米的挑戰(zhàn)。11月底,理想汽車已全球首家全量推送“車位到車位”功能,有效應(yīng)對了小區(qū)道路、環(huán)島、掉頭和復(fù)雜施工的場景。
此外,理想汽車將在12月底通過OTA 7.0版本車機系統(tǒng)向所有AD Max用戶全面推送“高速端到端”和行業(yè)首創(chuàng)的“AI推理可視化”功能。其中,“高速端到端”將實現(xiàn)高速特殊場景NOA不降級、不斷點、更連續(xù),使理想汽車成為國內(nèi)唯一一家、全球第二家將端到端技術(shù)應(yīng)用到高速(及環(huán)路)NOA場景的車企?!癆I推理可視化”通過展示10種可能的策略軌跡并實時選出最佳方案,同時以熱力圖形式直觀展現(xiàn)端到端系統(tǒng)在不同區(qū)域的關(guān)注度,將幫助駕駛員更直觀地理解AI的決策邏輯。
安全,是體驗的基石。雖然理想汽車在國內(nèi)率先取消了角毫米波雷達,轉(zhuǎn)而采用以純視覺為主的技術(shù)路線,但仍然保留了激光雷達,并將其視作“安全帶”,與視覺技術(shù)配合,以期達到消除所有重大傷亡事故的目標(biāo)。通過持續(xù)的OTA升級,理想汽車為用戶提供了行業(yè)領(lǐng)先的安全能力,包括全自動緊急轉(zhuǎn)向AES(自動緊急轉(zhuǎn)向)、全速域無上限激活A(yù)EB(自動緊急制動)、及城市路口多方向人車混行場景AEB等。至今,安全技術(shù)已成功預(yù)防超415萬起潛在事故,超1000起烈性事故,一定程度上保障了駕駛安全。在OTA 7.0更新中,理想汽車還將向AD Max用戶升級應(yīng)對大霧天氣的高速智駕策略,實現(xiàn)業(yè)內(nèi)場景覆蓋最全ELK(緊急車道保持輔助)。
得益于今年理想汽車在智駕領(lǐng)域的快速進步,截至12月中旬,AD Max銷量占比已從2月份的約20%增長至50%以上,30萬以上車型AD Max銷量占比已超75%。
在技術(shù)、產(chǎn)品、環(huán)境政策,以及消費者對人工智能信任度到位的前提下,理想汽車有望在三年后推出首款為L4級自動駕駛定義的汽車。在此之前,企業(yè)也必須滿足3個條件:500萬輛以上規(guī)模的車隊、掌握VLA基礎(chǔ)模型的能力、有足夠多的錢去招募最頂級的人才以及足夠的算力。
應(yīng)用AI技術(shù),推動快速成長
目前,理想汽車超100億的年研發(fā)投入已有接近一半聚焦于人工智能,并建立了四支AI團隊,分別解決不同問題。
在智能駕駛領(lǐng)域,憑借充足的訓(xùn)練里程和先進的訓(xùn)練算法,加之利用世界模型創(chuàng)建的模擬環(huán)境,理想汽車推出了行業(yè)首創(chuàng)的端到端+VLM雙系統(tǒng)方案。該方案自7月底啟動早鳥計劃以來,以每周兩次的頻率迭代更新,在10月底正式全量推送,11月底新增“車位到車位”功能,并將在12月底推出“高速端到端”功能。隨著數(shù)據(jù)規(guī)模的擴大和數(shù)據(jù)質(zhì)量的提升,理想汽車已經(jīng)成功驗證了Scaling Law在提高自動駕駛性能方面的作用。截至12月25日,理想汽車智駕總里程已達29億公里,訓(xùn)練算力提升至8.1EFLOPS。
在理想同學(xué)方面,其搭載了自研的行業(yè)首個車載認知大模型Mind GPT。截至目前,該模型已積累10萬億Token的預(yù)訓(xùn)練數(shù)據(jù),覆蓋自動駕駛、對話等場景中特有的多模態(tài)數(shù)據(jù)。自2023年12月發(fā)布以來,Mind GPT已迭代30多次,將伴隨OTA 7.0進入到第三階段,即Mind GPT-3o,進一步發(fā)展任務(wù)助手、認知成長和情感陪伴能力。與前兩代側(cè)重語言模型不同,Mind GPT-3o將通過構(gòu)建融合感知和認知的多模態(tài)端到端大模型能力,大幅降低人機交互延遲。
在智能商業(yè)方面,理想汽車通過大模型技術(shù)與商業(yè)領(lǐng)域數(shù)據(jù)和知識的深度結(jié)合,構(gòu)建了一批具備零售、營銷、客服、金融、財經(jīng)分析等能力的AI助手。例如,在零售領(lǐng)域,AI通過學(xué) 頂尖零售專家的溝通技巧,為更多零售伙伴培訓(xùn)、賦能;在客戶服務(wù)方面,AI模型掌握了豐富的車輛使用知識,通過智能的多輪對話有效解決用戶咨詢,提升服務(wù)效率、釋放呼叫中心的坐席壓力等。
在智能工業(yè)方面,理想汽車通過全棧自研的智能制造系統(tǒng)、視覺算法、設(shè)備、質(zhì)量預(yù)測模型等,依托于Li-MOS生產(chǎn)管理系統(tǒng)、連山云端質(zhì)量預(yù)警平臺、MESS系統(tǒng)等自研的智能化平臺構(gòu)建起智能制造超級大腦,橫向上實現(xiàn)從研發(fā)端到交付端的數(shù)據(jù)閉環(huán),縱向?qū)崿F(xiàn)多層供應(yīng)鏈到整車廠的數(shù)據(jù)協(xié)同,以數(shù)據(jù)驅(qū)動生產(chǎn)、快速迭代生產(chǎn)技術(shù),從而持續(xù)提高制造效率和產(chǎn)品質(zhì)量。