隨著人工智能技術從深度學習到最新多模態(tài)大模型的突破,自動駕駛也正式進入以 BEV( Bird’s Eye-View )和 Transformer 為核心的新一代技術框架,感知能力和泛化能力迎來飛躍式的提升。
Nullmax 致力于打造了一套先進的平臺化 BEV-AI 自動駕駛整體技術架構(gòu),涵蓋車端感知、預測、規(guī)劃及云端數(shù)據(jù)系統(tǒng),助力滿足不同客戶需求,快速開發(fā)出性能拔尖、易于部署、持續(xù)升級的一體化量產(chǎn)方案。
BEV+Transformer 的重感知輕地圖自動駕駛解決方案已成為當下主流,開啟了自動駕駛行業(yè)新篇章。但要訓練出高質(zhì)量的BEV模型,對數(shù)據(jù)量級有十分苛刻的要求,需要進行大量的數(shù)據(jù)采集和預處理,這對于場景感知性能和效果有著至關重要的影響。
為獲取更多訓練樣本,紐勱投入了大量路測車輛,但其后端算力已難以保障爆炸式增長,路況數(shù)據(jù)的精準標注和高效預處理,后期訓練時模型精度受到影響。
結(jié)合客戶實際需求,超集信息為其提供了基于 AMD Genoa 平臺的 ServMAX® G448-H4 計算解決方案,完成了預處理及訓練集群擴展。單機雙路下 AMD Genoa 平臺可達192核心,384線程,客戶并行處理能力迎來大幅提升;同時憑借Zen4核心,整體性能迎來大幅提升,IPC 提高了14%,并且L2大小又增加了2倍,顯著提高了頻率和平均延遲,數(shù)據(jù)處理效率獲得大幅提升。
憑借高密度設計,G448-H4 單機 4U 空間內(nèi)可實現(xiàn)8張全尺寸 GPU 搭載,單機混合算力高達 5280 TFLOPs,可輕松應對模型訓練場景下的各類并行計算工作負載,大幅加速了客戶BEV模型的整體訓練進程。
為幫助客戶最大化提高資源使用效率,超集信息為集群部署了 PlatforMax 智算融合平臺,能夠在圖形化界面下直觀了解并動態(tài)調(diào)整 CPU、GPU、Memory 資源,保證任務最優(yōu)分布。并且,PlatforMax 針對不同的優(yōu)先級需求,能夠從高到低進行任務調(diào)度,同時支持隊列中任務的優(yōu)先級調(diào)整和插隊,滿足緊急任務的使用需求,模型整體訓練效率得以提升。
經(jīng)過超集信息對整體計算解決方案的測試和調(diào)優(yōu),紐勱科技的預處理訓練集群實現(xiàn)了高效擴展,數(shù)據(jù)標注和預處理效率實現(xiàn)了 18% 提升,模型訓練效率實現(xiàn)了 20% 以上提升,進一步加速了其BEV模型在部署優(yōu)化、超長距離感知、適配任意傳感器配置等方向的優(yōu)化進度。