近日,由蘇州市人工智能行業(yè)協(xié)會和鎂伽科技牽頭,超集信息、維嘉科技、凌云光、康力電梯、博眾精工、杰銳思等企業(yè)重點參與制定的團體標準T/SZAI 001—2024《"人工智能+"制造業(yè)領域應用場景分類》正式發(fā)布。
此標準是全國首部"人工智能+"制造業(yè)領域團體標準,可幫助人工智能技術供給方和制造業(yè)領域需求方快速對接,縮小供需雙方偏差,形成合力推動人工智能在制造業(yè)領域的廣泛應用,為人工智能賦能新型工業(yè)化提供了新標準、新方向和新路徑。
T/SZAI 001—2024《"人工智能+"制造業(yè)領域應用場景分類》對人工智能技術在制造業(yè)領域的應用場景進行了規(guī)范分類,以制造業(yè)特性為基礎,以產品的全生命周期管理為主線,結合企業(yè)生產經營管理實際情況,制定了"人工智能+"制造業(yè)全流程應用場景分類標準及典型場景對人工智能技術的共性功能需求,并梳理了相對應的人工智能參照技術及解決方案。
隨著國家對"人工智能+"戰(zhàn)略的深入推進,制造業(yè)的數(shù)字化轉型已成為推動產業(yè)升級、提升國際競爭力的關鍵力量。在這個轉型的浪潮中,大模型技術以其卓越的理解和生成能力,為制造業(yè)帶來了革命性的變革機遇。
在大模型之前,AI在工業(yè)的應用有"一場景一訓練一模型"的局限,而大模型的出現(xiàn),其泛化能力不僅能有效提升AI在工業(yè)的應用場景,而且有望形成"基礎模型+各類應用"的新范式。
大模型訓練和推理過程中涉及大量的矩陣運算和數(shù)據(jù)傳輸,這些都是計算密集型任務,需要強大的并行計算能力處理。隨著模型參數(shù)量的持續(xù)增加,模型的復雜度和計算需求隨之增加,這也直接導致了算力需求的指數(shù)級增長。
在需求端的持續(xù)拉動下,越來越龐大的計算集群拔地而起,這也同時帶來了不容忽視的巨大能源消耗。如何提高算力的能效比,減少能源消耗,已成為"人工智能+"發(fā)展中面臨的關鍵挑戰(zhàn)。
由超集信息研發(fā)的液冷智算中心方案,憑借其強大的能耗及散熱優(yōu)勢,為"人工智能+"的可持續(xù)發(fā)展注入了新的活力。
01 SLR液冷智算機柜
SLR液冷智算機柜作為超集信息液冷智算中心的重要構建單元,顛覆了傳統(tǒng)液冷數(shù)據(jù)中心的部署模式。憑借封閉式柜內精確制冷技術,不僅可高效率實現(xiàn)柜內±0.2℃精確控溫,保障系統(tǒng)高效穩(wěn)定運行,還大幅擺脫了室內環(huán)境溫度依賴,無需增設列間空調等設備,極大降低了系統(tǒng)整體能耗及建設投入成本。
能耗優(yōu)勢
多重部署模式
SLR液冷智算機柜憑借柜內構建的正負壓差高效散熱系統(tǒng),不僅可實現(xiàn)全液冷模式下非核心部件(主板、內存、硬盤、網卡等)的高效散熱,更可支持多種配置方案,實現(xiàn)風液混裝,最大限度規(guī)避數(shù)據(jù)中心風液改造中原始風冷節(jié)點資源的浪費。
并且,SLR液冷智算機柜方案同步支持集中式CDU部署模式和分布式CDU部署模式,可適配多場景不同規(guī)模客戶的液冷數(shù)據(jù)中心的建設需求。
高密度部署
通過封閉式單柜獨立散熱系統(tǒng)設計,SLR液冷智算機柜方案實現(xiàn)了更高的部署密度,全液冷部署單柜最高功耗支持達35kW,全風冷部署單柜最高功耗支持達8kW,風液混合部署單柜最高功耗支持達45kW。
在常見的四機柜空間部署情況下,SLR液冷智算機柜方案相較傳統(tǒng)方案最高可提升約43%有效利用空間,算力密度大幅提升。
02 SLM液冷智算管理平臺
SLM液冷智算管理平臺是超集信息液冷智算中心的核心組件,實現(xiàn)了節(jié)點及設備級的環(huán)境運行監(jiān)控、遠程管理和控制、故障警告、能耗分析等智能運維和分析功能。通過實時監(jiān)控、深入分析、精確管理和智能控制,能夠提升設備運行效率,使數(shù)據(jù)中心的全面運行狀態(tài)得到優(yōu)化。
設備精準控制
SLM平臺能夠全面覆蓋CDU(冷卻分配單元)、PDU(電源分配單元)、機柜環(huán)境、SLC智能水源冷卻模塊、服務器設備以及一次側系統(tǒng)的實時運行數(shù)據(jù),確保數(shù)據(jù)中心的全方位監(jiān)控。
利用"運行監(jiān)測"模塊所收集的詳盡信息,SLM平臺能夠對關鍵設備執(zhí)行細致的參數(shù)優(yōu)化。目前,我們已經實現(xiàn)了對CDU、SLC智能水源冷卻模塊和一次側系統(tǒng)的精確調優(yōu)功能,進一步提升了數(shù)據(jù)中心的能效和穩(wěn)定性。
數(shù)據(jù)智能分析
SLM平臺基于能耗變化、設備運行狀況、報警日志、設備控制活動以及用戶操作行為等多維度數(shù)據(jù),能夠智能分析并按年、月或周自動編制詳盡的報表,為管理人員提供決策支持。
通過這種自動化的報表生成機制,管理人員可以輕松獲取數(shù)據(jù)中心的運行概覽,包括能耗分析、故障預測、性能評估和操作審計等關鍵信息。這些定制化的報表不僅提高了運維工作的透明度,還增強了對數(shù)據(jù)中心整體健康狀況的洞察力,從而幫助管理人員做出更加明智的決策,優(yōu)化資源分配,并提前防范潛在的運行風險。
用戶權限管理
為了適應數(shù)據(jù)中心多用戶和運維人員的環(huán)境,提高系統(tǒng)安全性和管理效率,我們?yōu)镾LM平臺加入了用戶權限管理模塊。該模塊允許管理員在用戶列表界面實現(xiàn)對所有用戶賬戶的集中化和分層管理,具體功能包括:
1、賬戶創(chuàng)建與管理:管理員可以快速添加新用戶賬戶,對現(xiàn)有賬戶進行啟用或禁用操作,確保賬戶的合規(guī)性和安全性。
2、權限分配與控制:通過細致的權限設置,管理員能夠根據(jù)用戶的角色和職責,授予不同的系統(tǒng)訪問權限和操作權限,從而實現(xiàn)數(shù)據(jù)中心系統(tǒng)的權限分級管理。
3、資源授權:管理員可以對用戶進行資源授權,確保用戶只能訪問授權范圍內的資源,避免未授權訪問帶來的安全風險。
4、操作審計:系統(tǒng)提供操作日志記錄功能,幫助管理員追蹤和審計用戶行為,及時發(fā)現(xiàn)和糾正不當操作,增強系統(tǒng)的可追溯性。
用戶權限管理模塊不僅提升了數(shù)據(jù)中心的運維效率,而且加強了系統(tǒng)的安全性和合規(guī)性,為數(shù)據(jù)中心的穩(wěn)定運行和長期發(fā)展提供了堅實的基礎。
當前,蘇州正以加快建設具有國際影響力的"人工智能+"創(chuàng)新發(fā)展試驗區(qū)為總體目標,積極構建"1+15"人工智能行業(yè)應用推進體系。未來,超集信息將與蘇州市人工智能行業(yè)協(xié)會及廣大生態(tài)合作伙伴一起,加快構建綜合配套的人工智能標準體系和應用推廣體系,助力人工智能及大模型加速賦能千行百業(yè)智能化轉型,促進行業(yè)規(guī)范發(fā)展。