2018年以來,通過與人工智能、VR、5G、區(qū)塊鏈、邊緣智能等新興技術(shù)的交匯融合,大數(shù)據(jù)技術(shù)不斷變革創(chuàng)新,迎來 了快速發(fā)展。
同時,伴隨新型智慧城市和數(shù)字城市建設(shè)熱潮,各地與大數(shù)據(jù)相關(guān)的園區(qū)加速落地,大數(shù)據(jù)產(chǎn)業(yè)持續(xù)增長。根據(jù)中國 大數(shù)據(jù)管理市場專題研究及投資評估報告數(shù)據(jù)顯示,2020年中國大數(shù)據(jù)產(chǎn)業(yè)規(guī)模達(dá)6388億元,同比增長18.6%,近兩 年也保持15%以上的年均增速,到2023年產(chǎn)業(yè)規(guī)模預(yù)計將超過10000億元。
雖然當(dāng)下大數(shù)據(jù)產(chǎn)業(yè)政策體系逐步完善,產(chǎn)業(yè)基礎(chǔ)日益鞏固,產(chǎn)業(yè)鏈初步形成,生態(tài)體系持續(xù)優(yōu)化,但技術(shù)創(chuàng)新才是 推動大數(shù)據(jù)產(chǎn)業(yè)發(fā)展的最大內(nèi)在動力,而我國目前技術(shù)創(chuàng)新對于大數(shù)據(jù)產(chǎn)業(yè)的引領(lǐng)作用仍有待提升。
北京師范大學(xué)大數(shù)據(jù)項目組一直以來都從事著大數(shù)據(jù)方向的專題研究,為實現(xiàn)大數(shù)據(jù)技術(shù)的進(jìn)一步創(chuàng)新,其需導(dǎo)入更 大量數(shù)據(jù)以進(jìn)一步優(yōu)化數(shù)據(jù)模型,但目前的后端算力基礎(chǔ)設(shè)施已無法支撐進(jìn)一步擴展的數(shù)據(jù)量。
并且,由于項目組仍沿用著較早期建設(shè)的非標(biāo)準(zhǔn)化機房,機房整體空間、散熱、降噪能力均有限,關(guān)鍵芯片降頻及噪 音等問題也是設(shè)施擴展中難以避免的重點難題。
大數(shù)據(jù)分析挖掘便是從可視化分析、數(shù)據(jù)挖掘算法、預(yù)測性分析、語義引擎、數(shù)據(jù)質(zhì)量管理等方面,對雜亂無章的數(shù) 據(jù),進(jìn)行萃取、提煉和分析的過程。
其中,數(shù)據(jù)挖掘算法即通過創(chuàng)建數(shù)據(jù)挖掘模型,對數(shù)據(jù)進(jìn)行試探、計算和數(shù)據(jù)分析,從而挖掘出有用信息并產(chǎn)出分析 結(jié)論,是大數(shù)據(jù)分析的理論核心。為幫助北京師范大學(xué)大數(shù)據(jù)項目組實現(xiàn)數(shù)據(jù)挖掘算法模型的進(jìn)一步優(yōu)化,同時考慮 到非標(biāo)準(zhǔn)化機房的限制條件,超集信息為其提供了基于ServMAX® GO202-X3服務(wù)器的整柜液冷解決方案。
通過雙路3rd Gen Intel® Xeon® Scalable系列處理器及32 x DIMM DDR4支持,GO202-X3最高可達(dá)80核心及8 TB 3200MHz RDIMM/LRDIMM,可有效滿足大數(shù)據(jù)處理的workload。
同時,自Spark 3.0開始,通過Plugin的方式可以修改SparkSQL,DataFrame的后端執(zhí)行引擎,由此超集信息為客戶 提供了一套Spark-RAPIDS的Plugin,增強了Spark對GPU的使用能力,通過GO202-X3搭載的兩片Ampere架構(gòu)液冷 GPU,提供了高達(dá)560 TFLOPS的混合計算性能,構(gòu)建了CPU+GPU的高效處理流。
并且,通過風(fēng)-液換熱單元(CDU)構(gòu)建的整柜液冷解決方案,大幅降低噪音同時,其穩(wěn)定的換熱能力有效規(guī)避了服務(wù) 器內(nèi)關(guān)鍵芯片的降頻風(fēng)險,在客戶的非標(biāo)準(zhǔn)化機房內(nèi)實現(xiàn)了算力的高效擴展
1. 支持2顆Ice Lake(單顆最高270W)處理器和2張Ampere GPU,同時提供4張PCIe擴展卡+OCP網(wǎng)卡,支持8T內(nèi)存
2. 環(huán)溫25 ℃,常溫運行噪音不超過59dB,遠(yuǎn)低于傳統(tǒng)風(fēng)冷服務(wù)器,可實現(xiàn)靜音液冷數(shù)據(jù)快速構(gòu)建
3. CPU和GPU皆使用自研金屬焊接密封冷板,提升氣密等級,延長冷板壽命和剛度,避免密封圈老化導(dǎo)致的漏液
4. 液冷部件之間使用業(yè)界領(lǐng)先的無滴漏連接器進(jìn)行快速連接,兼顧運行可靠性與維護(hù)便捷性
5. 管路使用耐壓性、耐熱性、耐腐蝕性更強的聚四氟乙烯定制波紋管,保證了液冷結(jié)構(gòu)的穩(wěn)定性
6. 可實現(xiàn)單機液冷模式、整柜液冷模式(2-8臺GO202-X3)及多柜液冷模式(數(shù)據(jù)中心級)間的快速切換
超集信息針對客戶實際場景需求,通過基于ServMAX® GO202-X3的整柜液冷解決方案,不僅完成了非標(biāo)準(zhǔn)化機房下的 算力高效擴展,基于Spark-RAPIDS的解決方案更加速了ETL、數(shù)據(jù)清洗等數(shù)據(jù)準(zhǔn)備工作,同時和后期的模型訓(xùn)練Job無 縫對接,形成整個從raw data到result的pipeline。