在我們的日常生活中,搜索引擎的作用可謂舉足輕重。截止至2021年6月,我國搜索引擎用戶規模達7.95億,較2020年12月增長2567萬,占網民整體的78.7%。
搜索引擎依托于多種技術,如網絡爬蟲技術、檢索排序技術、網頁處理技術、大數據處理技術、自然語言處理技術等,為信息檢索用戶提供快速、高相關性的信息服務。
隨著近兩年人工智能技術的爆發式進步,算法、算力和數據之間的良性循環,對產業升級和經濟變革的影響越來越突出。AI的加入,使得搜索技術邁向了一個新的臺階,幫助用戶更方便的獲取信息。
對于搜索引擎來說,最重要的是兩件事:
第一是智能程度,指的是理解用戶意圖和文檔,然后快速找出答案,這是智能部分。
第二是自然程度(Naturalness),指的是根據用戶輸入的搜索請求,把搜索結果很自然地展現給用戶,整體表現就是搜索非常流暢。
自然語言從搜索引擎出現開始一直到今天為止,都對搜索引擎的智能和自然這兩個方面起到了極為重要的作用。
微軟公司為進一步提升旗下Bing搜索引擎的智能程度和自然程度,以為用戶呈現更優質、切合的內容推薦,準備對其NLP的多項核心技術進行升級,包括機器翻譯、問答、信息檢索、信息抽取、對話、知識工程,還有自然語言生成、推薦系統等。
而由于NLP技術對標注數據依賴性較高,獲取大規模的高質量標注數據永遠是個難題。微軟為解決這一問題,嘗試采用半監督或無監督的方法,包括零樣本學習或小樣本學習,但雖然未標注數據容易獲取,并且數據量很大,但這同時也對其現有算力提出了挑戰。并且,為實現更實時高效的技術調優,可在實驗室中直接放置的高算力工作站解決方案是其當下的首選。
為支持客戶NLP優化中無監督預訓練的算力需求,超集信息為其提供了基于AMD EPYC™ 7003系列處理器平臺的7卡全液冷高性能靜音工作站解決方案——ServMAX® TL73-H3。
TL73-H3采用封閉式設計,基于單路AMD EPYC™ 7003/7002系列處理器,采用CPU和GPU全液冷散熱,搭載7張液冷GPU,560GB超大顯存,TF32整體性能高達980TFLOPS,整機滿負荷運行噪聲低于53dB。這不僅為客戶提供了強勁的算力支持,極低的噪音值更完美匹配了客戶對于算力設備實驗室環境下直接放置的要求。
并且,超集信息在此前液冷工作站設計基礎上,對TL73-H3的整體結構和空間進行了相應升級,不僅實現了7片全液冷GPU的搭載,設備整體穩定性以及維護便捷度都得到了大幅提升,整機可在30℃環溫下穩定運行,為客戶帶來極佳使用體驗。
7片Ampere GPU搭載
超集信息憑借豐富的液冷經驗,基于此前的專利金屬焊接冷板進一步研發,成功推出了20mm的單寬GPU冷板,這也是TL73-H3能夠實現多片GPU搭載的關鍵所在。當然,全新冷板絕不僅實現了單寬的改造,其還具備以下關鍵優勢:
采用6063T5鋁材,具備高導熱性
一體化焊接工藝,無橡膠圈密封,具備高氣密性,杜絕漏液風險
內部流道采用鋸齒工藝,最大程度增加接觸面積,提高熱量傳遞效率
在全新冷板的幫助下,TL73-H3實現了單顆280W AMD EPYC™ 7003/7002 CPU+7片NVIDIA Ampere GPU的支持,徹底顛覆了常規風冷工作站的GPU數量限制,突破了傳統工作站的計算力桎梏,創下多項極限記錄。
杜絕性能瓶頸
以搭載1*AMD 75F3 CPU+7*NVIDIA A6000 GPU的配置為例,在TensorFlow、PyTorch、MxNet框架下的測試,GPU 性能隨著數量基本呈線性增長,TL73-H3性能表現優異。此外,我們進行了跨平臺的對比測試。TL73-H3(1*75F3 + NVIDIA GPU)對比TL40-X3(2*8368Q+NVIDIA GPU),在1GPU與4GPU的情況下,兩者的GPU性能表現幾乎沒有差 異;TL73-H3(1*75F3 + NVIDIA GPU)對比G428-X3(2*8358+NVIDIA GPU),在1GPU、4GPU、7GPU的情況下, 兩者的GPU性能表現幾乎沒有差異。由此可見,部分客戶擔憂的單路CPU設計并不會成為限制7片GPU性能發揮的瓶頸。
通過超集信息帶的算力升級方案,微軟不僅成功實現了NLP多項核心技術的升級,完成了Bing搜索引擎的進一步優化, 全新液冷工作站解決方案的極低噪音更帶來了極佳的使用體驗,實現了實驗室環境下的高效辦公。