|
近日,微軟與瑞士新創(chuàng)公司Corintis聯(lián)合宣布,成功研發(fā)出名為“微流體”(Microfluidics)的革命性芯片冷卻技術(shù)。該技術(shù)通過在GPU硅片背面蝕刻出微米級流體通道,使冷卻液直接接觸芯片核心發(fā)熱區(qū)域,實驗室測試數(shù)據(jù)顯示其可將GPU最高溫升降低65%,冷卻效率較傳統(tǒng)方案提升約3倍。這一突破有望徹底改變數(shù)據(jù)中心散熱模式,為AI算力爆發(fā)提供關(guān)鍵支撐。 仿生葉脈設(shè)計:冷卻液精準(zhǔn)直擊“熱點(diǎn)” 微流體技術(shù)的核心在于將冷卻系統(tǒng)嵌入芯片內(nèi)部。微軟研發(fā)團(tuán)隊在硅片背面蝕刻出寬度僅相當(dāng)于人類頭發(fā)絲的微小溝槽,形成類似葉脈的分支結(jié)構(gòu)。冷卻液通過這些通道直接流經(jīng)GPU的晶體管陣列,避免了傳統(tǒng)冷板技術(shù)中多層材料隔離導(dǎo)致的熱阻問題。 “傳統(tǒng)冷板與芯片之間隔著數(shù)層導(dǎo)熱材料,就像給發(fā)熱的爐子裹了三層棉被。”微軟云運(yùn)營與創(chuàng)新部首席技術(shù)官朱迪·普里斯特比喻道,“而微流體技術(shù)讓冷卻液直接觸摸熱源,熱傳導(dǎo)路徑縮短90%以上。” 為優(yōu)化流體路徑,微軟聯(lián)合Corintis引入AI算法,模擬自然界葉脈生長規(guī)律設(shè)計通道走向。實驗數(shù)據(jù)顯示,這種仿生結(jié)構(gòu)使冷卻液流動效率提升40%,在處理高負(fù)載AI任務(wù)時,GPU表面溫度較傳統(tǒng)方案降低15-20℃。 四輪迭代攻克工程難題:強(qiáng)度與流道的平衡術(shù) 將液體引入芯片內(nèi)部面臨兩大挑戰(zhàn):硅基材料的承壓能力與微通道的防堵設(shè)計。微軟團(tuán)隊歷時一年完成四輪技術(shù)迭代,最終確定“淺槽寬距”方案——通道深度控制在50微米以內(nèi),既保證冷卻液循環(huán)順暢,又避免過度蝕刻導(dǎo)致硅片破裂。 “我們曾在第三輪迭代中嘗試加深通道以提升流量,結(jié)果導(dǎo)致20%的測試芯片出現(xiàn)裂紋。”項目負(fù)責(zé)人透露,“最終通過調(diào)整蝕刻工藝參數(shù),在通道深度與芯片強(qiáng)度間找到臨界平衡點(diǎn)。” 為解決長期運(yùn)行中的防漏液問題,研發(fā)團(tuán)隊采用氮化鎵(GaN)基板與銅密封技術(shù),使芯片在承受10MPa液體壓力時仍保持結(jié)構(gòu)穩(wěn)定。該方案已通過軍用級可靠性測試,可滿足數(shù)據(jù)中心7×24小時連續(xù)運(yùn)行需求。 實驗室到數(shù)據(jù)中心的跨越:Teams會議實測驗證 微軟在Azure數(shù)據(jù)中心部署了搭載微流體技術(shù)的測試服務(wù)器,模擬1000人同時參與的Teams會議場景。結(jié)果顯示,系統(tǒng)在高密度計算負(fù)載下持續(xù)穩(wěn)定運(yùn)行,無任何過熱降頻現(xiàn)象,液體循環(huán)系統(tǒng)功耗僅占總功耗的3%,較傳統(tǒng)液冷方案降低60%。 “當(dāng)傳統(tǒng)風(fēng)冷系統(tǒng)因過熱頻繁觸發(fā)保護(hù)機(jī)制時,微流體技術(shù)讓GPU始終保持峰值性能。”參與測試的工程師表示,“在模擬GPT-6級大模型訓(xùn)練場景中,芯片壽命預(yù)測值從3年延長至5年以上。” 行業(yè)分析師指出,隨著NVIDIA GB200/GB300 NVL72系統(tǒng)單柜功耗突破130kW,傳統(tǒng)氣冷技術(shù)已觸及物理極限。微軟微流體技術(shù)的出現(xiàn),為數(shù)據(jù)中心高密度部署開辟了新路徑——相同空間內(nèi)可部署3倍數(shù)量的AI服務(wù)器,PUE(能源使用效率)值有望降至1.1以下。 |