隨著生成式人工智能和大模型技術的快速發展,人們對于算力的需求呈指數級增長,提高芯片的集成密度雖然可以有效解決高算力對芯片性能和處理效率的要求,但也導致了總熱功耗增加、熱分布不均、封裝中的熱輸運困難等等問題,如何有效解決以上熱管理問題,是當前高算力時代我們亟待解決的問題。Chiplet(芯粒)技術相較傳統的系統級芯片(SoC),可以實現更大面積、更多功能、更高密度的芯片集成,被認為是后摩爾時代集成電路發展的關鍵路徑和突破口。接下來,小編將以Chiplet技術為案例,跟大家談一談可以用于芯片熱管理的方案。
圖源:百匯商場
相關閱讀:
Part.1為什么會有這些熱管理問題?
由于Chiplet技術是一種將單片SoC芯片分割成一個個單獨的Chiplet,再通過先進封裝技術將這些Chiplet組裝,最終形成多功能、高性能芯片的制造手段,因此在不同功能、不同類型Chiplet集成的過程中,會涉及到多種異質材料的使用與整合,這些材料的熱膨脹系數、熱導率等物理參數、物理特性往往會存在較大的差異,在系統運行時會導致嚴重的熱應力,產生翹曲、裂紋、分層等問題,使得系統功能衰退,甚至產生失效和破壞。目前Chiplet的封裝方式主要為2.5D/3D集成,在3D封裝時,底部芯片產生的熱量會通過微凸點層、層間金屬布線層以及上層芯片進行傳導,但由于微凸點層的等效熱導率較低,會存在熱輸運困難的情況。為了能夠更加滿足復雜場景的應用需求,往往會在Chiplet異質集成中添加不同的功能設計,而這會顯著增加功率分布不均勻的情況,例如,電壓調節器的功率較高,會在芯片中形成高功率熱點。
集成芯片散熱示意圖(圖源:文獻1)
總而言之,Chiplet的高功耗、高集成度給熱管理帶來了嚴峻的挑戰,提出一系列迫切需要研究的關鍵技術問題。
Part.2芯片熱管理解決方案
目前國內外高校、研究機構或企業針對芯片熱管理開展了包括微通道單相冷卻、微通道兩相冷卻、射流冷卻、浸沒式冷卻、新型TIM、不均勻熱分布調控等方面的研究,并取得了一些進展與突破,有望用于高算力Chiplet的熱管理。
一、熱界面材料(TIM)
在一般的電子設備中,芯片產生的熱量會經散熱器到達熱沉,想要擁有良好散熱效果的前提是熱源與散熱組件之間存在良好的接觸,但通常兩者的接觸面積只占宏觀表面積很小的一部分,剩余充斥著“熱”的不良導體——空氣。由于空氣的導熱系數極低,會嚴重阻礙熱傳遞,因此大部分的熱量主要通過有限的接觸點進行傳遞。為了能夠有效增強界面的熱交換,會選擇具有較高導熱系數的熱界面材料填補熱源與散熱器之間的空隙,以增加有效的接觸面積,實現熱量的快速傳導,達到快速散熱的目的。常見的熱界面材料主要分為聚合物和金屬兩大類。
1、聚合物TIM
聚合物TIM是目前市面上應用范圍最廣的TIM,按材料的狀態可以分為脂類、墊類、凝膠類、相變材料類。
(1)導熱硅脂
通常由高導熱填料和有一定流動性的有機硅液體通過研磨并經過真空脫泡制成,是一種呈液態、能夠有效促進傳熱的膏狀材料。由于具有一定的流動性,它可以在粗糙表面上流動并填充在細小的坑洼處,具備較優的導熱性能,但是由于導熱硅脂泵出效應明顯,長期使用會使導熱硅脂的溶劑揮發,導致導熱硅脂變干,降低了其可靠性。
(2)導熱墊片
一般是以高分子聚合物為基體,在其中加入高導熱顆粒后,經加熱固化處理,形成兼有柔性和彈性特點的一類片狀材料。導熱墊片通常具有粘性,與其他固體接觸時不需要額外的表面粘合劑。由于具有較好的電絕緣性能,在電子元件微型化的趨勢中,可以最大化發揮密封和絕緣的功能。但導熱墊片在使用過程中會受厚度、形狀的限制,當設備運行溫度上升時,導熱墊片可能會變軟,發生蠕變或應力松弛,從而影響其機械強度,電子設備的各種性能也會出現下降的趨勢。
(3)導熱凝膠
又稱導熱泥、導熱硅凝膠,是一種由有機硅粘結形成的密封膠。在未使用時為液態,封裝之后經加熱固化變為固態,在一定程度上消除了泵出效應,粘接層厚度大約在0.05-0.25mm之間。導熱凝膠相較導熱墊片更為柔軟,可壓縮至非常薄的厚度,特別適合空間受限的器件的熱傳導。相較導熱硅脂更易操作,它還可以形成任意需要的形狀,對于不規則器件均能保證良好的接觸,不存在出油和變干的問題,在可靠性上具有一定的優勢。但由于器件的熱膨脹系數存在差異,當其長期工作在冷熱交替環境中時,由于存在應力,可能會出現分層現象,從而影響散熱性能。
(4)導熱相變材料
按相變類型的不同,導熱相變材料可分為固-固和固-液相變材料。固-固相變材料發生相變時無液體產生且體積變化較小,因而不易發生相分離;而固-液相變材料的品種繁多,相變潛熱值大,發生相變時會產生殘余熱應力,易發生填料與基體的相間分離,因此應用時需克服相變產生的液相流動和泄漏問題。總的來說,固-液相變材料因其品種繁多且潛熱值更大往往具有更高的實用價值。導熱相變材料主要以熱塑性材料為基體,基體的熔化溫度位于室溫和工作溫度之間,當溫度升高到基體熔點以上時會發生相變成為液態,從而潤濕熱界面,能夠最大程度地填充界面空隙,其相變潛熱可防止溫度急劇變化。導熱相變材料在常溫下是固體,對很多表面粘貼封裝器件的場合非常適用,常用于計算機、處理器、電源模塊等的導熱應用。
TIMs的界面間熱阻(圖源:文獻6)
2、金屬TIM
傳統聚合物TIM的熱導率低,難以支持高算力Chiplet的冷卻需求。金屬TIM的熱導率較高且通過焊接能夠在接觸界面形成連續的熱通道,以顯著降低熱阻。但金屬TIM的模量較高,會在封裝中引入較大的應力。
(1)焊料TIM
目前業界最常見的商用金屬TIM為銦,銦的模量較低,能夠貼合于焊接面并吸收內部應力,純銦的熱導率為86W/(m·K),熔點為157℃,是理想的金屬TIM。AMD采用銦作為高端處理器的TIM,但是銦的價格高且供應量有限。出于成本考慮,以SnAgCu合金為主的無鉛焊料也被廣泛用作TIM,但SnAgCu合金的機械性能和可靠性不如純銦。通過將焊料基體與填料或其他納米結構材料相結合,可以獲得高熱導率并改善其機械性能,這是焊料TIM目前的發展方向。
(2)液態金屬TIM
以鎵基液態合金為代表的液態金屬也可以用作TIM,常壓下其熔點小于29.7℃,具有出色的流動性,可以顯著降低熱應力。但是液態金屬具有較大的表面張力,難以與接觸表面實現緊密結合,并且液態金屬泄漏導致器件短路的風險很大,一定程度上限制了液態金屬TIM的發展。中國科學院理化研究所的GAO等發現納米級的鎵氧化物可以改善其潤濕性,純鎵在銅表面的潤濕性較差,但通過在鎵中添加氧化物,可以使其均勻地涂抹在銅、鋼和硅的表面。引入氧化膜是提高鎵基液態合金作為TIM的性能的有效方法。
(3)微納結構金屬TIM
為了有效發揮作用,金屬TIM必須在合理的裝配壓力下與配合表面保持良好接觸,其厚度必須足夠大,以適應配合表面的不規則性和非平面性。雖然銦作為TIM的熱導率很高,但是它對非平面和高粗糙度表面的適應能力有限。為了增加銦的塑性,并在接觸界面形成連續的高導熱通道,銦泰公司的KEMPERS等開發了一種微紋理銦基TIM,該TIM表面有一些小尺寸的凸起紋理,這些凸起紋理經過壓縮后會發生塑性變形,可以更好地適配接觸界面,改善了普通銦膜的填隙性。這種具有微納結構的TIM可以顯著降低熱阻,相比于石墨墊TIM,微紋理銦基TIM可以將設備的溫度再降低14.9℃。在實際應用中,對微紋理銦基TIM進行系統功率循環測試,在從零功率到全功率的100次循環中,設備的溫度保持恒定。
加入熱界面材料后界面熱阻位置示意圖(圖源:文獻8)
二、高效對流換熱技術
對流換熱是Chiplet技術將熱功耗排散到環境中的重要環節。傳統的空氣對流換熱已經不能滿足Chiplet的熱管理需求,需要采用對流系數更高的液體工質,常見的高效液體換熱技術主要有微通道單相冷卻、微通道流動沸騰(兩相)冷卻、射流冷卻以及浸沒式冷卻。
1、微通道單相冷卻
微通道冷卻是指通過基板上刻蝕的微尺度通道來散熱,熱量會通過基板傳導至微通道中流動的工作流體,再由工作流體傳導至器件外。微通道散熱系統由于具有溫度均勻性好、設備系統結構簡單、質量小、運行穩定等優點,有望成為未來高密度發熱電子設備散熱的方案之一。單相冷卻是指在整個冷卻過程中冷卻介質始終保持同一狀態,不發生沸騰或冷凝的情況。相較常規單相冷卻系統,微通道單相冷卻系統在相同體積下有著更大的換熱面積,具有微尺度效應,整體散熱性能更高。目前,微通道內單相傳熱的研究已經較為充分,但微通道單相冷卻系統也存在一些問題,如當需要散熱的器件封裝較大時,所需的微通道單相冷卻系統的微通道長度會過長,造成較大的進出口溫差,可能會導致半導體器件因溫度不均勻而熱失控。
DC-DC變換器微流體冷卻裝置(圖源:文獻2)
2、微通道流動沸騰(兩相)冷卻
微通道單相冷卻技術雖然可以實現對500W/cm2以下量級熱流密度芯片的有效冷卻,但當芯片熱流密度達到500W/cm2甚至1kW/cm2量級時,單相冷卻方案就無法滿足冷卻需求,此時我們就可以使用微通道流動沸騰(兩相)冷卻技術,利用冷卻工質的相變潛熱,實現微通道冷卻能力的進一步提升。
微通道兩相冷卻技術主要是利用流體在流動-沸騰-冷凝過程中的熱效應來實現冷卻效果的,是緩解單相冷卻中進出口溫差大的優秀的潛在解決方案之一。在多數情況下,散熱器的壁溫會始終高于作為工質的流體,因此在液體沸騰過程中,工質溫度為局部壓力下的飽和溫度。與微通道單相換熱相比,兩相換熱的工質溫度變化較小,因此兩相換熱可以提高散熱裝置壁面溫度的均勻性。如果單相換熱要達到與雙相換熱一樣的均溫性,則需要大功率的工質泵,來提高工質流速。兩相換熱利用了工質的潛熱,所以在工質流量較小的情況下也可以達到更高的傳熱系數,這一點可以較好的滿足集成電路微型化、高度集成化的發展需求。
兩相分層歧管微流道散熱技術概念圖(圖源:文獻4)
3、射流冷卻
射流冷卻是冷卻液在噴嘴的壓差作用下以很高的速度直接沖擊熱源表面來實現高效換熱的一種冷卻方式。一般情況下,射流沖擊流場會被分為自由射流區、滯止區以及壁面射流區。其中,滯止區是射流冷卻的主要作用區域,流體會在該區域形成很薄的速度邊界層和溫度邊界層,邊界層內溫度梯度、軸向速度梯度和壓力梯度很大,使邊界層內各參數發生劇烈變化,形成較強的對流換熱,進而將熱量從芯片中排出。最初射流冷卻使用的工質是空氣,由于液體具有更好的熱性能,液體射流冷卻逐步成為研究熱點。
當前,射流冷卻技術的主要研究方向為射流傳熱結構的優化(包括噴嘴孔型的優化、噴嘴排列方式的優化以及表面結構的優化)、射流高效冷卻液和射流沸騰換熱。其中,對射流噴嘴孔型進行優化的主要是為了通過改變噴嘴的形狀,改變冷卻液在噴嘴出口處的速度矢量,使其沖擊在芯片表面時,產生不同的流動特性,以此強化冷卻液與芯片間的換熱效果;對射流噴嘴的排列方式進行優化主要是為了改善芯片整體的溫度均勻性。單孔射流會在滯止區形成強烈的對流換熱,當流體逐步遠離滯止區后,對流換熱系數快速衰減,導致芯片表面溫差過大,而將噴嘴陣列排布后,芯片表面會形成多個強對流換熱區域,可以有效改善芯片整體溫度的均勻性;對射流冷卻表面結構優化的主要目的是通過改變流體在表面的流動特性,來增大換熱面積和增加汽化核心強化冷卻液與芯片間的換熱。
陣列射流冷卻結構(圖源:文獻3)
4、浸沒式兩相冷卻
浸沒式冷卻是一種高效的直接液冷技術,它主要是將發熱器件與絕緣液體直接接觸并進行熱交換,不需要芯片周圍的冷板管路,系統復雜性較低,可以輕松適應不同的冷卻負荷。根據熱交換過程中傳熱介質是否存在相變變化,可以將浸沒式冷卻分為單相浸沒和兩相浸沒兩類。在兩相浸沒式冷卻時,流體從芯片處吸收熱量后會蒸發,在熱交換器的幫助下冷凝,由于潛熱的存在,它的散熱能力比單相浸沒的更高。由于所有器件均可浸入冷卻液中,不需要額外的風冷裝置,因此浸沒式兩相冷卻可以獲得更優的電源使用效率,是未來基于高算力Chiplet的數據中心或超算中心主流的冷卻方式之一。
兩相浸沒冷卻系統原理圖(圖源:文獻7)
參考文獻:
1、吳作棟,譚公禮,張方駒.三維集成芯片散熱技術研究[J].艦船電子對抗.
2、盛況,唐葦羽,吳贊.碳化硅功率模塊封裝及熱管理關鍵技術[J].
3、馮劍雨,陳釧,曹立強,等.高算力Chiplet的熱管理技術研究進展[J].電子與封裝.
4、張志模,張愛兵,湯蓮花,等.面向三維立體集成封裝的微流道散熱技術[J].中國集成電路.
5、徐曉宇.功率芯片熱管理強化技術研究[D].吉林大學.
6、吉曉霞,秦明禮,吳昊陽,等.熱界面材料概況及性能影響因素[J].有機硅材料.
7、孫曉晴.數據中心兩相浸沒式系統冷卻性能研究[D].東北大學.
8、解紅杰.熱管理功能聚合物復合材料的制備及性能研究[D].天津理工大學.
粉體圈整理
作者:Alice
總閱讀量:1388供應信息
采購需求