近一年以來,隨著基于大模型技術的新一輪人工智能技術浪潮崛起,如何有效應對AI部署帶來的功耗和成本挑戰(zhàn)?如何構建可持續(xù)的算力系統(tǒng)?AI PC能改善消費電子需求減弱的現狀嗎?一系列的問題,成為整個科技行業(yè)的熱門議題。
近日,新浪科技《科創(chuàng)100人》采訪了英特爾研究院副總裁、英特爾中國研究院院長宋繼強。對話中,宋繼強指出,“應對大模型部署的功耗和成本挑戰(zhàn),可以從芯片制程、系統(tǒng)架構、異構算力以及數據中心規(guī)劃設計等多維度入手!
作為最為底層的芯片算力企業(yè),英特爾和國內外眾多云廠商、電信廠商已有超過十年的合作,其間作為顧問去幫這些企業(yè)成立數據中心,做架構優(yōu)化,過程中積累了大量的經驗。談及國內該如何構建可持續(xù)的算力系統(tǒng)時,宋繼強強調,“在新建數據中心的時候,一定要嚴卡能效比!
在宋繼強看來,AI PC概念的提出,類似于之前在計算機上加上WiFi功能一樣的變革。因為體積和算力的原因,電腦可以把多種算力架構組合進去,支持更多的生成式AI創(chuàng)新。
“與手機相比,PC能支持更多生成式AI創(chuàng)新”
近一年以來,隨著生成式AI技術的快速發(fā)展,越來越多的PC和消費電子廠商紛紛圍繞AI技術展開創(chuàng)新,AI PC的概念也隨之出現。作為個人電腦領域最為底層的芯片算力提供商,英特爾如何看待這一輪AI浪潮對于PC等消費電子行業(yè)的影響呢?
宋繼強表示,AI PC這一波新的技術增長或應用增長拐點,就像當年把WiFi做到筆記本上一樣,因為他突然給傳統(tǒng)的 PC或筆記本增加了一些AI能力,這會導致交互方式發(fā)生很大的變化,如果PC再去結合諸如邊緣智能設備進行工作,這將帶來很多生產力上的改變,催生出一些新興的應用。
“這些被催生出的新興應用都跟終端設備有關,但目前在手機上的挑戰(zhàn)可能要比在 PC上更大!彼卫^強表示。
在宋繼強看來,由于手機體積較小能夠支撐的算力有限,而筆記本或者臺式機則可以把多種架構組合起來去實現更多的功能,因此也將能夠支撐更多的硬件創(chuàng)新。
“應對AI大模型部署挑戰(zhàn),要從三方面下手”
在部署大模型的過程中,AI工作負載帶來的功耗和成本挑戰(zhàn),是目前業(yè)界迫切希望解決的。在宋繼強看來,AI工作的功耗問題,實際上可以從四方面分別進行解讀。
第一,芯片本身是否來自高能效比的工藝節(jié)點。如果我們想讓AI性能和能效提高,就要選用更具有高能效比的工藝節(jié)點去生產。比如,英特爾現在4年5個節(jié)點往前推進,從Intel 7、Intel 4、Intel 3,到2024年上半年和下半年分別會大批量生產的Intel 20A和Intel 18A,這些節(jié)點每代都會比前一代有兩位數性能提升。
“這些都是相對絕對的,因為它是半導體制程所帶來,能定義出一個晶體管的能效比、漏電情況、計算次數等,這是最底層的,也是芯片級的!彼卫^強表示。
第二,架構設計是否能夠跟工作負載特點吻合。有了基礎的晶體管制造工藝后,上面就是架構層的事,是如何組織晶體管并讓它去形成技術。這里會涉及CPU、GPU、NPU以及DPU等不同的架構,這些架構由于工作模式不同,所以對于自己擅長那部分的工作負載能效比就挺好。比如在模型部署應用里,有一些是屬于前期的數據清洗和處理分析,包括數據結構的優(yōu)化等,這些通過傳統(tǒng)CPU加上一些內存架構優(yōu)化,其實就挺好。如果后面涉及大模型,再引入GPU或者一些專門的AI加速器,性價比會更好。
在宋繼強看來,現在的大模型所面臨的其實不是計算式主瓶頸,而是內存的帶寬和容量是一個很大的瓶頸,所以整個系統(tǒng)的架構里面是不是把這部分專門進行優(yōu)化,也是它最后效率高低的一個差別。因為只要你負載沒運行完,這些都在耗電,不管它是在空轉地等數據,還是其他的都在耗電。同時,一些復雜的工作也可以用更具突破性的架構去實現,比如說類腦計算芯片,做同一類任務,你用類腦芯片去實現和用這個傳統(tǒng)的CPU+GPU實現,他們的能效比、能耗能相差到千倍以上。
上層系統(tǒng)是否從網絡到軟件都進行了優(yōu)化。以數據中心服務器是否用最先進的綠色計算方案為例,在整個服務器數據中心里,要知道怎么給它供電、散熱,怎么去減少空調的功率。因為在數據中心里邊,除了數據中心計算消耗的電量外,它產生了熱,空調就要去對它進行冷卻,所以空調的電量也是能耗的一部分。
當然,宋繼強也看到,對于想要提高AI能效比的企業(yè)而言,想要很好地兼顧好這些不同層面的技術因素,難度也是非常大的。在數智化需求側期待快速提升時,有什么基于現在技術更靈活、快速的方案呢?據他介紹,在芯片制造、處理器架構以及整個計算系統(tǒng)構成環(huán)節(jié),英特爾IDM2.0所提供的系統(tǒng)級代工服務,能夠給客戶提供全棧式的優(yōu)化計算方案。此外,英特爾還可以通過專用軟件工具或合作客戶解決方案,去幫客戶優(yōu)化并構造解決相應的AI能耗和成本問題。
“建數據中心,生態(tài)不統(tǒng)一最讓人頭疼”
據宋繼強介紹,在數據中心能耗優(yōu)化和算網融合的能效比優(yōu)化方面,英特爾和國內外支持的眾多云廠商、電信廠商,已有超過十年的合作歷史,英特爾通常會作為顧問去幫這些企業(yè)成立數據中心,并做整個架構的優(yōu)化,過程中也積累了大量的經驗。
在宋繼強看來,在推動可持續(xù)的算力生態(tài)建設過程中,一定要嚴卡能效比。畢竟,現在國內數據中心上量太快了,各個城市都在建設。因此,一定要通過數智驅動等手段,把能效真正地降下來。比如,通過加上傳感器做運維輔助,讓整個IT系統(tǒng)在運行工作負載的時候能夠節(jié)能;又或者通過優(yōu)化空調用電,做到非IT系統(tǒng)的節(jié)能。
他結合英特爾綠色數據中心技術框架2.0分享表示,在建數據中心時鼓勵要更多地采用稍微先進一些的數據中心架構模式!耙驗,一旦數據中心建成并成為基礎設施,都是朝著使用10—15年去的,如果中間再去替換的話,成本都非常高”。因此,在做實施時,盡量找有前瞻性的企業(yè)或顧問團來做方案,也是非常重要的。
宋繼強表示,國內現在在建一些新的計算中心時,有時候也會找英特爾去做咨詢。會發(fā)現,他們遇到的一些問題是,之前采用的一些異構算力或者技術供應商,經歷一年兩年以后都消失了,又得重新迭代!八袁F在國內建計算中心的時候也是很頭疼的,而且大家的生態(tài)都不統(tǒng)一,在這上面開發(fā)應用是很大的一個投資風險!
據他介紹,目前英特爾也會參與國內一些智能算力中心的硬件能效比或計算能力評測中,去定制一些行業(yè)標準,去比較不同芯片或不同架構組合對于解決問題的能力,做類似于基準測試的定義,進而促進行業(yè)的規(guī)范發(fā)展。