首頁(yè)|必讀|視頻|專訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 人工智能 >> 正文

AI大模型帶動(dòng)存儲(chǔ)變革 業(yè)界呼吁重視存力建設(shè)

2023年8月2日 07:36  21世紀(jì)經(jīng)濟(jì)報(bào)道  

眼下,AI大模型正重塑著千行百業(yè),也包括與之息息相關(guān)的算力產(chǎn)業(yè)鏈。

在AI芯片屹立風(fēng)口之時(shí),業(yè)內(nèi)對(duì)存儲(chǔ)芯片、存儲(chǔ)設(shè)備的關(guān)注度也直線上升,HBM(高帶寬存儲(chǔ))、近存計(jì)算等概念大熱。

大模型建立在數(shù)據(jù)和算力之上,而海量數(shù)據(jù)(20.080, 0.12, 0.60%)(維權(quán))需要更強(qiáng)悍的存儲(chǔ)性能,從而更好地釋放算力,因此在大模型的推動(dòng)下,存儲(chǔ)產(chǎn)業(yè)正在新需求下升級(jí)變革。

近日,華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線總裁周躍峰就向記者談到了存力的重要性:“大模型時(shí)代,數(shù)據(jù)決定AI智能的高度。作為數(shù)據(jù)的載體,數(shù)據(jù)存儲(chǔ)成為AI大模型的關(guān)鍵基礎(chǔ)設(shè)施!

一直以來(lái),計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)被視為數(shù)據(jù)中心三大件,它們是關(guān)系緊密的有機(jī)體系,分別對(duì)應(yīng)著算力、存力和運(yùn)力。如今在算力蓬勃發(fā)展的同時(shí),存力正越來(lái)越受到重視。近年來(lái)國(guó)內(nèi)建設(shè)了諸多算力中心,現(xiàn)在的新趨勢(shì)是開(kāi)始建設(shè)大量的存力中心。

打造AI大模型是一個(gè)復(fù)雜的系統(tǒng)過(guò)程,其間面臨著不少挑戰(zhàn)。在華為看來(lái),企業(yè)在開(kāi)發(fā)及實(shí)施大模型應(yīng)用過(guò)程中存在四大挑戰(zhàn)。

首先,數(shù)據(jù)準(zhǔn)備時(shí)間長(zhǎng),數(shù)據(jù)來(lái)源分散,歸集慢,預(yù)處理百TB數(shù)據(jù)需10天左右,這不利于系統(tǒng)的高效利用。

其次,如今大模型的規(guī)模越來(lái)越大,達(dá)到千億甚至萬(wàn)億的參數(shù)級(jí),訓(xùn)練需要海量的計(jì)算資源和存儲(chǔ)空間。比如多模態(tài)大模型以海量文本、圖片為訓(xùn)練集,但是當(dāng)前海量小文件的加載速度不足100MB/s,訓(xùn)練集加載效率低。

其三,大模型參數(shù)頻繁調(diào)優(yōu),訓(xùn)練平臺(tái)不穩(wěn)定,平均約2天出現(xiàn)一次訓(xùn)練中斷,需要Checkpoint機(jī)制恢復(fù)訓(xùn)練,故障恢復(fù)耗時(shí)超過(guò)一天。

最后,大模型實(shí)施門檻高,系統(tǒng)搭建繁雜,資源調(diào)度難,GPU資源利用率通常不到40%。比如,它需要非常專業(yè)的軟件、硬件甚至是維護(hù)工程師來(lái)進(jìn)行實(shí)施并進(jìn)行后續(xù)的維護(hù)。

可以看到,大模型的到來(lái),給數(shù)據(jù)和存儲(chǔ)提出了新的要求。華為分布式存儲(chǔ)領(lǐng)域副總裁韓振興向21世紀(jì)經(jīng)濟(jì)報(bào)道記者表示:“在AI剛興起的時(shí)候,針對(duì)小模型,很多客戶會(huì)找一些服務(wù)器的本地盤來(lái)解決。但是隨著大模型的興起,需要一個(gè)外置的非常靈活擴(kuò)展的存儲(chǔ)。如果數(shù)據(jù)量載入過(guò)慢,會(huì)造成建設(shè)的算力都在閑置,所以需要一個(gè)不僅是外置的存儲(chǔ),而是一個(gè)極高性能的新品類和解決方案!

為了解決這些瓶頸,頭部的企業(yè)們已經(jīng)開(kāi)始牽頭進(jìn)行產(chǎn)業(yè)界合作。近期,華為針對(duì)不同行業(yè)、不同場(chǎng)景大模型應(yīng)用,推出OceanStor A310深度學(xué)習(xí)數(shù)據(jù)湖存儲(chǔ)與FusionCube A3000訓(xùn)/推超融合一體機(jī)。

其中,前者是面向基礎(chǔ)/行業(yè)大模型場(chǎng)景,支持96閃存盤,帶寬可達(dá)400GB/s,IOPS達(dá)到1200萬(wàn);后者面向行業(yè)大模型的訓(xùn)練、推理一體化的場(chǎng)景,集成了存儲(chǔ)、網(wǎng)絡(luò)、多樣性的計(jì)算,降低企業(yè)使用AI大模型的門檻。目前,華為的存儲(chǔ)產(chǎn)品已在國(guó)內(nèi)的十大模型廠商得到部署,包括科大訊飛(60.850, -2.03, -3.23%)、中國(guó)科學(xué)院等。

據(jù)悉,目前全球高端的存儲(chǔ)設(shè)備廠商主要有三家,分別是華為、戴爾EMC和日立。隨著AI大模型日新月異,企業(yè)對(duì)于高端存儲(chǔ)的需求也將更進(jìn)一步,華為、戴爾、日立等也將在存儲(chǔ)的頂級(jí)戰(zhàn)場(chǎng)上展開(kāi)新一輪競(jìng)爭(zhēng)。

周躍峰向21世紀(jì)經(jīng)濟(jì)報(bào)道記者算了一筆成本賬單:在AI的大模型訓(xùn)練過(guò)程里,包括數(shù)據(jù)準(zhǔn)備、接入實(shí)施等整體成本中,算力的成本占25%左右,即買服務(wù)器和GPU;數(shù)據(jù)準(zhǔn)備、清洗與處理這些工作(包括人工)的成本大概占22%。

同時(shí),周躍峰還舉了一個(gè)例子來(lái)說(shuō)明存儲(chǔ)的重要性,由于英文的數(shù)字化記錄資料遠(yuǎn)遠(yuǎn)多于中文,ChatGPT訓(xùn)練英文的效率比中文高很多。他表示,中國(guó)如果不重視存力,對(duì)未來(lái)AI的產(chǎn)業(yè)發(fā)展以及人工智能的潛力的發(fā)揮會(huì)有巨大制約作用。

數(shù)據(jù)顯示,預(yù)計(jì)2025年中國(guó)數(shù)據(jù)量將從7.6ZB增至48.6ZB,超過(guò)美國(guó)成為全球第一。當(dāng)前,全球各國(guó)都在加快制定國(guó)家數(shù)據(jù)戰(zhàn)略,其中,存儲(chǔ)技術(shù)和產(chǎn)業(yè)成為共同關(guān)注的戰(zhàn)略重點(diǎn)。

雖然AI算力中心不斷興起,但是中國(guó)工程院院士、中國(guó)科學(xué)院計(jì)算技術(shù)研究所研究員倪光南指出,目前普遍對(duì)算力的理解有片面性,廣義算力不僅包括算力,還包括存力、運(yùn)力。當(dāng)前中國(guó)算力中心的存力相對(duì)不足,存在重算力輕存力的傾向。

韓振興也表達(dá)了類似觀點(diǎn),他談道,在算力和存力的建設(shè)有一個(gè)最佳的算存比,并不是靠推算力就能把AI做好。算力建設(shè)過(guò)多、存力建設(shè)過(guò)少,這會(huì)導(dǎo)致算力閑置,造成資源的浪費(fèi)。所以一定要去重視存力,達(dá)到一個(gè)最佳的整體算存比。

當(dāng)前國(guó)內(nèi)的存儲(chǔ)發(fā)展還跟不上數(shù)據(jù)量的增長(zhǎng)。根據(jù)倪光南提及的一組數(shù)據(jù),中國(guó)單位GDP的數(shù)據(jù)存儲(chǔ)量只有美國(guó)70%左右,而人均數(shù)據(jù)存儲(chǔ)量,美國(guó)是中國(guó)的9倍。美國(guó)為212GB/人,中國(guó)約為25GB/人,說(shuō)明中國(guó)數(shù)據(jù)存儲(chǔ)產(chǎn)業(yè)大有可為、前景廣闊。

在業(yè)界呼吁關(guān)注存力建設(shè)的同時(shí),國(guó)內(nèi)在政策面也有了更多支持計(jì)劃。為進(jìn)一步加快推動(dòng)我國(guó)算力高質(zhì)量發(fā)展,日前工信部新聞發(fā)言人趙志國(guó)表示,將出臺(tái)指導(dǎo)算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展的政策文件,加大高性能智算供給,加強(qiáng)先進(jìn)存儲(chǔ)產(chǎn)品部署,開(kāi)展算力網(wǎng)絡(luò)優(yōu)化行動(dòng),加快構(gòu)建云邊端協(xié)同、算存運(yùn)融合的一體化、多層次的算力基礎(chǔ)設(shè)施體系。

編 輯:路金娣
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張?jiān)泼鳎捍蟛糠謬?guó)家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動(dòng) 共筑信息保障堤壩
2023MWC上海世界移動(dòng)通信大會(huì)
中國(guó)5G商用四周年
2023年中國(guó)國(guó)際信息通信展覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱: 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像