首頁|必讀|視頻|專訪|運(yùn)營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

英偉達(dá)深夜發(fā)“重磅” 預(yù)計2025年推出Blackwell Ultra AI芯片

2024年6月4日 07:48  每日經(jīng)濟(jì)新聞  作 者:楊卉

6月2日晚間,英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛登臺演講,透露了不少關(guān)鍵信息。據(jù)他介紹,使用NVIDIA NIM將AI模型部署在云、數(shù)據(jù)中心或工作站上的開發(fā)者,可將模型部署時間從以前的數(shù)周縮短至幾分鐘。和碩、勞氏公司、西門子等客戶均在使用。

此外,被英偉達(dá)寄予厚望的新一代AI芯片與超級計算平臺Blackwell芯片已開始投產(chǎn),預(yù)計將在2025年推出Blackwell Ultra AI芯片。

NVIDIANIM可將模型部署時間從數(shù)周縮短至幾分鐘

6月2日晚間,一身皮衣的英偉達(dá)創(chuàng)始人黃仁勛又在舞臺上擺弄起了自家產(chǎn)品,重磅介紹了NVIDIANIM,一種推理微服務(wù),可通過經(jīng)優(yōu)化的容器形式提供模型,旨在助力各種規(guī)模企業(yè)部署AI服務(wù)。

不過,嚴(yán)格來說,NVIDIANIM并非新品,最早露面是在今年3月。英偉達(dá)在6月2日晚間宣布,全球2800萬開發(fā)者皆可下載NVIDIANIM,將AI模型部署在云、數(shù)據(jù)中心或工作站上,構(gòu)建Copilot(一種AI助理)、ChatGPT聊天機(jī)器人(10.190, -0.13, -1.26%)等生成式AI應(yīng)用。下月起,NVIDIA 開發(fā)者計劃的會員可免費(fèi)使用NIM,在其選擇的基礎(chǔ)設(shè)施上進(jìn)行研究、開發(fā)和測試。

根據(jù)英偉達(dá)的說法,新的生成式AI應(yīng)用正變得越來越復(fù)雜,通常需要使用具有不同功能的多個模型來生成文本,如圖像、視頻、語音等。而NVIDIANIM提供了一種簡單、標(biāo)準(zhǔn)化的方式——將生成式AI添加到應(yīng)用中,可使模型部署時間從以前的數(shù)周縮短至幾分鐘。

黃仁勛還透露,包括 Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近200家技術(shù)合作伙伴正在將NIM集成到他們的平臺中,以加快生成式AI部署。“每個企業(yè)都希望在其運(yùn)營中融入生成式AI,但并非每個企業(yè)都擁有專門的AI研究團(tuán)隊。NVIDIA NIM 可被集成到任意平臺中,任何地方的開發(fā)者都可以訪問,并且可以在任意環(huán)境中運(yùn)行!秉S仁勛稱。

《每日經(jīng)濟(jì)新聞》記者了解到,NIM是預(yù)先構(gòu)建的,目前有近40個模型可作為NIM的端點供開發(fā)者體驗;開發(fā)人員可從開源社區(qū)平臺Hugging Face訪問適用于Meta Llama 3模型的NVIDIA NIM微服務(wù),使用Hugging Face推理端點訪問和運(yùn)行 Llama 3 NIM。

值得注意的是,英偉達(dá)還透露了一批大客戶的使用情況,如電子制造商Foxconn正在使用NIM開發(fā)針對特定領(lǐng)域的大語言模型(LLM),用于智能制造、智慧城市和智能電動汽車;和碩正在將NIM用于一個當(dāng)?shù)氐幕旌蠈<遥∕oE)模型;勞氏公司正在用 NVIDIA NIM推理微服務(wù)來提升員工和客戶的體驗;西門子正在將其運(yùn)營技術(shù)與NIM微服務(wù)整合,用于車間AI工作負(fù)載;還有數(shù)十家醫(yī)療保健公司正在部署NIM,為包括手術(shù)規(guī)劃、數(shù)字助理、藥物發(fā)現(xiàn)和臨床試驗優(yōu)化等在內(nèi)的應(yīng)用領(lǐng)域的生成性AI推理提供支持。

Blackwell芯片開始投產(chǎn)

除了上述產(chǎn)品,黃仁勛還在演講中透露,英偉達(dá)Blackwell芯片已開始投產(chǎn),并將在2025年推出Blackwell Ultra AI芯片。

今年5月,黃仁勛在財報電話會上稱,預(yù)計今年Blackwell架構(gòu)芯片將為公司帶來大量收入。英偉達(dá)對Blackwell芯片寄予厚望,還是與市場強(qiáng)勁需求有關(guān)。從最新披露的財報數(shù)據(jù)來看,2025財年第一財季,英偉達(dá)實現(xiàn)營收260億美元,較上年同期增長262%。其中,數(shù)據(jù)中心業(yè)務(wù)營收226億美元,與上年同期相比增長427%,是業(yè)績收入的“大頭”。

據(jù)英偉達(dá)首席財務(wù)官科萊特•克雷斯解讀,數(shù)據(jù)中心業(yè)務(wù)的增長源自Hopper架構(gòu)GPU(例如H100)出貨量的增加;該季度的重要亮點之一就是Meta宣布推出Lama 3開源大模型,使用了近2.4萬塊H100 GPU。

除了披露芯片量產(chǎn)進(jìn)度,英偉達(dá)此次還推出了一系列采用NVIDIABlackwell架構(gòu)的系統(tǒng)。

據(jù)悉,這些系統(tǒng)搭載了GraceCPU以及NVIDIA網(wǎng)絡(luò)和基礎(chǔ)設(shè)施,用于助力企業(yè)建立AI工廠和數(shù)據(jù)中心。其中,NVIDIA MGX模塊化參考設(shè)計平臺加入了對NVIDIA Blackwell產(chǎn)品的支持,包括專為主流大語言模型推理、檢索增強(qiáng)生成和數(shù)據(jù)處理提供卓越性能打造的NVIDIA GB200 NVL2平臺。

英偉達(dá)強(qiáng)調(diào),GB200 NVL2適合用于數(shù)據(jù)分析等新興領(lǐng)域,借助NVLink—C2C互連技術(shù)帶來的帶寬內(nèi)存性能及Blackwell架構(gòu)中專有的解壓縮引擎,較使用X86CPU時的數(shù)據(jù)處理速度可最多提速到18倍,能效提高8倍!靶乱惠喒I(yè)革命已經(jīng)開始,眾多企業(yè)和地區(qū)正在與NVIDIA合作推動價值萬億美元的傳統(tǒng)數(shù)據(jù)中心向加速計算轉(zhuǎn)型,并建造一種新型數(shù)據(jù)中心AI工廠來生產(chǎn)新的商品,人工智能。”黃仁勛稱。

英偉達(dá)方面表示,目前已有超過25家合作伙伴的90多套已發(fā)布或正在開發(fā)中的系統(tǒng)使用了MGX參考架構(gòu),開發(fā)成本較之前最多降低了四分之三,開發(fā)時間縮短到六個月,較之前減少了三分之二。另外,英偉達(dá)還透露,比亞迪(237.100, 8.08, 3.53%)電子、西門子、泰瑞達(dá)和Alphabet旗下公司Intrinsic等全球十多家機(jī)器人企業(yè)正在將NVIDIAIsaac加速庫、基于物理學(xué)的仿真和AI模型集成到其軟件框架和機(jī)器人模型中,以此提高工廠、倉庫和配送中心的工作效率。

編 輯:路金娣
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
中國電信董事長柯瑞文:天翼云作為國家云已經(jīng)越過向智能云發(fā)展的拐點
精彩專題
CES 2024國際消費(fèi)電子展
2023年信息通信產(chǎn)業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機(jī)評選
第24屆中國國際光電博覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像