當?shù)貢r間周一(11月27日),有“云計算春晚”之稱、為期四天的“re:Invent”在美國拉斯維加斯盛大開啟。周二,亞馬遜與其云計算部門AWS都各自公布了重磅消息。
在AWS這邊,其發(fā)布了升級版的自研處理器芯片“Graviton4”。新聞稿稱,與上一代Graviton3相比,其計算性能提高了30%,內(nèi)核增加了50%,內(nèi)存帶寬增加了75%,為在亞馬遜EC2中運行的云工作負載提供最佳的性價比和能效。
Graviton4 和 Trainium
AWS還發(fā)布了面向人工智能系統(tǒng)的升級款加速器芯片“Trainium2”。介紹稱,其訓練速度是上一代Trainium1的四倍,并且能夠組合在超過10萬個芯片的EC2 UltraCluster中,“使基礎模型(FM)和大型語言模型(LLM)的訓練只需極少的時間,同時能效將提升至2倍!
據(jù)了解,Trainium2將于2024年投入應用,可能取代AWS中部分英偉達的AI加速器產(chǎn)品,但這不意味著亞馬遜和英偉達分道揚鑣。在會議上,英偉達CEO黃仁勛和AWS CEO Adam Selipsky一起上臺,宣布兩家公司“擴大戰(zhàn)略合作關(guān)系”。
最新的合作包括,AWS將成為第一家采用英偉達GH200 Grace Hopper Superchip平臺的云服務提供商,該平臺可以集成32個Grace Hopper超級芯片在一個封裝“GH200 NVL32”中。配備亞馬遜云技術(shù)后,服務可以擴展到數(shù)千個GH200芯片。
另外,兩家公司將合作在AWS上托管英偉達的多節(jié)點AI訓練即服務解決方案“NVIDIA DGX 云”,它也將成為第一個采用GH200 NVL32的DGX云。兩者還在Ceiba項目上進行合作,設計全球最快的、GPU驅(qū)動的AI超級計算機,英偉達計劃使用它來推動下一波生成式AI的創(chuàng)新。
AWS還將推出三個新的Amazon EC2實例,分別為P5e、G6和G6e,三者都將由英偉達的GPU提供支持。其中,G6e特別適合使用英偉達的平臺“NVIDIA Omniverse”來開發(fā)3D工作流程、構(gòu)建數(shù)字孿生和其他應用程序。
除此以外,AWS CEO Adam Selipsky還發(fā)布了一款名為“Q”的聊天機器人,專門供人們在工作中使用,并且可以根據(jù)客戶的業(yè)務進行定制。新聞稿稱,用戶可以使用Q在AWS上構(gòu)建應用程序、研究最佳實例、解決錯誤以及獲得編寫新功能的幫助。