雷鋒網(wǎng)按,本文分析了目前AI芯片市場的情況,以及NVIDIA在這一市場的領(lǐng)先地位。不過,隨著芯片巨頭在AI芯片領(lǐng)域有了新的進展,NVIDIA將會面臨更多的挑戰(zhàn),2019年AI芯片市場會如何?
作者將會分三部分進行介紹,本文是第一部分。
NVIDIA的領(lǐng)先優(yōu)勢
過去的五年,NVIDIA在數(shù)據(jù)中心領(lǐng)域成為了規(guī)模數(shù)十億美元的巨頭,并且沒有一次面對持續(xù)且非常強勁的對手,這是一個令人驚訝的事實。NVIDIA快速增長的動力來自人工智能(AI)和高性能計算(HPC)對GPU芯片的需求。NVIDIA首席執(zhí)行官Jensen Huang喜歡談?wù)撋疃葘W(xué)習(xí)的“寒武紀爆炸”,指的是神經(jīng)網(wǎng)絡(luò)算法的快速迭代。
目前,我們處于AI芯片爆發(fā)的門口,全球許多大型和小型公司都加入其中。三年前,芯片創(chuàng)業(yè)公司幾乎不可能獲得風險投資,現(xiàn)在,有數(shù)十家資金充足的挑戰(zhàn)者在研發(fā)AI芯片。
去年,NVIDIA和 IBM為世界上最快的超級計算機提供芯片(據(jù)稱其中95%的性能歸功于NVIDIA的Volta GPU)。雖然這是一項令人難以置信的成就,但許多人開始懷疑NVIDIA的輝煌能否持續(xù)。
在最新報告季度,NVIDIA數(shù)據(jù)中心收入同比增長58%至7.92億美元,占公司總收入的近25%。過去的四個季度總營收達到28.6億美元。如果能夠保持這種增長趨勢,2019年數(shù)據(jù)中心營收或達到約45億美元。
毫無疑問,NVIDIA以其強大的可擴展架構(gòu)為動力打造出受歡迎的產(chǎn)品。NVIDIA現(xiàn)在擁有一個強大且持續(xù)更新的軟件,高校、初創(chuàng)公司和合作伙伴使其成為由其新創(chuàng)建的生態(tài)的主導(dǎo)者。有些人會認為這個生態(tài)系統(tǒng)是堅固的護城河,但暴風云正在出現(xiàn)。潛在的威脅來自英特爾,谷歌,AMD以及數(shù)十家美國和中國的初創(chuàng)公司。
目前為止,在我看來,大部分競爭者都“火力不足”。因為我非常有信心除了谷歌,其它挑戰(zhàn)者都沒有搶奪了NVIDIA的市場份額。讓我們來看看目前的競爭格局,2019年將會變得非常有趣。
重磅的競爭者
根據(jù)紐約時報的統(tǒng)計,有超過40家創(chuàng)業(yè)公司進入AI芯片領(lǐng)域,但實際情況是,只有少數(shù)公司能在這個市場上取得真正的成功(比如收入超過10億美元)。對于深度神經(jīng)網(wǎng)絡(luò)(DNN)的訓(xùn)練,鑒于其產(chǎn)品的實力,市場占有率和生態(tài)系統(tǒng),NVIDIA難以被擊敗。然而,目前市場規(guī)模還小的推理芯片市場最終將超過訓(xùn)練市場。
與訓(xùn)練不同,推理不是單一的市場。推理包含了云端和終端,每一種應(yīng)用對深度學(xué)習(xí)算法、性能、功耗和延遲都有特定的要求。另外,在推理市場還沒有絕對的領(lǐng)導(dǎo)者,即便NVIDIA聲稱在汽車市場擁有領(lǐng)導(dǎo)地位。
出于這些原因,推斷市場是大多數(shù)新進入者主要或最初關(guān)注的方向。讓我們來看看重磅的競爭者。
谷歌
谷歌是最早推出專用芯片(ASIC)的公司之一,然而谷歌可能是NVIDIA最大的客戶之一。谷歌的“Tensor Processing Units”(TPU)芯片已經(jīng)更新至第三代,可以加速云端的深度學(xué)習(xí)訓(xùn)練,最近還可以加速推理處理。據(jù)悉,用于訓(xùn)練和處理DNN的Google TPU的性能相當穩(wěn)定,單芯片每秒性能可達45 TOPS。相比之下,NVIDIA的Volta性能最高可達125 TOPS。第一批TPU只供內(nèi)部使用,現(xiàn)在谷歌將它們作為服務(wù)提供給Google Compute Cloud的客戶。
雖然TPU會對谷歌的人工智能的發(fā)展產(chǎn)生影響,但除了內(nèi)部的,對外的服務(wù)(這是一個相當大的市場)是故意限制的。TPU只能用于培訓(xùn)和運行Google TensorFlow框架,無法使用它來訓(xùn)練或運行使用Apache MxNet或PyTorch構(gòu)建的AI,PyTorch框架的重要推動者是Facebook 和微軟。TPU也不能用于非AI HPC應(yīng)用,這一領(lǐng)域GPU占據(jù)絕對主導(dǎo)地位。
此外,TPU也不向企業(yè)或政府的數(shù)據(jù)中心出售。但谷歌對此表示滿意,因為它將TPU和TensorFlow視為其全面的AI領(lǐng)導(dǎo)力戰(zhàn)略。針對硬件的軟件優(yōu)化,可以構(gòu)建強大而耐用的平臺。
TPU更直接的影響可能是驗證ASIC可以作為GPU的替代品,至少對潛在投資者而言如此。深度學(xué)習(xí)芯片初創(chuàng)公司的首席執(zhí)行官表示,一旦谷歌宣布其TPU,風險資本就開始尋找投資目標,他隨后獲得了數(shù)億美元投資。
谷歌一直擅長從NVIDIA的GPU技術(shù)大會(通常在三月份)的可預(yù)測信息中竊取一些引人注意的信息,如果今年谷歌發(fā)布性能強大的7nm TPU,對比我不會感到驚訝。
亞馬遜也在去年秋天宣布,正在為推理處理研發(fā)ASIC。但是,該芯片仍在開發(fā)中。
英特爾
英特爾是非常重磅的玩家,雖然該公司打算使用Nervana芯片在2019年參與人工智能訓(xùn)練和推理的競爭,但它意識到推理將是更大的市場,并且擁有非常強大的實力。
除了Xeon CPU(最近更新后,推理性能得到顯著提升),該公司還分別收購了MobileEye和Movidius,用于汽車和嵌入式推理。我已經(jīng)看過這兩種設(shè)備的演示,它們的確令人印象深刻。英特爾還推出了OpenVino軟件工具包,它允許開發(fā)人員在任何地方進行訓(xùn)練,然后在英特爾處理器上進行優(yōu)化和運行。
CES 2019上,英特爾透露正在與Facebook密切合作準備推出Nervana神經(jīng)網(wǎng)絡(luò)處理器(NNP-I),因為許多人猜測Facebook正在開發(fā)自己AI加速器。與此同時,英特爾副總裁兼AI產(chǎn)品總經(jīng)理Naveen Rao在 Twitter上分享,NNP-I是采用英特爾10nm的SoC,并采用IceLake x86內(nèi)核。
對于訓(xùn)練,英特爾最初的計劃在收購Nervana一年的2017年宣布“Lake Crest”Nervana NNP。之后推遲到2018年,然后,公司決定重新開始。這可能是因為英特爾意識到第一款Nervana設(shè)備不足以大幅超越NVIDIA。
高通和蘋果
為了完整性,我將高通和蘋果也包括在內(nèi),因為它們都提供了令人印象深刻的手機人工智能功能(高通也布局IoT和自動駕駛汽車)。蘋果專注于iPhone A系列CPU和用于手機AI的iOS操作系統(tǒng)支持。隨著移動平臺成為語音和圖像AI推理的主要平臺,這兩個玩家擁有大量可用于建立領(lǐng)導(dǎo)力的IP(盡管華為我們也非常努力地推動人工智能。)
AMD
過去三年,AMD一直在努力讓AI的軟件正常運轉(zhuǎn)。當我2015年在那里工作時,如果沒有啟動Windows,你甚至無法在Linux服務(wù)器上運行GPU。從那時起,AMD進行了很多工作,ROCm軟件和編譯器簡化了CUDA的遷移,并且在其芯片上加速數(shù)學(xué)庫MlOpen(不要與OpenML混淆)。然而,目前AMD的GPU仍然至少落后NVIDIA V100產(chǎn)品一代,而V100推出已經(jīng)接近兩年了。
AMD是否有能力在7nm上與NVIDIA TensorCores競爭,還有待觀察。AMD可能會決定更多地關(guān)注推理市場,可能推出自動駕駛汽車平臺,類似NVIDIA Xavier SoC,時間會證明。
賽靈思
Xilinx 的FPGA在2018年表現(xiàn)出色,除了宣布其7nm的下一代架構(gòu)外,還與微軟、百度 、亞馬遜、阿里巴巴、戴姆勒-奔馳等合作伙伴達成合作。在AI推理中,F(xiàn)PGA具有優(yōu)于ASIC的優(yōu)勢,因為FPGA可以針對特定的應(yīng)用進行即時重新配置。當基礎(chǔ)技術(shù)快速變化時,這很重要,就像AI一樣。
例如,微軟展示了其FPGA(來自賽靈思和英特爾)如何在深度神經(jīng)網(wǎng)絡(luò)中對特定層,可以使用1bit,3bit或其它精度的數(shù)據(jù)。這可以大大加快處理速度,并減少延遲,同時降低功率。此外,即將推出的Xilinx 7nm芯片稱為Versal,具有AI和DSP引擎,可加速特定應(yīng)用程序處理以及自適應(yīng)邏輯陣列。Versal將在今年的某個時候開出貨,我認為這可能是推理處理的改變者。