未來(lái)30年,國(guó)家間科技競(jìng)爭(zhēng)的一個(gè)重要焦點(diǎn)領(lǐng)域是大數(shù)據(jù)人工智能,同時(shí),這也是數(shù)字經(jīng)濟(jì)的關(guān)鍵驅(qū)動(dòng)產(chǎn)業(yè)。算力是AI發(fā)展的核心要素之一,AI芯片是人工智能計(jì)算硬件的“大腦”。從最初的利用圖形處理器作為深度學(xué)習(xí)加速芯片開(kāi)始,到當(dāng)下人們?yōu)锳I定制的專用芯片,短短幾年的時(shí)間里,AI芯片就飛速發(fā)展成為一個(gè)新興的產(chǎn)業(yè)。
AI研究成果和專利正呈現(xiàn)出爆炸式的增長(zhǎng), AI領(lǐng)域如今已經(jīng)變成了一片遼闊的“森林”。圖文并茂的《AI芯片:前沿技術(shù)與創(chuàng)新未來(lái)》從AI的發(fā)展歷史講起,涉及目前最熱門的深度學(xué)習(xí)加速芯片和基于神經(jīng)形態(tài)計(jì)算的類腦芯片的相關(guān)算法、架構(gòu)、電路等,并著重介紹了用創(chuàng)新的思維來(lái)設(shè)計(jì)AI芯片的各種計(jì)算范式,一本書帶領(lǐng)讀者直抵人工智能前沿領(lǐng)域。
AI的快速發(fā)展一直受限于算力,而基于CMOS的硅基芯片的制造工藝已經(jīng)精細(xì)到3納米。不僅AI算力提升將遭遇瓶頸,而且由于AI計(jì)算的特點(diǎn),有些計(jì)算功能較少使用,所以普通CPU已經(jīng)實(shí)現(xiàn)的算力中,有相當(dāng)大的部分是AI無(wú)法使用的。這就是AI芯片出現(xiàn)的客觀要求。比如深度學(xué)習(xí)所需要的主要是矩陣乘法(張量乘法),用GPU的效率就明顯高于使用計(jì)算速度更高的CPU。
今天用于深度學(xué)習(xí)的主要是圖形處理器(GPU)芯片,可以達(dá)到每秒 100 萬(wàn)億次浮點(diǎn)運(yùn)算以上的運(yùn)算速度,是超級(jí)計(jì)算機(jī)Cray-3運(yùn)算速度的6000多倍。但是,這相比人類大腦還差得遠(yuǎn)。人腦大約有1000億個(gè)神經(jīng)元,有超過(guò)100萬(wàn)億個(gè)突觸介入神經(jīng)元信號(hào)傳導(dǎo)。大腦能夠以閃電般的速度識(shí)別模式、記住事實(shí)并同步并行處理其他工作,功耗不到20瓦。
隨著“后摩爾時(shí)代”的到來(lái),硅基芯片的計(jì)算速度已經(jīng)接近頂點(diǎn),同時(shí)出現(xiàn)了另一個(gè)問(wèn)題,就是這種計(jì)算結(jié)構(gòu)更適合結(jié)構(gòu)化數(shù)據(jù),而對(duì)于處理大數(shù)據(jù)這樣的非結(jié)構(gòu)化數(shù)據(jù),提高芯片計(jì)算密度的方法是無(wú)效的。按照作者給出的數(shù)據(jù),加工工藝高于10納米之后,盡管芯片的計(jì)算速度還在快速提升,但是處理大數(shù)據(jù)的相對(duì)效率反而越來(lái)越低了。按照目前的技術(shù)水平,如果并行使用多個(gè)GPU,功率很容易超過(guò)1000瓦。2016 年AlphaGo對(duì)戰(zhàn)圍棋九段高手李世石時(shí),運(yùn)行該AI程序的服務(wù)器功耗達(dá)1兆瓦,將近人腦功耗的5萬(wàn)倍。人們必須尋找其他的芯片材料,采用適宜大數(shù)據(jù)人工智能的計(jì)算架構(gòu)、模型和算法。在這方面,已有華人科學(xué)家作出了重大貢獻(xiàn)。1971年蔡少棠教授基于電路理論推理發(fā)現(xiàn)并證明存在一種新的基礎(chǔ)電路元件——憶阻器。2008年,惠普公司的斯坦利·威廉首次在實(shí)驗(yàn)室里支撐了第一個(gè)基于二氧化鈦薄膜的原型產(chǎn)品。這種新器件可以顯著降低計(jì)算時(shí)的功耗,是深度學(xué)習(xí)加速器和類腦芯片的一個(gè)潛在硬件解決方案。
雖然 AI 芯片的開(kāi)發(fā)主流都是基于深度學(xué)習(xí)算法,目前的主要技術(shù)路線是將用于加速處理深度學(xué)習(xí)的專用 AI 芯片和多核CPU處理器集成到同一塊芯片中。在半導(dǎo)體芯片領(lǐng)域,目前,開(kāi)發(fā)FPGA和ASIC是一個(gè)重要方向。更前沿的研究是設(shè)計(jì)“可進(jìn)化”芯片,它基本上接近通過(guò)芯片的“自學(xué)習(xí)”來(lái)提升芯片自身的性能。
AI 芯片的最終目標(biāo)是能夠“自我學(xué)習(xí)”,即芯片能夠自己學(xué)習(xí)“如何學(xué)習(xí)”;另外一個(gè)重要目標(biāo)是做到智能機(jī)器之間(相當(dāng)于AI芯片之間)的相互學(xué)習(xí)和協(xié)調(diào),從而使智能機(jī)器自己得到更多的知識(shí)。這種“自我學(xué)習(xí)”的性能,很可能隨時(shí)間呈指數(shù)級(jí)提升,并將最終導(dǎo)致智能機(jī)器的智能水平超越人類。這類芯片在設(shè)計(jì)過(guò)程中往往會(huì)盡可能貼近大腦的生物特性,因而被稱為類腦芯片或者神經(jīng)形態(tài)芯片。這種芯片基于新的芯片架構(gòu),關(guān)鍵組成部分包含脈沖神經(jīng)元、低精度突觸和可擴(kuò)展的通信網(wǎng)絡(luò)等。
中國(guó)已將芯片列為必須自主掌控的技術(shù),而在與歐美國(guó)家差距極小的大數(shù)據(jù)人工智能已經(jīng)成為下一個(gè)必須占領(lǐng)的科技高地。目前在硅基半導(dǎo)體芯片領(lǐng)域的基礎(chǔ)專利多被歐美占據(jù),很難沿著這個(gè)路線超車。AI芯片給我們帶來(lái)了一個(gè)難得新機(jī)會(huì),類腦芯片和基于新神經(jīng)網(wǎng)絡(luò)算法、量子啟發(fā)算法、自然仿生計(jì)算、存內(nèi)計(jì)算和新型存儲(chǔ)器,以及基于量子計(jì)算和量子機(jī)器學(xué)習(xí)等領(lǐng)域的研發(fā),還處于實(shí)驗(yàn)室樣片或少量試用階段,這些可以作為中國(guó)芯片科技彎道超車的目標(biāo)。