更多的訓(xùn)練數(shù)據(jù)、更大的模型、更多的芯片和數(shù)據(jù)中心,這些推動(dòng)人工智能(AI)進(jìn)步的“基礎(chǔ)設(shè)施”,正推高科技公司的成本。
5月,OpenAI與美國(guó)新聞集團(tuán)(News Corp)簽訂了一項(xiàng)五年內(nèi)金額超過(guò)2.5億美元的內(nèi)容授權(quán)協(xié)議,允許前者使用后者的新聞出版物內(nèi)容來(lái)回答用戶查詢并訓(xùn)練AI。此前,圖片提供商Shutterstock與蘋(píng)果、Meta、谷歌、亞馬遜等大型科技公司簽訂了2500萬(wàn)至5000萬(wàn)美元的交易,提供其龐大的圖片和視頻庫(kù)用于AI訓(xùn)練。
全球經(jīng)濟(jì)分析公司BCA Research美國(guó)股票首席策略師唐克爾(Irene Tunkel)對(duì)第一財(cái)經(jīng)記者表示,科技公司在AI領(lǐng)域開(kāi)展了大量工作,但除非銷售的是AI相關(guān)的“工具和設(shè)備”或云存儲(chǔ),否則科技公司更多仍做的是AI資本支出,而不是靠AI掙錢。
然而,大量的資本開(kāi)支需求無(wú)疑會(huì)將無(wú)力承擔(dān)相應(yīng)成本的公司甩在后面,有能力在這場(chǎng)游戲中競(jìng)爭(zhēng)的玩家仍將是我們熟知的科技巨頭。
“基礎(chǔ)設(shè)施”很貴,資本支出很高
唐克爾介紹,在生成式AI的生態(tài)系統(tǒng)中,提供芯片和計(jì)算機(jī)硬件、云平臺(tái)和服務(wù)、數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)和分析等產(chǎn)品和服務(wù)的屬于生成式AI的“基礎(chǔ)設(shè)施公司”,幫助模型的順利開(kāi)發(fā)和部署。例如,OpenAI的研究員貝特克(James Betker)曾表示,訓(xùn)練模型的數(shù)據(jù)是越來(lái)越復(fù)雜、強(qiáng)大的AI系統(tǒng)的關(guān)鍵。
但數(shù)據(jù)該從哪來(lái)?據(jù)報(bào)道,生成式AI模型主要通過(guò)從公共網(wǎng)頁(yè)中獲取的圖像、文本、音頻、視頻和其他數(shù)據(jù)(其中一些是有版權(quán)的)進(jìn)行訓(xùn)練。例如,OpenAI在未經(jīng)某視頻社交網(wǎng)站或創(chuàng)作者許可的情況下,轉(zhuǎn)錄了超過(guò)一百萬(wàn)小時(shí)的相關(guān)視頻,以供其旗艦?zāi)P虶PT-4使用。元公司(Meta)也一直在使用旗下公司照片墻(Instagram)上的圖片和視頻來(lái)訓(xùn)練其模型,并只允許歐盟公民退出這一機(jī)制。
隨著法律訴訟的增多,AI公司開(kāi)始選擇付費(fèi)。例如,線上社區(qū)Reddit稱,該公司已通過(guò)向谷歌和OpenAI等組織許可數(shù)據(jù)賺取了數(shù)億美元。據(jù)報(bào)道,AI訓(xùn)練數(shù)據(jù)市場(chǎng)預(yù)計(jì)將在十年內(nèi)從現(xiàn)在的約25億美元增長(zhǎng)到接近300億美元。
模型訓(xùn)練也并不便宜。OpenAI首席執(zhí)行官奧爾特曼(Sam Altman)表示,訓(xùn)練GPT-4的成本超過(guò)1億美元。AI初創(chuàng)公司Anthropic首席執(zhí)行官阿莫代(Dario Amodei)也稱,目前市場(chǎng)上的人工智能模型的訓(xùn)練成本約為1億美元。他說(shuō):“現(xiàn)在正在訓(xùn)練的模型,以及將在今年晚些時(shí)候或明年年初推出的模型,成本接近10億美元。我認(rèn)為在2025年和2026年,我們的成本將接近50億美元或100億美元。”
芯片支出更是一個(gè)大項(xiàng)目。據(jù)報(bào)道,英偉達(dá)的H100圖形芯片售價(jià)約為30000美元。元公司首席執(zhí)行官扎克伯格(Mark Zuckerberg)此前曾表示,公司計(jì)劃在今年年底前購(gòu)買35萬(wàn)塊H100芯片,以支持其人工智能研究工作。此外,亞馬遜公司的云計(jì)算部門以每小時(shí)約6美元的價(jià)格向客戶租用英特爾公司制造的大型主力處理器集群。
在云服務(wù)中心方面,每一座數(shù)據(jù)中心的成本都以億來(lái)計(jì)算。例如,微軟公司與阿聯(lián)酋AI公司G42宣布,雙方將合作投資10億美元在肯尼亞建設(shè)一個(gè)數(shù)據(jù)中心,投資40億歐元在法國(guó)建設(shè)AI數(shù)據(jù)中心和云基礎(chǔ)設(shè)施。過(guò)去兩年里,亞馬遜也已承諾斥資1480億美元在全球建設(shè)和運(yùn)營(yíng)數(shù)據(jù)中心,以應(yīng)對(duì)AI應(yīng)用和其他數(shù)字服務(wù)需求的激增。
總的來(lái)看,微軟在4月表示,最近一個(gè)季度的資本支出為140億美元,比去年同期增長(zhǎng)了79%,由于AI基礎(chǔ)設(shè)施投資,這些成本“大幅增加”。谷歌母公司Alphabet也表示,上一季度支出為120億美元,比去年同期增長(zhǎng)91%,并預(yù)計(jì)今年下半年的支出將“達(dá)到或超過(guò)”這一水平。與此同時(shí),Meta也上調(diào)了對(duì)今年投資的預(yù)期,目前認(rèn)為資本支出將達(dá)到350億至400億美元,在這一區(qū)間的上限將增長(zhǎng)42%。
反壟斷部門怎么看
美國(guó)艾倫人工智能研究所(AI2)高級(jí)應(yīng)用研究科學(xué)家凱爾·洛(Kyle Lo)認(rèn)為,高額的訓(xùn)練成本將把小公司排除在“開(kāi)發(fā)或研究AI模型”之外。
凱爾·洛表示,對(duì)大規(guī)模、高質(zhì)量訓(xùn)練數(shù)據(jù)集的日益重視,將把AI開(kāi)發(fā)集中在少數(shù)擁有數(shù)十億美元預(yù)算、能負(fù)擔(dān)得起獲取這些數(shù)據(jù)集的公司。合成數(shù)據(jù)或基礎(chǔ)架構(gòu)方面的重大創(chuàng)新可能會(huì)打破現(xiàn)狀,但在近些年似乎都不會(huì)出現(xiàn)。
“總的來(lái)說(shuō),管理對(duì)AI開(kāi)發(fā)潛在有用內(nèi)容的實(shí)體有動(dòng)力鎖定他們的材料!眲P爾·洛說(shuō),“隨著數(shù)據(jù)訪問(wèn)的關(guān)閉,我們基本上在為一些早期數(shù)據(jù)獲取者開(kāi)綠燈,并且撤掉梯子,其他人無(wú)法獲得數(shù)據(jù)以趕上來(lái)。”
目前,歐美英的反壟斷機(jī)構(gòu)也已經(jīng)盯上了科技巨頭在AI領(lǐng)域的地位。
例如,英國(guó)競(jìng)爭(zhēng)與市場(chǎng)管理局(CMA)在今年4月發(fā)布的報(bào)告中稱,AI基礎(chǔ)模型市場(chǎng)中主要參與者的合作關(guān)系可能通過(guò)其價(jià)值鏈加劇壟斷。5月,美國(guó)司法部(DOJ)也宣布加強(qiáng)對(duì)AI領(lǐng)域競(jìng)爭(zhēng)情況的關(guān)注。近日,美國(guó)司法部反壟斷部門主管坎特(Jonathan Kanter)表示,過(guò)去40年的反壟斷政策未能有效保護(hù)公眾利益,導(dǎo)致了少數(shù)公司對(duì)市場(chǎng)和信息流的控制。他強(qiáng)調(diào),內(nèi)容創(chuàng)作者和開(kāi)發(fā)者在當(dāng)前市場(chǎng)環(huán)境中面臨的高額費(fèi)用,在大公司增加對(duì)內(nèi)容創(chuàng)作和分發(fā)的控制時(shí)尤其如此。
當(dāng)涉及大科技公司收購(gòu)AI初創(chuàng)公司時(shí),富而德律師事務(wù)所中國(guó)反壟斷業(yè)務(wù)部主管杜寧(Ninette Dodoo)對(duì)第一財(cái)經(jīng)記者表示:“歐盟和美國(guó)的監(jiān)管機(jī)構(gòu)正越來(lái)越具有干預(yù)傾向,同時(shí)他們具備的執(zhí)法工具也有能力對(duì)所有并購(gòu)案件發(fā)起法律挑戰(zhàn)。”
金杜律師事務(wù)所合伙人吳涵律師告訴第一財(cái)經(jīng),中、美、歐在AI數(shù)字治理領(lǐng)域的監(jiān)管在一定程度上均具有共性,比如都重點(diǎn)關(guān)注AI系統(tǒng)的透明度披露、訓(xùn)練數(shù)據(jù)治理、知識(shí)產(chǎn)權(quán)保護(hù)、內(nèi)容安全與倫理等。