年初爆火的《狂飆》,劇名正暗合了AI大模型的這一年。
2月ChatGPT“帶火”O(jiān)penAI時(shí),行業(yè)還預(yù)測(cè)國(guó)內(nèi)追趕尚需時(shí)日;但轉(zhuǎn)眼的5月,一場(chǎng)聲勢(shì)浩大的“百模大戰(zhàn)”便拉開(kāi)帷幕。頭部公司爭(zhēng)先恐后,中小廠商一路追趕,生怕錯(cuò)過(guò)時(shí)代的列車(chē)。
有人說(shuō)這是人類(lèi)“科技革命的前夜”,也有人在質(zhì)疑其商業(yè)落地仍遙不可及。
這是一個(gè)注定不會(huì)寂寞的行業(yè)!芭P薪嘗膽”的谷歌“一聲長(zhǎng)嘯”,推出匹敵GPT的新模型Gemini,也將“原生多模態(tài)”定格在了這新舊交替的節(jié)點(diǎn)上。
這也是一個(gè)注定不會(huì)一帆風(fēng)順的行業(yè)。OpenAI高層“宮斗”禍起,讓這家900億美元市值的“獨(dú)角獸”秒變“草臺(tái)班子”。這讓外界得窺狂飆之下,行業(yè)內(nèi)部深層的分歧與矛盾的激化。
2024年,將是屬于大模型的一場(chǎng)歧路之旅。
分歧
在最近的一場(chǎng)論壇上,昆侖萬(wàn)維(35.800, -4.90, -12.04%)CEO方漢提出了一個(gè)頗為有趣的觀點(diǎn)——大模型行業(yè)里,小廠才有顛覆性創(chuàng)新。用他的話來(lái)說(shuō),本來(lái)就沒(méi)有用戶,沒(méi)有市場(chǎng),不如放手一搏。
持同樣觀點(diǎn)的人還有百川智能創(chuàng)始人王小川,他相信,小廠更擁有顛覆傳統(tǒng)模式的能力。而這無(wú)疑與此前行業(yè)的預(yù)判有著明顯分歧。
直到今天,市場(chǎng)上對(duì)于大模型的普遍認(rèn)知依然是——只有巨頭能夠參與的賽道。一家上海創(chuàng)投機(jī)構(gòu)的負(fù)責(zé)人就算了一筆簡(jiǎn)單的賬:“別的不說(shuō),光騰訊、字節(jié)跳動(dòng)和百度儲(chǔ)備的GPU芯片,就是上百億的資產(chǎn)。”
但歷史一再證明,科技的突破有時(shí)并不遵循行業(yè)的“普遍認(rèn)知”。就以大模型為例,早在年初方漢就對(duì)記者預(yù)言,大模型的技術(shù)架構(gòu)可能沒(méi)有想象中那么復(fù)雜!叭绻麅H僅是做出大模型的話,中國(guó)可能不需要三五年!
事實(shí)證明也是如此。一年來(lái),大模型如雨后春筍,百度、阿里、華為、京東等互聯(lián)網(wǎng)大廠重金押注,無(wú)一缺席。截至2023年10月,我國(guó)擁有10億參數(shù)規(guī)模以上大模型的廠商及高校院所共計(jì)254家,分布于20多個(gè)省市/地區(qū),國(guó)內(nèi)大模型總數(shù)達(dá)238個(gè)。
隨著行業(yè)的快速發(fā)展,分歧與爭(zhēng)議也日益增多。通用模型好還是垂類(lèi)模型好?是否商業(yè)化?如何商業(yè)化?何時(shí)商業(yè)化?誰(shuí)能率先商業(yè)化?以至于在如今一場(chǎng)接一場(chǎng)的各類(lèi)論壇中,大模型成為“逢會(huì)必談”卻也“空泛無(wú)物”的熱門(mén)話題。
11月底,在OpenAI董事會(huì)內(nèi)部上演的一場(chǎng)“權(quán)力游戲”,或許可以視為窺探如今行業(yè)深層分歧的一個(gè)契機(jī)。一方面是首席科學(xué)家對(duì)于AI安全性的高度擔(dān)憂,另一方面是CEO阿爾特(13.510, -0.28, -2.03%)曼對(duì)于AI激進(jìn)的商業(yè)化策略。
有科學(xué)家直言,人類(lèi)處于前所未有的AI威脅當(dāng)中。但與此同時(shí),大眾對(duì)大模型的感知依然停留在“聊天機(jī)器人(11.420, -0.26, -2.23%)”層面。似乎除了自動(dòng)生成廣告圖和永遠(yuǎn)看起來(lái)不怎么聰明的AI客服外,大模型眼下并沒(méi)有更好的用武之地。
“大模型行業(yè)最終99%都會(huì)死去。”相較于許多人的樂(lè)觀贊美,王小川的話在此刻顯得頗為殘酷。
關(guān)口
總體來(lái)看,國(guó)內(nèi)頭部大模型的水平大致相當(dāng)于OpenAI的GPT-3.5,距離GPT-4依然有差距。而要想實(shí)現(xiàn)技術(shù)上的突破,方漢認(rèn)為需要突破三大關(guān)口:算力、算法、數(shù)據(jù)。
最引人注目的莫過(guò)于算力之爭(zhēng)。事實(shí)上,大模型崛起的最先獲益者并非AI公司,而是芯片廠商英偉達(dá)。今年二季度,英偉達(dá)數(shù)據(jù)中心業(yè)務(wù)占比首次全面超越游戲板塊。
今年以來(lái),“算力緊張”已經(jīng)成為行業(yè)常態(tài),一張英偉達(dá)高性能顯卡價(jià)格更是“一天一價(jià)”。一位英偉達(dá)代理商告訴記者,目前國(guó)內(nèi)所有英偉達(dá)系GPU配置的算力中心都處于“滿租”狀態(tài)!爸灰酗@卡服務(wù)器來(lái),根本不愁大廠簽約!
也有業(yè)內(nèi)人士感慨:過(guò)去一年見(jiàn)了100多家客戶,只有一家自己擁有算力,其他人都沒(méi)有。大模型所需的算力緊俏程度由此可見(jiàn)一斑。
中原證券(3.730, -0.04, -1.06%)電子行業(yè)分析師鄒臣認(rèn)為,AI大模型預(yù)訓(xùn)練數(shù)據(jù)量呈指數(shù)級(jí)增長(zhǎng),算力已成為推動(dòng)數(shù)字經(jīng)濟(jì)飛速發(fā)展的新引擎。而據(jù)AMD預(yù)計(jì),2023年AI芯片市場(chǎng)的規(guī)模將達(dá)到450億美元左右,至2027年將飆升至4000億美元,2023年至2027年復(fù)合增速超過(guò)70%。
算力硬件上的短板,短期內(nèi)可以通過(guò)算法優(yōu)化加以解決,而這恰恰構(gòu)成行業(yè)發(fā)展的另一關(guān)口。
據(jù)脈脈高聘人才智庫(kù)發(fā)布的《2023泛人工智能人才洞察》顯示,今年1月到8月,新發(fā)AI崗位平均月薪超4.6萬(wàn)元,人才供需比僅為0.39,相當(dāng)于5個(gè)崗位爭(zhēng)奪2個(gè)人才。
vivo副總裁周?chē)邮苊襟w采訪時(shí)曾表示:“vivo大模型現(xiàn)在每年20億至30億元的投入成本,總投入成本已經(jīng)超過(guò)200億元,人才和數(shù)據(jù)算力各占一半,人才成本平均每人稅后100萬(wàn)元!
而具體到部分領(lǐng)域,這種人才短缺就更為明顯。商湯科技醫(yī)療板塊的相關(guān)負(fù)責(zé)人此前就告訴記者,如今跨專(zhuān)業(yè)復(fù)合學(xué)科背景的人才對(duì)于行業(yè)至關(guān)重要。
數(shù)據(jù)如今更是行業(yè)發(fā)展難以突破的“險(xiǎn)關(guān)”。且不論數(shù)據(jù)訓(xùn)練的方法是各家秘而不宣的核心機(jī)密,單數(shù)據(jù)篩選就已是巨大的挑戰(zhàn)。
高質(zhì)量的數(shù)據(jù)對(duì)大模型訓(xùn)練至關(guān)重要,天娛數(shù)科(5.890, -0.65, -9.94%)副總經(jīng)理賀晗就曾對(duì)記者表示,國(guó)內(nèi)各領(lǐng)域數(shù)據(jù)“多而不精”“壁壘森嚴(yán)”等問(wèn)題都阻礙行業(yè)發(fā)展。網(wǎng)易伏羲工程機(jī)械產(chǎn)品負(fù)責(zé)人楊新偉也直言:“工業(yè)領(lǐng)域高質(zhì)量數(shù)據(jù)太少!
落地
今年年初OpenAI真正引爆市場(chǎng)的關(guān)鍵,在于ChatGPT成為史上用戶數(shù)破億最快的應(yīng)用。這讓資本看到了商業(yè)落地的可能性。經(jīng)過(guò)一年發(fā)展,如今全球頭部的大模型都開(kāi)始進(jìn)入商業(yè)化落地的環(huán)節(jié)。
今年下半年,國(guó)內(nèi)大模型的商業(yè)布局落地速度也顯著加快。12月22日,在全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)人工智能分委會(huì)全體會(huì)議上,百度、騰訊、阿里的大模型首批通過(guò)大模型標(biāo)準(zhǔn)符合性測(cè)試,標(biāo)志著在商業(yè)落地上,國(guó)產(chǎn)大模型又邁出重要一步。
據(jù)百度負(fù)責(zé)人介紹,今年以來(lái),文心大模型保持快速迭代,5月升級(jí)至3.5版本,10月再次迭代至4.0版本,其理解、生成、邏輯、記憶四大能力顯著提升。同時(shí),通過(guò)飛槳與文心的協(xié)同優(yōu)化,模型周均訓(xùn)練有效率超過(guò)98%,訓(xùn)練算法效率提升3.6倍。
在商業(yè)方面,百度文心一言負(fù)責(zé)人王海峰日前透露,文心一言用戶規(guī),F(xiàn)已達(dá)到7000萬(wàn),場(chǎng)景4300個(gè)。不過(guò)王海峰并未具體介紹如今文心一言具體的營(yíng)收情況。
面向商業(yè)化場(chǎng)景的華為盤(pán)古大模型,在年末也有新動(dòng)作。在12月的活動(dòng)上,華為方面透露,目前有7家創(chuàng)業(yè)公司與華為云簽署合作協(xié)議。未來(lái)華為云將與簽約企業(yè)繼續(xù)基于昇騰AI云服務(wù)和盤(pán)古大模型進(jìn)行聯(lián)合創(chuàng)新,一派生態(tài)圖景已然徐徐展開(kāi)。
不過(guò)記者也注意到,除了百度之外,目前其他大模型廠商大都未向外界披露具體用戶的情況,且很多大模型均為垂類(lèi)模型,僅對(duì)特定的用戶開(kāi)放。
投融資活躍度是檢驗(yàn)市場(chǎng)對(duì)于商業(yè)化落地情緒的最好指標(biāo)。數(shù)據(jù)顯示,今年中國(guó)AI領(lǐng)域融資214億元,百川智能、Minimax和智譜AI三家公司在資本市場(chǎng)尤為受歡迎,融資額占比超過(guò)30%。
但除了三家頭部企業(yè),其他初創(chuàng)公司的融資情況可能并非那么樂(lè)觀。
據(jù)第三方數(shù)據(jù)機(jī)構(gòu)企名片數(shù)據(jù)顯示,今年國(guó)內(nèi)共有26家大模型初創(chuàng)公司拿到融資,基本是種子輪或天使輪。相比于“雷聲滾滾”的論壇會(huì)場(chǎng),市場(chǎng)上真金白銀的“雨點(diǎn)”就略顯稀少。
有創(chuàng)業(yè)者發(fā)現(xiàn),如今市場(chǎng)對(duì)于大模型項(xiàng)目的市場(chǎng)需求、技術(shù)實(shí)力、商業(yè)模式以及團(tuán)隊(duì)能力等方面的情況會(huì)有更多考量。換言之,能否在短期內(nèi)商業(yè)化賺到錢(qián)成為重要的指標(biāo)。顯然,在如今的大環(huán)境下,投資市場(chǎng)也變得異常謹(jǐn)慎。
“目前大家需要承認(rèn)的是,大模型說(shuō)了半天,但落地并不是很理想。”瀾舟科技創(chuàng)始人兼CEO周明說(shuō)道,“我認(rèn)為過(guò)去一年大家在醞釀情緒,找對(duì)接口,明年可能是爆發(fā)點(diǎn)!币灿性S多投資者認(rèn)為,盡管大模型市場(chǎng)曾有不少奇跡,但明年這個(gè)市場(chǎng)最大的可能性,依然屬于頭部廠商。