背靠智能語音助手,大模型在手機上的競爭已經開始。
在華為開發(fā)者大會2024上,華為相關負責人介紹了智能語音助手小藝接入盤古大模型能力后的表現(xiàn)。小藝可以與用戶語音交互,進行手機應用間的協(xié)作,減少了此前業(yè)內語音助手普遍具有的機械感。這與蘋果語音助手Siri將進行的更新頗有相似之處。
蘋果此前已在WWDC開發(fā)者大會上推出了與AI相關的更新,包括推出Apple Intelligence套件,該套件深度整合進蘋果產品中,可設置置頂推送等功能,適用于搭載A17 Pro芯片的手機和搭載M系列芯片的設備。蘋果還與OpenAI合作,蘋果將采用GPT-4o,蘋果用戶在不創(chuàng)建賬戶的情況下可免費使用ChatGPT。
AI時代的手機范式,已經在用戶端展示出了冰山一角,而在蘋果Siri“換腦”接入GPT ,華為小藝靠盤古能扳回一局嗎?
蘋果之后又一個智能語音助手更新
華為開發(fā)者大會2024上,華為常務董事、終端BG董事長、智能汽車解決方案BU董事長余承東回顧了華為在端側AI方面的布局,包括2017年發(fā)布的搭載麒麟芯片的Mate 10手機在業(yè)界首次支持mobile(移動)AI。一開始,手機AI功能包括相機拍照增強和AI翻譯等,后續(xù)華為走向個人終端AI化,支持語音、視頻等能力,近兩年隨著產業(yè)進入大模型時代,小藝搭載的大模型變得更強大。
大模型基礎能力上,華為常務董事、華為云CEO張平安發(fā)布了盤古大模型5.0,包括面向跨領域多任務場景的萬億級參數(shù)Pangu S系列,適用于處理復雜任務的千億級參數(shù)Pangu U系列,面向低時延、低成本推理場景的百億級參數(shù)Pangu P系列以及支撐手機、PC等端側智能應用的十億級參數(shù)Pangu E系列。華為云盤古大模型聚焦行業(yè)應用,手機是應用領域之一,小藝背后有盤古大模型5.0能力支撐。
大模型能力支撐下,小藝記憶能力有所增強,支持23類常用記憶類型,可以基于記憶自動填寫各種表格。此外,小藝也有更高的推理規(guī)劃能力,掌握萬億token的知識量。華為此次介紹的小藝功能,則與蘋果Siri將推出的新功能頗有相似性。
小藝的功能包括,可識別和處理文字、圖片等素材,例如一鍵生成表格、摘要、創(chuàng)建日程等。同時,小藝可在不同應用間協(xié)作。例如,收到一個團建郵件后可以跟小藝說導航去這個地方,而不需重復說目的地,小藝便可規(guī)劃路線。跟小藝說將某日的日程安排短信發(fā)給某人,小藝就會從日歷中調取相應安排并發(fā)送短信,而不需人為查詢操作。
蘋果此前推出Apple Intelligence個人智能系統(tǒng)并更新Siri功能,Siri也有相似的多模態(tài)能力,包括根據(jù)用戶描述搜索圖片并從圖片中提取相應信息。蘋果此前重點介紹的Siri功能也包括不同應用間協(xié)作和上下文理解能力。例如,當用戶詢問某地天氣后可要求Siri為該地的活動設置日程,而無需再強調地點,當朋友發(fā)來地址時,可直接要求Siri將地址加入朋友名片。
蘋果和華為先后推出更新,或意味著這種與語音助手更自然的交互方式,以及語音助手對應用程序的調度能力,將是大模型給手機帶來的最主要改變之一。此外,蘋果和華為都以幾十億參數(shù)級別的大模型支持端側AI應用,一定程度上避開數(shù)據(jù)上傳至外部服務器或公有云上的隱私泄露隱患。
據(jù)蘋果此前發(fā)布的大模型技術文檔,Apple Intelligence包含一個約30億參數(shù)的端側模型和一個云端模型,后者通過私有云計算并在Apple芯片服務器上運行,而不在公有云上。華為Pangu E系列也是十億級參數(shù)大模型,鴻蒙原生智能采用模型本地化的方式,不讓敏感數(shù)據(jù)上云。記者從手機業(yè)內人士了解到,考慮到端側算力,目前適合在手機端側運行的大模型正是在幾十億參數(shù)級別。
手機端側AI是否有其他可能
除了通過本地部署模型支持語音助手等功能外,大模型在手機上應用的其他路徑,似乎并未十分清晰。
除了在本地運行的端側大模型,此前蘋果還宣布iPhone將接入ChatGPT。ChatGPT由OpenAI開發(fā),微軟則是OpenAI的云供應商。在用戶同意的情況下,ChatGPT可接入Siri,為用戶提供問答等服務,蘋果承諾使用ChatGPT時用戶請求和信息不會被記錄。但外界對此做法并不都持贊許態(tài)度。特斯拉CEO馬斯克便質疑用戶將數(shù)據(jù)交給蘋果的隱私風險,認為蘋果將用戶數(shù)據(jù)交給第三方人工智能公司的做法沒有保護用戶隱私。
是否接入第三方人工智能公司在外部服務器上運行的大模型,這可能是手機廠商面臨的一個難題。如果不接入外部大模型,本地運行的模型能力始終有限。而如果讓手機廠商自研能力能與ChatGPT最先進版本媲美的大參數(shù)模型并讓大模型在私有云上運行,似乎也不太現(xiàn)實。
目前手機廠商對于端側AI應用形態(tài)還在探索中。一名國內手機行業(yè)從業(yè)者告訴記者,公司正在研發(fā)大模型,但自研大模型還不能很快滿足所有業(yè)務需求,其所在的部門正在嘗試與外部大模型廠商合作,要求將外部閉源大模型運行在公司自有的服務器上,避免用戶數(shù)據(jù)泄露。
另有海外手機品牌員工告訴記者,公司自研的大模型偏重端側使用體驗,與外部大模型公司的側重點不同。為了有更豐富的AI體驗,未來接入外部公司的大模型是可能的,可能會以智能體的形式體現(xiàn),但與外部大模型公司合作的模式目前還在摸索階段。
除蘋果和華為,目前主要手機廠商也在發(fā)力端側AI。去年11月,vivo發(fā)布自研通用大模型矩陣藍心大模型,包含十億、百億、千億三個參數(shù)量級。今年1月,榮耀Magic6系列旗艦手機搭載榮耀自研70億參數(shù)端側平臺級AI大模型“魔法大模型”。今年5月,小米大語言模型MiLM通過大模型備案,將逐步應用于小米汽車、手機、智能家居等產品。
據(jù)市場研究機構Canalys預測,今年AI 手機出貨量預計占全球智能手機出貨量的16%,2028年這一比例預計為54%。