首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|低空經(jīng)濟|智能汽車|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片|報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 人工智能 >> 正文

AI迎來轉折點:谷歌Gemini 2.0會成為自主AI的開始嗎?

2024年12月13日 07:13  新浪科技  

北京時間12月12日晚間消息,谷歌今日發(fā)布了新一代AI大模型Gemini 2.0,標志著向能夠獨立完成復雜任務的AI系統(tǒng)邁出了雄心勃勃的一步。同時,Gemini 2.0還引入了原生圖像生成和多語言音頻功能,使得谷歌在日益激烈的AI競爭中與OpenAI和Anthropic展開直接競爭。

新版本的發(fā)布正值谷歌首次推出Gemini的一年后,也正處于AI開發(fā)的關鍵時刻。這些新的“代理”AI系統(tǒng)不僅可以響應查詢,還可以理解微妙的上下文,提前規(guī)劃多個步驟,并代表用戶采取受監(jiān)督行動。

谷歌的新AI助手將如何重塑日常數(shù)字生活?

在最近的一次新聞發(fā)布會上,Gemini產(chǎn)品管理總監(jiān)Tulsee Doshi概述了該系統(tǒng)的增強功能,同時展示了實時圖像生成和多語言對話。Doshi解釋說:“Gemini 2.0帶來了增強的性能和新的功能,如原生圖像和多語言音頻生成。它還具有原生智能工具的使用,這意味著它可以直接訪問谷歌產(chǎn)品,如搜索,甚至執(zhí)行代碼。”

最初的版本以Gemini 2.0 Flash為中心,這是一個實驗版本,谷歌聲稱其運行速度是其前身的兩倍,同時超越了一些強大模型的功能。這代表著一項重大的技術成就,因為之前的速度提升通常是以降低功能為代價的。

走進新一代AI代理

也許最重要的是,谷歌推出了三個基于Gemini 2.0架構的原型AI代理,展示了該公司對AI未來的愿景。Project Astra是一款升級后的通用AI助手,展示了它在訪問谷歌工具和維護先前交互的上下文記憶的同時,能夠跨多種語言保持復雜對話的能力。

谷歌DeepMind團隊產(chǎn)品經(jīng)理Bibo Xu在現(xiàn)場演示中解釋說:“Project Astra現(xiàn)在有長達10分鐘的會話記憶,可以記住你過去與它的對話,這樣你就可以獲得更有用、更個性化的體驗!

該系統(tǒng)可以在各語言之間平穩(wěn)過渡,并通過谷歌搜索和地圖訪問實時信息,顯示出了以前在消費者AI產(chǎn)品中看不到的整合水平。

企業(yè)AI之戰(zhàn)愈演愈烈

對于開發(fā)人員和企業(yè)客戶,谷歌推出了Project Mariner和Jules,這兩款專門的AI代理旨在自動化復雜的技術任務。作為Chrome擴展程序演示的Project Mariner,在WebVoyager基準測試中實現(xiàn)了令人印象深刻的83.5%的成功率,這比之前的自主Web導航嘗試有了顯著改進。該WebVoyager基準主要測試代理在端到端、真實世界的Web任務上的性能。

Google Labs產(chǎn)品管理總監(jiān)Jaclyn Konzelmann表示:“ Project Mariner是一個早期的研究原型,它探索了瀏覽網(wǎng)頁和采取行動的代理能力。當使用WebVoyager基準進行評估時,Project Mariner取得了83.5%的令人印象深刻的成功率!

定制硅:谷歌AI雄心背后的基礎設施

支持這些進步的是Trillium,谷歌的第六代Tensor Processing Unit (TPU),如今已普遍可供云客戶使用。定制的AI加速器代表了對計算基礎設施的巨大投資,谷歌在單個網(wǎng)絡結構中部署了超過10萬個Trillium芯片。

谷歌AI工作室和Gemini API團隊的產(chǎn)品經(jīng)理Logan Kilpatrick在新聞發(fā)布會上強調(diào)了這項基礎設施投資的實際影響。Kilpatrick說:“閃存使用量的增長超過了900%,這令人難以置信。你知道,在過去的幾個月里,我們已經(jīng)推出了六個實驗模型,現(xiàn)在有數(shù)百萬開發(fā)人員在使用Gemini!

未來之路:自主AI時代的安全問題和競爭

谷歌向自主代理的轉變,可能是自OpenAI發(fā)布ChatGPT以來AI領域最重要的戰(zhàn)略轉折點。雖然競爭對手一直專注于增強大型語言模型的能力,但谷歌認為,未來屬于能夠主動導航數(shù)字環(huán)境、并在最少的人為干預下完成復雜任務的AI系統(tǒng)。

這種能夠思考、計劃和行動的AI代理的愿景,代表著與當前響應式AI助理模式的背離。這是一個有風險的賭注,因為自主系統(tǒng)可能帶來更大的安全問題和技術挑戰(zhàn)。但如果成功,它可能會重塑競爭格局。谷歌在定制硅和基礎設施方面的大規(guī)模投資表明,該公司準備在這個新方向上積極競爭。

然而,向更自主的AI系統(tǒng)的過渡引發(fā)了新的安全和倫理問題。谷歌強調(diào)了其對負責任開發(fā)的承諾,包括與值得信賴的用戶進行廣泛的測試和內(nèi)置的安全措施。谷歌還逐步推出這些功能的方法,從開發(fā)人員訪問和值得信賴的測試人員開始,表明了對部署自主AI系統(tǒng)所涉及的潛在風險的認識。

此次Gemini 2.0的發(fā)布正值谷歌面臨競爭對手日益增加的壓力和對AI安全的嚴格審查的關鍵時刻。微軟和OpenAI今年在AI開發(fā)方面取得了重大進展,而Anthropic等其他公司也在企業(yè)客戶中獲得了吸引力。

谷歌Gemini API集團產(chǎn)品經(jīng)理Shrestha Basu Mallick在新聞發(fā)布會上強調(diào):“我們堅信,構建AI的唯一方法是從一開始就負責任。隨著我們推進模型和代理,我們將繼續(xù)優(yōu)先考慮將安全和責任作為模型開發(fā)過程的關鍵要素!

隨著這些系統(tǒng)在現(xiàn)實世界中采取行動的能力越來越強,它們可以從根本上重塑人們與技術的互動方式。Gemini 2.0的成功不僅可以決定谷歌在AI市場的地位,還可以決定隨著行業(yè)向更自主的系統(tǒng)發(fā)展,AI發(fā)展的更廣泛軌跡。

一年前,當谷歌推出Gemini的第一個版本時,AI領域主要由聊天機器人(21.990, -0.01, -0.05%)主導,這些機器人可以進行聰明的對話,但在現(xiàn)實世界的任務中卻舉步維艱。現(xiàn)在,隨著AI代理開始朝著自主性邁出第一步,該行業(yè)正處于另一個轉折點。問題不再是AI是否能理解我們,而是我們是否準備好讓AI代表我們行事。谷歌正在押注,而且賭注很大。

編 輯:章芳
飛象網(wǎng)版權及免責聲明:
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權所有,未經(jīng)允許禁止轉載、摘編及鏡像,違者必究。對于經(jīng)過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責。
3.如因作品內(nèi)容、版權和其它問題,請在相關作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
中國移動王曉云:6G已經(jīng)進入面向產(chǎn)業(yè)技術創(chuàng)新的全新階段
精彩專題
2024數(shù)字科技生態(tài)大會
2024年度中國光電纜優(yōu)質(zhì)供應商評選活動
2024全球6G發(fā)展大會
近期最熱門AI手機新品大盤點
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉載、摘編、復制、鏡像