首頁(yè)|必讀|視頻|專(zhuān)訪|運(yùn)營(yíng)|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機(jī)|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計(jì)算|芯片報(bào)告|智慧城市|移動(dòng)互聯(lián)網(wǎng)|會(huì)展
首頁(yè) >> 應(yīng)用 >> 正文

使用 GPT-3 模型,研究人員研發(fā)出能聽(tīng)懂英語(yǔ)指令并執(zhí)行家務(wù)的機(jī)器人

2023年5月15日 09:59  IT之家  作 者:遠(yuǎn)洋

普林斯頓大學(xué)、斯坦福大學(xué)和谷歌的一組研究人員,利用 OpenAI 的 GPT-3 Davinci 模型,研發(fā)出了一款能聽(tīng)懂英語(yǔ)指令并執(zhí)行家務(wù)的機(jī)器人,名為 TidyBot。這款機(jī)器人可以根據(jù)用戶的喜好,自動(dòng)完成如分類(lèi)洗衣服、撿起地上的垃圾、收拾玩具等任務(wù)。

GPT-3 Davinci 模型是一種深度學(xué)習(xí)模型,屬于 GPT 模型系列的一部分,可以理解和生成自然語(yǔ)言。該模型具有強(qiáng)大的總結(jié)能力,可以從大量的文本數(shù)據(jù)中學(xué)習(xí)復(fù)雜的對(duì)象屬性和關(guān)系。研究人員利用這種能力,讓機(jī)器人根據(jù)用戶提供的幾個(gè)示例對(duì)象放置位置,如“黃色襯衫放在抽屜里,深紫色襯衫放在衣柜里,白色襪子放在抽屜里”,然后讓模型總結(jié)出用戶的一般偏好規(guī)則,并應(yīng)用到未來(lái)的交互中。

研究人員在論文中寫(xiě)道:“我們的基本見(jiàn)解是,LLM(大型語(yǔ)言模型)的總結(jié)能力與個(gè)性化機(jī)器人的泛化需求非常匹配。LLM 展示了通過(guò)總結(jié)實(shí)現(xiàn)泛化的驚人能力,利用從海量文本數(shù)據(jù)集中學(xué)習(xí)到的復(fù)雜對(duì)象屬性和關(guān)系!

他們還寫(xiě)道:“與需要昂貴的數(shù)據(jù)收集和模型訓(xùn)練的傳統(tǒng)方法不同,我們展示了 LLM 可以直接開(kāi)箱即用地實(shí)現(xiàn)機(jī)器人領(lǐng)域的泛化,利用它們從海量文本數(shù)據(jù)中學(xué)習(xí)到的強(qiáng)大的總結(jié)能力!

研究人員在論文網(wǎng)站上展示了一個(gè)機(jī)器人,它能夠?qū)⑾匆路譃闇\色和深色,回收飲料罐,扔掉垃圾,收拾包和餐具,將散落的物品放回原處,并將玩具放入抽屜。

研究人員首先測(cè)試了一個(gè)基于文本的基準(zhǔn)數(shù)據(jù)集,其中輸入了用戶偏好,并要求模型創(chuàng)建個(gè)性化規(guī)則來(lái)確定物品歸屬。模型將示例總結(jié)為一般規(guī)則,并使用總結(jié)來(lái)確定新物品的放置位置;鶞(zhǔn)場(chǎng)景定義在四個(gè)房間中,每個(gè)房間有 24 個(gè)場(chǎng)景。每個(gè)場(chǎng)景包含兩到五個(gè)放置物品的地方,并且有相同數(shù)量的已見(jiàn)和未見(jiàn)物品供模型分類(lèi)。他們寫(xiě)道,這個(gè)測(cè)試在未見(jiàn)物品上達(dá)到了 91.2% 的準(zhǔn)確率。

當(dāng)他們將這種方法應(yīng)用到真實(shí)世界的機(jī)器人 TidyBot 時(shí),他們發(fā)現(xiàn)它能夠成功地收拾 85% 的物體。TidyBot 在八個(gè)真實(shí)場(chǎng)景中進(jìn)行了測(cè)試,每個(gè)場(chǎng)景有一組十個(gè)物品,并在每個(gè)場(chǎng)景中運(yùn)行機(jī)器人 3 次。據(jù)IT之家了解,除了 LLM,TidyBot 還使用了一個(gè)叫做 CLIP 的圖像分類(lèi)器和一個(gè)叫做 OWL-ViT 的物體檢測(cè)器。

佐治亞理工學(xué)院交互計(jì)算學(xué)院的助理教授徐丹飛(Danfei Xu)在談到谷歌的 PaLM-E 模型時(shí)表示,LLM 使機(jī)器人具有更多的問(wèn)題解決能力!耙郧暗娜蝿(wù)規(guī)劃系統(tǒng)大多依賴(lài)于一些形式的搜索或優(yōu)化算法,這些算法不太靈活,也很難構(gòu)建。LLM 和多模態(tài) LLM 使這些系統(tǒng)能夠從互聯(lián)網(wǎng)規(guī)模的數(shù)據(jù)中受益,并輕松地用于解決新問(wèn)題!彼f(shuō)。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問(wèn)題,請(qǐng)?jiān)?0日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張?jiān)泼鳎捍蟛糠謬?guó)家新劃分了中頻段6G頻譜資源
精彩專(zhuān)題
專(zhuān)題丨“汛”速出動(dòng) 共筑信息保障堤壩
2023MWC上海世界移動(dòng)通信大會(huì)
中國(guó)5G商用四周年
2023年中國(guó)國(guó)際信息通信展覽會(huì)
CCTIME推薦
關(guān)于我們 | 廣告報(bào)價(jià) | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號(hào)-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證080234號(hào) 京公網(wǎng)安備110105000771號(hào)
公司名稱(chēng): 北京飛象互動(dòng)文化傳媒有限公司
未經(jīng)書(shū)面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像