每日經濟新聞 2023-06-22 15:12:53
◎ RoboCat智能體(ti)更具“通(tong)用性”,并可(ke)實現自我改進、自我提(ti)升,為創造通(tong)用機(ji)器(qi)人(ren)奠定了重要(yao)一步。
每經(jing)記者|蔡鼎 每經(jing)編輯(ji)|蘭(lan)素英
機器人正迅速成為我們日常生活的一部分,但它們通常只用于特定任務。雖然人工智能領域的最新進展可以使機器人在許多方面發揮作用,但全球在通用機器人制造方面的進展仍然較慢,部分原因是收集真實世界的訓練數據需要大量的時間。近日,谷歌(ge)旗(qi)下(xia)AI團(tuan)隊DeepMind的最新研究(jiu)或可解(jie)決該領域(yu)面(mian)臨的這(zhe)一“痛點”。
美東時間6月20日,DeepMind展示了用于機器人的AI智能體RoboCat。DeepMind稱其為全球首個能解決和適應多重任務的智能體。更(geng)重要的(de)(de)是(shi),RoboCat是(shi)一個可(ke)以自我改(gai)進(jin)(jin)的(de)(de)AI代理,其(qi)可(ke)以操作不(bu)同的(de)(de)機械臂,而且只(zhi)需最少100次(ci)演示即可(ke)解決(jue)任務(wu),并從其(qi)自生成的(de)(de)數據中進(jin)(jin)行改(gai)進(jin)(jin)。
谷歌旗下(xia)AI團(tuan)隊DeepMind的最新論文介紹了一種能夠進行自我改進的AI代理,本質上是由(you)AI賦能的軟件程序,相當于機器人(ren)的“大腦”,由(you)其(qi)加(jia)持(chi)的機器人(ren)與傳統(tong)機器人(ren)不同(tong)之(zhi)處(chu)在于,RoboCat更具“通用性”,并(bing)可(ke)實現自我改進、自我提升。
圖片來源:DeepMind截圖
DeepMind在之前的研究中探索了如何開發支持大規模學習多任務的機器人,并將語言模型理解與輔助機器人的現實世界能力相結合。這個名為RoboCat的機器人智能體是全球首個能解決和適應多重任務的AI智能體,能夠學習在不同的機械臂上執行各種(zhong)任務,然后自我生成(cheng)新(xin)的訓練數據(ju)來對(dui)其(qi)進行改進。
RoboCat的(de)學習速(su)度(du)比其他先進(jin)模型快(kuai)得多——只需要通過100次左(zuo)右的(de)演(yan)示,RoboCat就可(ke)以學會(hui)操控(kong)機(ji)械臂(bei)來完成各式各樣的(de)任務,然后通過自生成的(de)數(shu)據(ju)來進(jin)行(xing)迭(die)代改(gai)進(jin)。這種能(neng)力(li)將有助(zhu)于加速(su)機(ji)器人(ren)研究,因為(wei)這減少了對人(ren)類監督訓練的(de)需求,也是創造通用機(ji)器人(ren)的(de)重要一步。
DeepMind的研究科學家、RoboCat團隊的共同作者Alex Lee表示,“我們證明,一個大模型可以解決多個真實機器人承載的各種任務,并能迅速適應新的任務。”
據DeepMind,RoboCat基于其多模態模型Gato(西班牙語“貓”的意思),它可以在模擬和物理環境中處理語言、圖像和動作。DeepMind將Gato的架構與一個大型訓練數據集結合并起來,該數據集由各種機器人手臂的圖像序列和動作組成,可以解決數百種任務。
在DeepMind演示視頻中,RoboCat已經可以通過自主學習操控機械臂,完成“套圈”“搭積木”“抓水果”等任務。這些任務看似簡單,但考驗了機械臂操作的精準度、理解力以及對于形狀匹配難題的解決能力。目前RoboCat完成一項新任務的成功率已經在初期36%的基礎上提升了一倍。
圖(tu)片來(lai)源:DeepMind截圖(tu)
基于原始數據集和新訓練產生的數據,RoboCat的數據集將包含數百萬次的訓練軌跡數據。它學習的新任務越多,它就能更好地學習和解決額外的新任務。DeepMind的論文認為,執行任務成功率的大幅提升,是由于RoboCat的經驗越來越豐富,就像人們在特定領域加深學習時發展出更多樣化的技能一樣。RoboCat獨立學習技能和快速自我完善的能力,特別是當應用于不同機器人設備時,將有助于為未來的研究鋪平道路。
圖片來源:DeepMind截圖
《每日經濟新聞(wen)》記(ji)者注意到,目前在機器人(ren)領域,包括特斯拉、谷歌、亞馬(ma)遜(xun)、英偉達(da)、騰訊等巨頭已經有所(suo)布局。然而,正(zheng)如(ru)DeepMind上述論(lun)文指出,由于訓練機器人(ren)需要大量(liang)的(de)(de)時間,因(yin)此智能化(hua)水(shui)平仍不足(zu),難以實現大規(gui)模的(de)(de)商業(ye)化(hua)。而RoboCat的(de)(de)問世或(huo)許能解決這(zhe)一(yi)“痛(tong)點(dian)”。
其實,DeepMind的RoboCat只是AI賦能機器人的主要案例之一。今年以來,已經有數家公司將語言模型運用到了機器人上:2023年(nian)年(nian)初,谷歌推出視(shi)覺語言模(mo)型PaLM-E,并運用到(dao)工(gong)(gong)業機器人上;4月(yue)(yue),阿里巴巴將千問大模(mo)型接入工(gong)(gong)業機器人;5月(yue)(yue),特斯拉人形(xing)機器人Optimus展示了精準的控制、感(gan)知能(neng)力,同(tong)月(yue)(yue),英偉達(da)發布全新自主移動機器人平臺。
得益于此,人(ren)工智能加(jia)持的機器人(ren)化身(shen)具身(shen)智能(Embodied Intelligence)吸(xi)引了全球的廣(guang)泛關(guan)注。
馬斯(si)克在特(te)(te)斯(si)拉2023年股(gu)東大(da)會(hui)上便表示(shi),人(ren)形機(ji)(ji)器人(ren)將(jiang)是今后特(te)(te)斯(si)拉主(zhu)要的(de)長期價值(zhi)來源(yuan),“如果人(ren)形機(ji)(ji)器人(ren)和人(ren)的(de)比例是2比1左右(you),那(nei)么人(ren)們對機(ji)(ji)器人(ren)的(de)需(xu)求(qiu)量可能(neng)是100億乃(nai)至200億個,遠(yuan)超電動車(che)的(de)數量”。英偉達創始人(ren)黃仁勛在ITF World 2023半導(dao)體大(da)會(hui)上也(ye)表示(shi),AI下一個浪潮將(jiang)是“具身智能(neng)”。
圖(tu)片來源:東吳證券研報截圖(tu)
東吳證券研報指出,具身智能首先需要聽懂人類語言,分解任務、規劃子任務,移動中識別物體,與環境交互,最終完成任務。東吳證券認為人形機器人很好地契合了具身智能的要求,有望成為標桿應用。“機器(qi)人研究的關鍵在于讓機器(qi)人適應人類(lei)環境,最終走進(jin)千(qian)家(jia)萬(wan)戶的生活(huo)(工業(ye)、餐飲、醫(yi)療(liao)等多領域)。人形(xing)機器(qi)人有(you)望率先在B端(duan)上(shang)量,最終打開C端(duan)市場。遠(yuan)期市場空間(jian)可觀。”
東吳證券預(yu)計(ji),2035年(nian),假設(she)人形機(ji)器人價格為(wei)20萬(wan)(wan)元(yuan),且照顧、陪伴功能分(fen)別為(wei)美(mei)國/歐洲(zhou)/亞洲(zhou)市場(chang)(chang)(chang)累計(ji)新增了5%/7%/4%的(de)(de)滲(shen)透(tou)率(lv),即(ji)單年(nian)滲(shen)透(tou)率(lv)分(fen)別為(wei)1%/1.4%/0.8%。在較(jiao)悲觀/中性/較(jiao)樂(le)觀的(de)(de)場(chang)(chang)(chang)景(jing)中,家庭(ting)場(chang)(chang)(chang)景(jing)的(de)(de)市場(chang)(chang)(chang)規(gui)模將分(fen)別達到3.00萬(wan)(wan)億/3.66萬(wan)(wan)億/4.26萬(wan)(wan)億元(yuan)。
封面圖片來源:視覺中國-VCG41N1356593648
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日(ri)經濟(ji)新聞》報社授權,嚴禁轉(zhuan)載(zai)或(huo)鏡像,違者必究。
讀者熱線:4008890008
特別(bie)提醒(xing):如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您(nin)不希望作品出現在本站(zhan),可聯系我們要求撤下您(nin)的作品。
歡迎(ying)關(guan)注每日經濟新聞APP