每日經濟新聞 2024-05-16 10:59:55
◎預想(xiang)之中圍繞AI搜索的戰爭沒有打(da)響,焦(jiao)點轉移到(dao)了(le)AI智能助手上。
每經記(ji)者|可(ke)楊 每經編輯|張海妮
不(bu)是萬眾期(qi)待的AI搜索,競爭焦點突然轉(zhuan)向了AI智(zhi)能助(zhu)手。
近期(qi),OpenAI推出了全(quan)能(neng)模型GPT-4o,它能(neng)夠(gou)接受多種輸入并(bing)生成相應的輸出,展(zhan)示了毫秒級反應和(he)多模態交(jiao)互的新(xin)能(neng)力。與此同時,谷(gu)歌在其(qi)I/O開(kai)發者大(da)會(hui)上展(zhan)示了其(qi)AI助手Astra和(he)旗艦大(da)模型Gemini。
一些業內(nei)人士認為,OpenAI此(ci)次并沒有達到預期的(de)(de)突破,而(er)是將現有的(de)(de)技術進行了整合。此(ci)外,谷(gu)歌在(zai)(zai)AI搜索領域的(de)(de)布局和創新,以及其(qi)在(zai)(zai)智能手機(ji)操作系統的(de)(de)優(you)化上(shang)的(de)(de)努(nu)力(li),顯示了其(qi)在(zai)(zai)AI領域的(de)(de)深厚積累和戰略布局。
比賽(sai)行至白熱化階段(duan),似(si)乎已經(jing)告(gao)別(bie)了單純的技術競爭(zheng),更(geng)是應用(yong)和用(yong)戶體驗(yan)的競爭(zheng)。當影響因素變(bian)得復雜,專注投(tou)入大模(mo)型前沿的OpenAI還有多大幾率(lv)成為贏家?
預想(xiang)之中(zhong)圍繞AI搜索的戰(zhan)爭(zheng)沒有(you)打響,焦(jiao)點轉移到(dao)了AI智能(neng)助手上。
當地時間5月13日,OpenAI在谷歌I/O大會(hui)的(de)前一(yi)天召開發布(bu)會(hui),發布(bu)了最新產品GPT-4o,“o”即Omni,意為“全能”。OpenAI官網介紹,GPT-4o是邁向更自然人機交互的(de)一(yi)步,因為它接受文(wen)本、音(yin)頻(pin)和(he)圖(tu)像(xiang)的(de)任(ren)意組合(he)作(zuo)為輸(shu)入內容,并生(sheng)成文(wen)本、音(yin)頻(pin)和(he)圖(tu)像(xiang)的(de)任(ren)意組合(he)輸(shu)出內容。
OpenAI首席技術官米拉(la)·穆(mu)拉(la)蒂(di)在發布會上表示,GPT-4o的速度比現有的GPT-4Turbo快了兩倍,但成(cheng)本(ben)(ben)僅為其一(yi)半(ban)。GPT-4o可(ke)以實(shi)時對文本(ben)(ben)、音頻和圖像進(jin)行推理,響應時間幾乎達到人類水平(ping)。
在26分鐘的直(zhi)播中,GPT-4o展示了其毫秒(miao)級反應、識(shi)別人類情(qing)緒進行音(yin)視頻交互,可多模態輸(shu)入/輸(shu)出(chu)等一系列新能力。與此同時,GPT-4o覆蓋(gai)桌面(mian)與APP且完(wan)全免(mian)費向用(yong)戶提供。
而谷歌則在(zai)其I/O開發者大(da)會(hui)上(shang),展(zhan)示(shi)了(le)自(zi)己(ji)全能的(de)AI能力。在(zai)會(hui)上(shang)連續發布、更新了(le)十多款產品(pin),包括(kuo)AI助手Astra、文(wen)(wen)生(sheng)圖模型Imagen3、對(dui)標Sora的(de)文(wen)(wen)生(sheng)視頻模型Veo,以及旗艦大(da)模型Gemini。
在谷(gu)歌的(de)演示視頻(pin)中(zhong),使(shi)用(yong)AI助手(shou)Astra時,只(zhi)要打開手(shou)機攝(she)像頭,對準任(ren)意(yi)物(wu)品,AI可(ke)(ke)(ke)以準確說出物(wu)品的(de)名(ming)稱。只(zhi)要將手(shou)機攝(she)像頭對準某個物(wu)體,Gemini就可(ke)(ke)(ke)以識別它,比如(ru)一個紅蘋(pin)果,還可(ke)(ke)(ke)以回答諸(zhu)如(ru)“鏡頭中(zhong)什(shen)么東西是可(ke)(ke)(ke)以發聲的(de)”這種問題。
此(ci)外(wai),谷歌方(fang)面表示,夏(xia)季將(jiang)擴展Gemini的(de)多(duo)模態功能(neng),包括增加(jia)用語音進行深入(ru)雙(shuang)向對(dui)話的(de)能(neng)力,該功能(neng)被稱為(wei)Live。通過GeminiLive,用戶可(ke)以與Gemini交談,并(bing)可(ke)以從各種自(zi)然的(de)聲(sheng)音中(zhong)選(xuan)擇它(ta)回(hui)應的(de)聲(sheng)音。用戶甚至可(ke)以按(an)照自(zi)己(ji)的(de)節奏(zou)說話,或者在(zai)回(hui)答過程中(zhong)打斷并(bing)澄清問題,就像在(zai)任何人類對(dui)話中(zhong)一樣。
每日(ri)經濟新聞援引媒體報道,近(jin)日(ri),蘋(pin)果公司被(bei)曝(pu)正與(yu)OpenAI敲定一項協議,今(jin)年將后者(zhe)的部分(fen)技術引入iPhone。而(er)在本次發布會上,谷歌產品(pin)管理副總(zong)裁Sameer Samat明確表示,谷歌將通過Gemini進一步優化安卓(zhuo)操作系統(tong)。這種優化將首先在谷歌自家手機Pixel上得到體現。
對于OpenAI的突襲更新,行業不再(zai)是(shi)統(tong)一的贊嘆。“發布會雖然驚艷,但(dan)谷歌(ge)看完應該是(shi)不慌(huang)了。”獵豹移(yi)動董(dong)事(shi)長(chang)兼CEO、獵戶星空董(dong)事(shi)長(chang)傅盛在其個人(ren)微博表示。
在5月14日發布的(de)短(duan)視頻中,傅(fu)盛談及“所有(you)國內人(ren)(ren)工智能(neng)從業(ye)者都在熬夜等著大洋彼岸放核彈,但(dan)是(shi)(shi)沒想到核彈沒有(you)放,卻掏出(chu)了一(yi)堆(dui)摔炮”。他表示,這(zhe)樣的(de)評論(lun)雖(sui)然是(shi)(shi)一(yi)句玩(wan)笑話,較讓人(ren)(ren)失望的(de)是(shi)(shi)這(zhe)次(ci)OpenAI沒有(you)發布GPT-5.0,連GPT-4.5也沒有(you)看到,反(fan)而是(shi)(shi)發布了GPT-4o,“就是(shi)(shi)把一(yi)系列的(de)引(yin)擎給結合(he)在一(yi)起(qi),比如圖片(pian)、文(wen)字、聲音,這(zhe)樣你就不(bu)需(xu)要(yao)來回去切換了”。
不(bu)過,傅盛后續(xu)也表示,“OpenAI這次為了能(neng)夠讓更多的(de)(de)用(yong)戶使用(yong)它,可(ke)以說是(shi)鉚足了勁,一系列的(de)(de)應用(yong),API降價(jia),GPT免費,我(wo)們當(dang)然希望OpenAI能(neng)夠使得這個行業更好(hao)發展,我(wo)們也能(neng)認真(zhen)地去學習,這次的(de)(de)發布會真(zhen)正(zheng)告訴我(wo)們應用(yong)大有可(ke)為,所有人都應該努力”。
“GPT-4o出來,又比原來進步一(yi)(yi)(yi)大(da)截,它(OpenAI)每次一(yi)(yi)(yi)升級就(jiu)會(hui)‘死’一(yi)(yi)(yi)些(xie)(xie)公司(si),這次一(yi)(yi)(yi)些(xie)(xie)做GPT實時語音(yin)交互的(de)團隊,直接可以宣布(bu)解散(san)了。”GPT-4o發布(bu)的(de)第二天,一(yi)(yi)(yi)名大(da)模(mo)型行(xing)業(ye)創(chuang)業(ye)者(zhe)對《每日經(jing)濟新聞》記(ji)者(zhe)感嘆(tan)。
清華大學新聞學院元宇宙文化實驗室主任沈陽(yang)同樣在第(di)二天試用了GPT-4o,在其發布的視頻號(hao)中提到(dao),在文生圖層面(mian),GPT-4o在毛發細膩度(du)、光影效果(guo)等細節上更(geng)加優(you)異。
隨(sui)著雙方(fang)在(zai)智能助手上的對碰,沈陽認為(wei),當前的競爭格局已經(jing)更加明晰,谷歌正在(zai)進一步(bu)推其基(ji)于Gemini的AI助手,蘋果公司(si)與OpenAI也初步(bu)達成了(le)合作,將(jiang)在(zai)蘋果手機搭(da)載ChatGPT。
沈陽表示,以本次發布(bu)會作為轉折點,ChatGPT被改造成了靈魂伴侶,實際上就是(shi)Siri,所(suo)以產業格局已經(jing)明(ming)晰了,就是(shi)蘋果用(yong)內置的(de)ChatGPT對抗谷歌Gemini的(de)手(shou)機助(zhu)手(shou)。Meta也將上線基于(yu)Llama的(de)手(shou)機助(zhu)手(shou)。對于(yu)產業來說,AI助(zhu)手(shou)有(you)望(wang)從1億(yi)量級的(de)用(yong)戶量走向(xiang)10億(yi)量級。
“GPT-4o,昨天發布的(de)時候它(ta)(ta)覺得很(hen)強(qiang)大,但今天我覺得谷(gu)歌(ge)最(zui)新的(de)發布也(ye)完(wan)全把它(ta)(ta)的(de)這(zhe)些成績趕(gan)上了,我覺得后面OpenAI應該更(geng)(geng)加(jia)緊張(zhang),因為應用(yong)公司、超(chao)級大平(ping)臺(tai)公司全部(bu)趕(gan)上來(lai)了,它(ta)(ta)的(de)優勢(shi)(shi)越來(lai)越少(shao)。”順福資本創始人、行行AI董事長李明順對(dui)《每日經濟新聞》記者(zhe)表示(shi),目前來(lai)看OpenAI的(de)用(yong)戶(hu)(hu)增長已經不太明顯,技術領先和成本優勢(shi)(shi)都不一定是最(zui)佳,與此同時,強(qiang)應用(yong)時代(dai)越來(lai)越快(kuai)到來(lai),在這(zhe)個背景下,谷(gu)歌(ge)這(zhe)次(ci)把它(ta)(ta)所有的(de)應用(yong)與大模型集合,形(xing)成更(geng)(geng)強(qiang)的(de)用(yong)戶(hu)(hu)黏(nian)性和用(yong)戶(hu)(hu)依存度,還是更(geng)(geng)勝一籌。
在李(li)明順看來,下(xia)個(ge)階段,美國(guo)的平(ping)臺應(ying)用公司(si),包括微軟、蘋果(guo)、戴爾,以及(ji)中國(guo)的騰訊(xun)、字(zi)節、阿(a)里都會(hui)陸續結(jie)合(he)自己(ji)的應(ying)用與大模型(xing)能(neng)力,推出超級應(ying)用,逐步邁向(xiang)綜合(he)競爭時代,靠一個(ge)大模型(xing)打江山(shan)將更難(nan)。
吃(chi)下巨(ju)頭的“蛋糕”沒有那(nei)么容(rong)易。
發(fa)布會(hui)前(qian),市場(chang)充斥著OpenAI圍繞搜(sou)索布局的煙霧彈(dan),有報道稱,OpenAI很(hen)可能推出基于ChatGPT技術的新搜(sou)索引擎。與此同時(shi),名(ming)(ming)為“GPTSearch”的網頁已經上線(xian)(xian),但目(mu)前(qian)只有會(hui)員才能訪問。知名(ming)(ming)記(ji)者PeteHuang也發(fa)推特預告(gao),表示(shi)GPTSearch將(jiang)在5月9日正式上線(xian)(xian)。
最(zui)終(zhong)在(zai)這一(yi)輪交(jiao)手(shou)中,谷(gu)歌守(shou)住了陣地。谷(gu)歌首席(xi)執行官桑達爾(er)·皮查伊(Sundar Pichai)在(zai)演(yan)講中提到,Gemini帶來(lai)的(de)(de)(de)最(zui)令人興奮的(de)(de)(de)變革(ge)之一(yi)是在(zai)Google搜索中,“我們最(zui)大的(de)(de)(de)投資和創新領(ling)域之一(yi)是我們的(de)(de)(de)創始產品——搜索”。
從發布會看(kan),谷(gu)(gu)歌已(yi)經率先將AI能(neng)力(li)與其搜索引(yin)擎(qing)(qing)相結合。谷(gu)(gu)歌方(fang)面宣(xuan)布,能(neng)夠總結谷(gu)(gu)歌搜索引(yin)擎(qing)(qing)結果的“AI概(gai)覽”(AI Overviews)功能(neng),將于本周(zhou)在美國(guo)推出。在這一(yi)功能(neng)中,谷(gu)(gu)歌將向用戶展示AI生成的答案。
據谷歌介紹,AI概覽(lan)是(shi)為(wei)了(le)響(xiang)應較復雜的(de)搜索,幫助用戶尋求解決(jue)方案。例如,當人們搜索素食準備或出行(xing)計劃(hua)時(shi),AI提供的(de)答案會出現在搜索頁(ye)面頂部(bu)。
谷(gu)歌(ge)還提(ti)升(sheng)了搜索的(de)(de)視(shi)覺功能,支持通(tong)過(guo)視(shi)頻(pin)提(ti)出問(wen)題。在I/O大會上,谷(gu)歌(ge)演(yan)示了當(dang)面(mian)對唱(chang)片(pian)機故障時(shi),用戶可以一邊拍(pai)攝視(shi)頻(pin)一邊提(ti)問(wen),通(tong)過(guo)新搜索得(de)到(dao)包括修理步驟和資(zi)源(yuan)在內的(de)(de)AI概覽。
盡(jin)管在(zai)智能助手層面先一步狙擊(ji)谷(gu)歌新品(pin),但對于市場(chang)期(qi)待的搜索產品(pin),這項自GPT-3.5發布以來(lai)就被寄予厚望(wang)的革(ge)命(ming)性(xing)功能,卻在(zai)一陣又(you)一陣煙霧彈后,依舊(jiu)未見進一步動作。在(zai)搜索市場(chang),谷(gu)歌的基本盤依舊(jiu)穩固,與此同時其全(quan)面的AI能力正在(zai)隱隱形成包(bao)圍之勢。
與巨頭爭奪領地的另一面,對于OpenAI而言,內(nei)憂隱患猶在(zai)。
去年(nian)內(nei)斗余波之后,就在(zai)GPT-4o發布一(yi)天之后,消失在(zai)大眾視線很久的OpenAI聯合創始人(ren)、首席(xi)科學家(jia)Ilya Sutskever官宣離(li)開OpenAI。去年(nian)11月(yue),OpenAI管理層發生動蕩,Sutskever被認為(wei)是這場風波背后的推手。不久前,OpenAI創始成員(yuan)之一(yi)AndrejKarpathy也在(zai)Sora發布前夕離(li)職(zhi)。
在這場全新(xin)的(de)(de)技術革命(ming)中(zhong),隨著競(jing)爭(zheng)的(de)(de)重點由大(da)模型技術轉向更(geng)為(wei)負責的(de)(de)應用側,以黑馬姿態一度(du)引領方向的(de)(de)OpenAI開始降速,新(xin)的(de)(de)轉折點也許已經(jing)出現。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每(mei)日經濟新聞》報社授權,嚴禁轉載或鏡(jing)像,違(wei)者(zhe)必究。
讀者熱(re)線(xian):4008890008
特別提醒(xing):如果我們使用了您的圖片,請作者與本站聯系索(suo)取稿酬。如您不希望作品出現在本站,可聯系(xi)我們要(yao)求撤下您的(de)作品。
歡迎關注每日經濟新(xin)聞(wen)APP