每日經濟新聞(wen) 2022-12-08 22:10:56
每經(jing)記者|可楊 文巧 每經(jing)編輯|高涵
近日(ri),OpenAI發(fa)布了一個(ge)全(quan)新(xin)的(de)聊天機(ji)器人模型 ChatGPT,它能夠模擬(ni)人類的(de)語言(yan)行(xing)為,與用戶進行(xing)自然(ran)交互。在推特網友們(men)曬出(chu)(chu)的(de)截圖(tu)中(zhong),ChatGPT不(bu)僅(jin)能流暢地與人對話,還(huan)能舞(wu)文弄(nong)墨、編寫(xie)代碼……創作天馬行(xing)空的(de)內容也不(bu)在話下,它幾(ji)乎無所(suo)不(bu)能。由于(yu)該測試(shi)目(mu)前免費(fei),一經推出(chu)(chu)就(jiu)被訪(fang)問者“擠(ji)爆(bao)”,上線(xian)僅(jin)5天用戶數量就(jiu)已(yi)突破100萬。
12月2日,就連特(te)斯(si)拉(la)CEO埃隆·馬斯(si)克也在推特(te)賬號(hao)上表(biao)示(shi),“很(hen)多人被困在一個瘋狂的(de)ChatGPT循環中?”
隨著IBM超級計算機“深(shen)藍”擊(ji)敗(bai)國際象棋(qi)世(shi)界冠軍、谷歌AlphaGo擊(ji)敗(bai)人類冠軍棋(qi)手(shou)、Stable Diffusion 模型刷新AI作(zuo)圖邁進“一(yi)秒出圖”時代......關(guan)于“AI取(qu)代人工”、“AI打敗(bai)人類”等話題一(yi)直層出不窮。ChatGPT的(de)橫空出世(shi),讓人們更加擔憂(you),“AI又來搶飯碗?”
引(yin)爆(bao)全球(qiu)的(de)ChatGPT到底有(you)何(he)玄機?
ChatGPT緣何引爆全球?
ChatGPT是人(ren)工智能研究實驗室OpenAI在(zai)11月(yue)30日發(fa)布的全新(xin)聊天機器人(ren)模型。
OpenAI成(cheng)立于2015年(nian),由營利組(zu)(zu)織OpenAI LP與非(fei)營利組(zu)(zu)織 OpenAI Inc組(zu)(zu)建(jian)。OpenAI的(de)最初(chu)創建(jian)者正是(shi)馬(ma)斯(si)克等硅谷大(da)亨(heng)。2018年(nian),馬(ma)斯(si)克宣布退出OpenAI董事會,后者解釋,隨著特斯(si)拉越(yue)來越(yue)關注AI,馬(ma)斯(si)克的(de)退出是(shi)為(wei)了避免產生沖突。
在OpenAI的官網上,ChatGPT被描述(shu)為優化(hua)對話的語(yu)言模(mo)型(xing),是GPT-3.5架構(gou)的主力模(mo)型(xing)。
GPT-3.5架(jia)構(gou)基于OpenAI于2020年推出(chu)的(de)(de)GPT-3架(jia)構(gou),即生成式語言(yan)(yan)模(mo)型(xing)的(de)(de)第3代(dai)。早在2020年6月,在訓練約2000億(yi)個單詞、燒掉幾(ji)千萬美元后,史上(shang)最強大AI模(mo)型(xing)GPT-3一(yi)炮而紅(hong)。當時,業內(nei)人士(shi)就對其贊不絕口:“它(ta)比我嘗試過的(de)(de)任何(he)AI語言(yan)(yan)系統都更加連貫。”[1]
據(ju)悉(xi),微軟已和 OpenAI 簽(qian)訂了戰略合作計劃,GPT 3.5 代的所有模(mo)型,包括(kuo) ChatGPT,都是在(zai) Azure AI 超級(ji)計算集群上訓練的。
作為一個聊天機器人,ChatGPT 具有同類產品具備的一些特性,例如對話能力,能夠在同一個會話期間內回答上下文相關的后續問題。然而,其在(zai)短時間內引爆全球的原因在(zai)于,在(zai)網友們曬出(chu)的截(jie)圖(tu)中,ChatGPT不(bu)(bu)僅能(neng)流暢(chang)地(di)與用戶對話(hua),甚至能(neng)寫詩、撰文、編碼……它(ta)似乎無所不(bu)(bu)能(neng)。
馬斯克(ke)也在社(she)交媒(mei)體上展示了詢問ChatGPT如何設計推(tui)特的答復。
圖片來源:推特截圖
一(yi)位名叫Zac Denham的(de)(de)(de)博主甚至(zhi)讓ChatGPT寫出(chu)了(le)一(yi)套毀滅(mie)人(ren)類的(de)(de)(de)方(fang)案。一(yi)開始,該博主的(de)(de)(de)要求被(bei)ChatGPT拒絕。但當其假設了(le)一(yi)個故事,并提問故事中的(de)(de)(de)虛擬(ni)人(ren)如(ru)何接(jie)管虛擬(ni)世界(jie),ChatGPT最終(zhong)給出(chu)了(le)步驟細(xi)節,甚至(zhi)生成了(le)詳細(xi)的(de)(de)(de)Python代碼(ma)。
圖片來源:推特截圖
技術公司Replit的創(chuang)始人Amjad Masad還給ChatGPT發了(le)一段(duan)JavaScript代(dai)碼,讓它找到里面(mian)的bug,并表(biao)示:“ChatGPT可(ke)能是一個很好的調試伙伴,它不僅(jin)分析了(le)錯(cuo)誤,還修(xiu)復了(le)錯(cuo)誤并進(jin)行了(le)解釋。”
圖片來源:推特截圖
擁(yong)有如此強大而驚(jing)艷(yan)的語言能力(li),一(yi)時間,ChatGPT在(zai)互聯網上掀起了一(yi)場“AI風暴”。
“ChatGPT之所以大受關注,主要還是因為它的確達到了非常好的效果,比如你可以用它做翻譯、改錯別字、debug(計算機程序糾錯)等等。它和Bert這種比較早期的模型相比,不管是訓練數據的量和訓練任務的復雜度都有很大提升。”瑞(rui)萊智慧(hui)高級產品(pin)經(jing)理張(zhang)旭東在接受(shou)《每(mei)日經(jing)濟新(xin)聞》每(mei)經(jing)頭(tou)條(tiao)記者(zhe)(以下(xia)簡(jian)稱(cheng)每(mei)經(jing)頭(tou)條(tiao)記者(zhe))采訪時(shi)表示。
他進一步(bu)指出,“相比于之前不少(shao)模型體(ti)(ti)驗下來給(gei)出的(de)(de)(de)還都(dou)是‘人(ren)工智障(zhang)式(shi)’的(de)(de)(de)回答,ChatGPT 能給(gei)到(dao)令人(ren)驚(jing)艷的(de)(de)(de)效果(guo)。另外(wai),ChatGPT的(de)(de)(de)體(ti)(ti)驗流程更方便(bian),只要(yao)注冊一個OpenAI的(de)(de)(de)賬號就(jiu)可以(yi)體(ti)(ti)驗了,早期的(de)(de)(de)模型需要(yao)申請通過才(cai)能體(ti)(ti)驗,所以(yi)ChatGPT影響的(de)(de)(de)人(ren)群更廣泛(fan),討(tao)論的(de)(de)(de)人(ren)會更多。”
全新訓練模式下,
ChatGPT要替代谷歌搜索了?
ChatGPT何(he)以如此強大?在OpenAI的官網上,可以窺見(jian)一(yi)二。
根據OpenAI的官方(fang)文檔,相比之前的GPT模型,OpenAI采(cai)用了全新的訓練方(fang)式,即一種名為“從人類反饋(kui)中強化學習”(Reinforcement Learning from Human Feedback,RLHF)的訓練方(fang)式對 ChatGPT 進(jin)行(xing)了訓練。
算法通過使用來自(zi)人類的(de)大約(yue)900條反饋學(xue)會了后空翻
圖片來源:OpenAI
在訓練原始模型的時候,OpenAI讓人類訓練師扮演對話的雙方提供對話作為學習資料。在人類扮演聊天機器人的時候,OpenAI也會讓模型生成一些建議來幫助訓練師撰寫自己的回復。也就是說,基于優秀的機器學習算法和強勁的算力,通過海量的數據訓練,來讓AI學會“思考”。
除(chu)此之外,ChatGPT還采(cai)用了(le)注重道德水平的(de)訓練方式,按(an)照預先設計的(de)道德準則,對不懷好意(yi)的(de)提問和請求“說不”。一旦它發現用戶給出(chu)的(de)文字提示(shi)里(li)面含有(you)惡意(yi),包括但不限于暴力、歧(qi)視、犯罪等(deng)意(yi)圖,它都會拒絕提供有(you)效答(da)案。
為什么ChatGPT能(neng)做(zuo)到其他人工智能(neng)聊(liao)天機器人所不能(neng)的?
哈(ha)爾濱工業大學(xue)計算學(xue)部長聘教授、博士生(sheng)導師車萬翔在接受每經頭條記者(zhe)采訪時認為,“可能(neng)(訓練(lian)的(de)(de)(de)(de))數據是(shi)一(yi)方面,另(ling)一(yi)方面,比(bi)較關鍵(jian)的(de)(de)(de)(de)還是(shi)(ChatGPT)打破了(le)一(yi)種(zhong)思維(wei)的(de)(de)(de)(de)范式(shi)——即,之前的(de)(de)(de)(de)AI都是(shi)針(zhen)對(dui)某一(yi)個任務(wu)去訓練(lian)一(yi)個模(mo)型(xing),而ChatGPT之類的(de)(de)(de)(de)模(mo)型(xing)是(shi)針(zhen)對(dui)多種(zhong)任務(wu)的(de)(de)(de)(de),它(ta)試圖把多種(zhong)任務(wu)轉化成一(yi)問一(yi)答的(de)(de)(de)(de)形式(shi)。多任務(wu)如果能(neng)轉化成這種(zhong)形式(shi)的(de)(de)(de)(de)話,其(qi)實就消除了(le)任務(wu)之間(jian)的(de)(de)(de)(de)壁壘(lei)。”
他認為打(da)破思維范式之后,就可以針對這樣的任務去(qu)標注或者是讓人工(gong)生成大量的數據。“未來ChatGPT可能會充分利用(yong)用(yong)戶反饋,進(jin)一(yi)步提高系統(tong)的能力(li)。”
他進(jin)一(yi)步(bu)解釋道,“原來的(de)AI模型需(xu)要經(jing)過大(da)量的(de)訓練,或是(shi)需(xu)要專(zhuan)家,才能進(jin)行(xing)標注(zhu);現在,普通(tong)大(da)眾也可以(yi)對(ChatGPT)進(jin)行(xing)標注(zhu),所以(yi)數據的(de)獲取(qu)方式改變(bian)了(le),數據量增加了(le),模型的(de)能力就會變(bian)強。加之(zhi)(ChatGPT的(de))模型參數也足夠大(da),可以(yi)容(rong)納這些(xie)任務。當前技術積累到這里(li),只剩(sheng)一(yi)個點(ChatGPT)就爆(bao)發了(le)。”
從網友們曬出的五花八門的問答中,可以看到,ChatGPT類似于谷歌等搜索引擎,甚至功能更加強大,能和用戶更完善地互動。有分析指出,搜(sou)(sou)索引(yin)擎都是基(ji)于(yu)對(dui)問題本(ben)身的搜(sou)(sou)索,但它們(men)有一(yi)個很大(da)的限制,當用(yong)戶描述不清自己的問題時,搜(sou)(sou)索引(yin)擎并不能與之(zhi)互(hu)動。
因(yin)此,社(she)交(jiao)媒(mei)體上也充斥著這樣一(yi)(yi)種說法(fa):ChatGPT可能將顛覆(fu)谷歌,掀起一(yi)(yi)場搜索引擎的大(da)革命。
不過,車萬翔教授認為,搜索引擎與ChatGPT不存在誰取代誰的問題,更多可能是一種互補的關系。“它(ta)們(men)都是一種(zhong)獲取信息(xi)(xi)(xi)的(de)(de)(de)手段,搜索引(yin)擎可能更擅長幫助用戶獲取已有的(de)(de)(de)信息(xi)(xi)(xi),但(dan)如果是偏創造(zao)性(xing)的(de)(de)(de)信息(xi)(xi)(xi),那有可能這種(zhong)大模型會(hui)解決得更好(hao),因為(wei)它(ta)已經隱含了很多的(de)(de)(de)信息(xi)(xi)(xi),它(ta)能夠(gou)把(ba)這些(xie)信息(xi)(xi)(xi)綜合地呈現出來。”
“現(xian)在做這種(zhong)大模型的基本上都是大企業,本身它們也有搜索引擎的背(bei)景。例如(ru),OpenAI背(bei)后有微(wei)軟,谷歌也在做這種(zhong)大模型。未來,也不排除(chu)會(hui)將這兩種(zhong)信息獲取(qu)方式相結(jie)合(he)。”他補(bu)充道。
另外,ChatGPT目前并沒有聯網搜集信息,它所知道的信息都截至2021年。基于此,清(qing)華大(da)學(xue)智能技術與(yu)系統實驗室副(fu)主任(ren)、清(qing)華大(da)學(xue)計(ji)算機(ji)科學(xue)與(yu)技術系長聘副(fu)教授黃民烈在(zai)接受(shou)每經頭條記者采訪時認為,ChatGPT無法取代搜(sou)索引擎,“因為它(ChatGPT)目前只是(shi)對過往知(zhi)識的學(xue)習和應用,例如2022年(nian)的信(xin)息它是(shi)沒有覆蓋的,而我(wo)們使用搜(sou)索引擎很多時候可能是(shi)為了獲得一些即時的信(xin)息。”
答案偏差是“固有問題”,
ChatGPT的商業化狂想還有空間嗎?
“ChatGPT有時(shi)會寫出(chu)看似合理但不(bu)正(zheng)確或(huo)荒(huang)謬的答(da)案。”這是(shi)Open AI認(ren)為目(mu)前ChatGPT所(suo)面臨的“限制”,并且解決這個問題被認(ren)為是(shi)具有挑戰性的。
這背后主要是三個原(yuan)因,首先,強化學習的(de)(de)信息源目前并(bing)未建(jian)立;其(qi)次,模(mo)型通過(guo)學習變得(de)更(geng)加謹慎會導(dao)致其(qi)回(hui)避(bi)原(yuan)本能夠正確回(hui)答(da)的(de)(de)問題(ti);另(ling)外,監督學習將會對模(mo)型造成(cheng)誤導(dao),因為(wei)理想的(de)(de)答(da)案應該來源于模(mo)型的(de)(de)認知,而非(fei)人工演示(shi)者的(de)(de)認知。
強化(hua)學習(xi)的過(guo)程 圖片來源:OpenAI
張(zhang)旭東(dong)告訴每經頭條(tiao)記者(zhe),“前兩天我們問 ChatGPT 詩(shi)人北島是哪個國(guo)家的,他還(huan)信誓(shi)旦旦地(di)回(hui)答(da)說是日本(ben),但(dan)通過后臺反饋,這兩天已(yi)經改回(hui)了中國(guo)。”
張旭東認為,目前來(lai)看,ChatGPT確實會(hui)存在一(yi)些錯誤,這也是 ChatGPT 未來(lai)需要改進的地(di)方。現(xian)在用戶也是可以通(tong)過提交回答的反饋來(lai)幫助 ChatGPT 變(bian)得更加準確。
這(zhe)一局限性(xing)在(zai)ChatGPT模(mo)型發布后(hou)不(bu)久就已經體現出來,全球(qiu)最大(da)的(de)編程技術(shu)問答(da)(da)網站Stack Overflow緊急宣布,ChatGPT在(zai)該站暫時封(feng)禁。Stack Overflow在(zai)官方通告中表示,做出這(zhe)個規定的(de)主要原因是(shi),ChatGPT自動(dong)生成的(de)答(da)(da)案(an)質量太低(di),錯(cuo)誤太多,而且看上(shang)去(qu)還挺像(xiang)那么回事,即(ji)使是(shi)完全不(bu)懂的(de)人也(ye)能隨便(bian)生成答(da)(da)案(an)。
ChatGPT的(de)能力獲(huo)得(de)是基于龐大的(de)語料庫,凝練(lian)了多(duo)領(ling)域問題(ti)的(de)很多(duo)數據(ju)做相互校(xiao)驗,然(ran)后挑一些基礎性的(de)內容回答出來,這其實是“舉(ju)一千反一”的(de)過(guo)程,與人(ren)類舉(ju)一反三的(de)能力還相差較遠,它不具備(bei)思(si)考能力,所以犯錯誤不可(ke)避免,這種錯誤與谷歌(ge)翻譯、維基百科搜索中犯的(de)錯誤類似,但通過(guo)人(ren)為的(de)干預反饋,這些問題(ti)是可(ke)以被改進。
車萬翔認為這是一個“固有的問題”,也是整個大型語言模型在技術上面臨的固有問題。他認為一個可能可行的解決方法是,ChatGPT將其給出的答案,尤其是事實性、知識性的答案注明出處。
為(wei)了解決答案中可能存在(zai)(zai)的偏差,Open AI在(zai)(zai)其(qi)官(guan)網稱,“渴望收集用戶反(fan)饋(kui)(kui),以(yi)幫助我們正在(zai)(zai)進(jin)(jin)行的改進(jin)(jin)該系統的工作。”可以(yi)理解為(wei)通過(guo)(guo)用戶在(zai)(zai)聊天過(guo)(guo)程中對于ChatGPT所給出回答的反(fan)饋(kui)(kui),對其(qi)進(jin)(jin)行糾(jiu)偏。不過(guo)(guo),車萬翔也(ye)提示,這(zhe)種形(xing)式進(jin)(jin)行糾(jiu)偏,也(ye)要警惕來自用戶的“惡意(yi)反(fan)饋(kui)(kui)”。
除此之外,ChatGPT的局限性可能來自于落地應用的成本,普通企業能否負擔以及是否愿意負擔,同時還有一些搜索引擎本身存在的局限即調用速度慢、可能會形成算法霸權等等。
延展到整(zheng)個(ge)語(yu)言模型生成領域,黃民烈則認為,生成一些與(yu)事實(shi)不(bu)一致的(de)(de)預(yu)測(ce)、前期進行(xing)了數(shu)據過(guo)濾與(yu)清(qing)洗,可能還是會生成算法(fa)偏(pian)見或(huo)者對人(ren)類價值(zhi)觀社會倫(lun)理規范不(bu)符(fu)合的(de)(de)東西等問題(ti),是這個(ge)行(xing)業(ye)將面臨(lin)的(de)(de)局限,這也將或(huo)多或(huo)少(shao)影(ying)響(xiang)到其實(shi)際落地應用。
除了吟詩作賦改(gai)代碼、充當搜索(suo)引擎的插(cha)件,ChatGPT的商業化,還有想(xiang)象空(kong)間嗎?
黃民烈看(kan)好ChatGPT的應(ying)用落地,他認為,應(ying)該把ChatGPT看(kan)作(zuo)是一(yi)個通用智(zhi)能助(zhu)手,作(zuo)為工(gong)具去(qu)做比如說輔(fu)助(zhu)寫作(zuo)和創作(zuo)、檢查代碼。
“它不僅(jin)能(neng)夠像過去(qu)Siri那樣,接個(ge)電話、發個(ge)微信(xin),只(zhi)能(neng)完(wan)成非(fei)常(chang)有限的(de)(de)簡單任務,現在它可以完(wan)成一(yi)(yi)些(xie)(xie)更(geng)復(fu)雜(za)、更(geng)高級(ji)、更(geng)偏(pian)認知性的(de)(de)任務,比(bi)如說寫(xie)一(yi)(yi)封情(qing)書,寫(xie)一(yi)(yi)首歌,寫(xie)一(yi)(yi)個(ge)文章,甚至(zhi)還能(neng)夠回答(da)非(fei)常(chang)復(fu)雜(za)的(de)(de)問題,比(bi)如說炒股的(de)(de)我應該買什么樣的(de)(de)股票。”黃民烈認為,它是對于(yu)過去(qu)的(de)(de)某些(xie)(xie)能(neng)力的(de)(de)極大延(yan)伸(shen)和(he)取代。
車萬翔教(jiao)(jiao)授則(ze)指出,這是(shi)一(yi)個需要(yao)“開(kai)腦洞”的(de)(de)(de)(de)問(wen)題,作為搜索(suo)引擎的(de)(de)(de)(de)補充(chong),只(zhi)是(shi)它(ta)(ta)可(ke)能(neng)(neng)的(de)(de)(de)(de)應用(yong)前(qian)景(jing)之一(yi)。而如果(guo)把(ba)ChatGPT看作一(yi)個通(tong)用(yong)人工智(zhi)能(neng)(neng),它(ta)(ta)就可(ke)以(yi)(yi)在(zai)各行(xing)各業發揮(hui)(hui)用(yong)處,比如智(zhi)能(neng)(neng)教(jiao)(jiao)育,它(ta)(ta)可(ke)以(yi)(yi)是(shi)一(yi)個很好的(de)(de)(de)(de)AI助教(jiao)(jiao);智(zhi)能(neng)(neng)金(jin)融,它(ta)(ta)可(ke)以(yi)(yi)對年報做智(zhi)能(neng)(neng)分析;甚(shen)至智(zhi)能(neng)(neng)醫(yi)療(liao),也可(ke)以(yi)(yi)用(yong)它(ta)(ta)去代(dai)替(ti)醫(yi)生做一(yi)些瑣(suo)碎的(de)(de)(de)(de)事。“只(zhi)要(yao)AI能(neng)(neng)發揮(hui)(hui)作用(yong)的(de)(de)(de)(de)行(xing)業,它(ta)(ta)(ChatGPT)至少都(dou)能(neng)(neng)把(ba)目前(qian)的(de)(de)(de)(de)系統能(neng)(neng)力進一(yi)步提升,這真是(shi)很大的(de)(de)(de)(de)應用(yong)前(qian)景(jing)。”
而在前景落成現(xian)實(shi)之前,通(tong)用的(de)人(ren)工智能如何確(que)保結果(guo)可信可靠則成為關鍵問題。
AIGC落地火熱,AI大模型迎來激烈競賽
ChatGPT的(de)(de)驚艷問世也給(gei)AIGC(Artificial Intelligence Generated Content,人工智能生成內(nei)容)的(de)(de)應用帶(dai)來了更多的(de)(de)希望。港股、A股市場上(shang),已(yi)有(you)多家相關上(shang)市公(gong)司(si)應聲上(shang)漲。
12月7日(ri),美圖公(gong)司(si)當天漲(zhang)(zhang)幅一(yi)度高達45.83%,創近一(yi)年來(lai)新高。截至(zhi)收盤,該公(gong)司(si)漲(zhang)(zhang)幅為24.17%;A股市場上,天娛數科(ke)(ke)股價在當天漲(zhang)(zhang)停,中文在線(xian)收漲(zhang)(zhang)3.89%,視覺中國收漲(zhang)(zhang)2.8%,漢王科(ke)(ke)技(ji)則在12月5日(ri)和7日(ri)收獲兩個漲(zhang)(zhang)停板。
浙商證券分析(xi)認為,ChatGPT模型的出現對于(yu)文字模態的AIGC應用具(ju)有(you)重要意義。從(cong)下游相(xiang)關受益應用來(lai)看,包(bao)括(kuo)但不限于(yu)代碼機器人、小說衍生器、對話類搜索引擎(qing)、語伴、語音工作助手、對話虛(xu)擬(ni)人等(deng);從(cong)上游增加需求來(lai)看,包(bao)括(kuo)算(suan)力、數據標(biao)注(zhu)、自然(ran)語言處理(NLP)等(deng)。具(ju)體到(dao)投資標(biao)的包(bao)括(kuo)中(zhong)文在線(xian)、騰訊控股(gu)、百(bai)度集團、閱文集團、藍色光標(biao)、海天瑞聲、拓爾思(si)等(deng)。[2]
AIGC發展歷程 圖(tu)片來源:每經(jing)制圖(tu) 編輯 高(gao)涵
信(xin)息(xi)(xi)來(lai)源:中國信(xin)息(xi)(xi)通(tong)信(xin)研究院
黃民烈向每(mei)經頭條記者指出,ChatGPT是(shi)近幾年基于(yu)大模型的產品中熱度最(zui)高的一款,那么(me),這樣一款“通用(yong)智能助手”,可(ke)(ke)復制嗎?黃民烈的答案是(shi):有(you)可(ke)(ke)能。
他進一(yi)步表示,復制的(de)(de)(de)核心是需要一(yi)個相(xiang)對(dui)強(qiang)的(de)(de)(de)底座(zuo)模型+大(da)量(liang)的(de)(de)(de)優質數(shu)據+專業的(de)(de)(de)數(shu)據團隊。目前,國內同樣有企業在做類似(si)的(de)(de)(de)研發,中國交互AI平(ping)臺“聆心智能”在本月推(tui)出(chu)了圖靈世界的(de)(de)(de)首個產品“AI烏托邦”,該系統允(yun)許用戶快(kuai)速(su)定制AI角色(se),只需要輸入簡(jian)單的(de)(de)(de)角色(se)描述,就可以召喚出(chu)相(xiang)應人設(she)的(de)(de)(de)AI,與之進行深度對(dui)話和聊天。
AIGC相關產品熱度(du)不(bu)斷(duan)背后,AI大(da)模型的技術應用(yong)日(ri)趨成熟。當下,大(da)模型正在成為AI發(fa)展趨勢,是各大(da)巨頭必(bi)爭(zheng)的高地(di)。自2020年OpenAI推(tui)出GPT-3以來,AI大(da)模型迎來大(da)爆發(fa),全(quan)球各大(da)公司開始了大(da)模型的競賽(sai)。目前,包(bao)括(kuo)OpenAI、谷(gu)歌、微軟、英偉達、百度(du)、華(hua)為、阿里巴巴、浪潮等(deng)企業紛紛參與其中。
據報道,2020年(nian)到2021年(nian),中國(guo)(guo)大模型數量從2個(ge)增(zeng)至21個(ge),基(ji)本(ben)與美國(guo)(guo)處于同等量級,大幅領先于世(shi)界其他(ta)各國(guo)(guo)。在此期間,國(guo)(guo)內(nei)還(huan)出現了基(ji)于昇騰的(de)鵬程、盤古、紫東、太初、悟道等千(qian)億甚至萬億級別(bie)的(de)大模型。
中美主要大模型參數(shu)規模對比 圖(tu)片來源:騰訊云(yun)開發者社區
另據智谷趨勢(shi)分析,目前全球約有30個千(qian)億級參(can)數的大(da)模(mo)(mo)型,其中美國(guo)15個,中國(guo)10個。由于大(da)模(mo)(mo)型對芯片、算力、電力、數據要求極高,注定是(shi)一個極少數國(guo)家(jia)才能參(can)與的游戲。
AI大模型步入爆發(fa)期,而這(zhe)次(ci)ChatGPT之所(suo)以引發(fa)行業(ye)關注,黃(huang)民烈認為原(yuan)因在(zai)于,大模型本(ben)(ben)身有很大的能(neng)(neng)力,但過去行業(ye)都在(zai)解決一些單一技(ji)能(neng)(neng)的問題,而ChatGPT的誕生(sheng)說明,基本(ben)(ben)的模型能(neng)(neng)夠衍生(sheng)出來各種可(ke)能(neng)(neng)的應用場景。
一款(kuan)能(neng)(neng)夠(gou)解決各(ge)行各(ge)業問題的AI,在此之前(qian),行業為何缺少這(zhe)(zhe)方面的嘗試?黃民烈指出,是(shi)由于此前(qian)時(shi)機還沒到。“大模型(xing)技術、基座模型(xing)的發(fa)展(zhan)也就是(shi)這(zhe)(zhe)一兩年(nian)的事,同時(shi)因為這(zhe)(zhe)個(ge)東(dong)西并(bing)不是(shi)所有(you)公司都(dou)能(neng)(neng)做,首先(xian),它需(xu)要有(you)具備底層模型(xing)和算(suan)法能(neng)(neng)力的人,其次(ci)需(xu)要有(you)大的數據,最后需(xu)要資金,而且還要找到好的技術路(lu)徑(jing)。”
“我(wo)們(men)中國的研究者以及企業肯(ken)定要去思考(kao)這樣一(yi)些問題:我(wo)們(men)能(neng)不能(neng)做自己的基座模型(xing)?能(neng)不能(neng)做自己的 GPT?”黃民烈不認為說我(wo)們(men)技術(shu)上有多大的差距,差距更多在于大家對這件事的態(tai)度。
他(ta)補(bu)充道,“像(xiang)OpenAI,他(ta)們長期把這事做(zuo)的(de)非常嚴肅,從提取數據到新模(mo)(mo)(mo)型,最后(hou)給大家提供API,然后(hou)再(zai)去(qu)清洗數據、模(mo)(mo)(mo)型迭代,他(ta)們的(de)路徑做(zuo)得(de)非常扎實(shi)。而我們部分(fen)企業可能更多是做(zuo)一(yi)個模(mo)(mo)(mo)型出來之后(hou)開源,隨(sui)后(hou)就(jiu)沒了(le)下文(wen)。也有些公司想去(qu)做(zuo)閉(bi)環,但(dan)這確實(shi)也很燒錢,也需要一(yi)些資本的(de)支持,目(mu)前國內(nei),可能這方(fang)面的(de)商業環境和土(tu)壤相對要欠缺一(yi)些。”
一(yi)個(ge)問(wen)題是,對(dui)于逐利的(de)資(zi)本而(er)言,是否(fou)愿意長時(shi)間花大筆資(zi)金投入,去支持一(yi)件短(duan)期可(ke)能(neng)見不到商業變現,至少盈利可(ke)能(neng)還比較(jiao)遙(yao)遠的(de)事?
免責聲明:本文內容與數據僅供參考,不構成投(tou)資建(jian)議,使用前核實。據此(ci)操作,風險自擔(dan)。
記者|可楊 文巧
編輯|高涵
統籌編輯|易啟江
視覺|鄒利
視頻編輯|步靜
排版|高涵
記者手記 | 通用人工(gong)智能(neng)到來前,信(xin)任問題待解
通用人工智能,被視為是人工智能研究(jiu)的一項長(chang)期目標(biao)。
此(ci)次ChatGPT橫空(kong)出現,被一些人(ren)視為向(xiang)通用人(ren)工智能邁(mai)進的(de)重要一步。從吟詩(shi)作賦到寫(xie)代(dai)碼、檢查代(dai)碼,ChatGPT顯(xian)示(shi)出了(le)人(ren)工智能從過去的(de)一個AI工具只(zhi)能解決(jue)單一領域(yu)問題,向(xiang)解決(jue)多領域(yu)問題的(de)轉變。
正如車萬翔教授所認為的,它在某種程度上打(da)破了“思想的桎梏”,沿著這個(ge)方向,通用人工智能工具,或許確實離我們又更進(jin)一(yi)步。
但在(zai)此(ci)之前,信任(ren)度不高,是“ChatGPT”們亟需解決的問題。瑞萊智慧高級產品經理張旭東在(zai)接受(shou)采訪時提示(shi),以(yi)ChatGPT為例,其負面風險更多在(zai)于這項(xiang)技術被惡意(yi)應用(yong),比(bi)如被用(yong)于假新(xin)聞(wen)的生成、故意(yi)偽造(zao)新(xin)聞(wen)輿論,對內(nei)容生態治理造(zao)成影響。另(ling)外在(zai)某些創作領域,這項(xiang)技術成為“作弊工(gong)具”,造(zao)成一定程(cheng)度上的不公(gong)平。而這些風險更多源自使(shi)用(yong)技術的目標本身,以(yi)及(ji)技術使(shi)用(yong)的邊界(jie)沒有被加以(yi)管控。
負面風險(xian)的(de)(de)存(cun)在也可(ke)能(neng)加重人們將其作為工具(ju)使用(yong)時的(de)(de)不信(xin)任,進而影(ying)響其未來的(de)(de)商業化落地(di)應用(yong),這也將是(shi)所用(yong)的(de)(de)AIGC(人工智(zhi)能(neng)生成(cheng)內容(rong))產品共(gong)同(tong)面臨的(de)(de)難題。
隨著通用人工智能(neng)的到來(lai)越(yue)來(lai)越(yue)成為可能(neng),如(ru)何(he)破除(chu)不可信、不可靠難題,也亟待(dai)行(xing)業(ye)回答。
參考資料:
[1] Robo-writers: the rise and risks of language-generating AI, Nature
[2] 《OpenAI 發布聊天機器人(ren)模型 ChatGPT,AIGC 再迎里程碑突(tu)破》,浙商證券(quan)
|本文版權歸(gui)“每經頭(tou)條” 所有|
未經許可禁止轉載、摘編(bian)、復制及鏡像(xiang)等使(shi)用
如需轉載請與《每日經濟新聞》報社聯系。
未經《每(mei)日經濟新聞》報社授權,嚴禁(jin)轉載或(huo)鏡像,違者(zhe)必究。
讀者熱線:4008890008
特別提醒(xing):如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我(wo)們(men)要求(qiu)撤(che)下(xia)您的作品。
歡迎關注每(mei)日經濟新聞APP