頭條

最強聊天機器人來了，能寫情書、改錯別字、編代碼！明天，ChatGPT搶走我飯碗？

每日經濟新聞(wen) 2022-12-08 22:10:56

每經(jing)記者｜可楊文巧每經(jing)編輯｜高涵 

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFyha82jicuJ4dBjs7QdibcOZCT5JyNPSJyMh0iabSibalH2GR1185lnFkZg.jpg

近日(ri)，OpenAI發(fa)布了一個(ge)全(quan)新(xin)的(de)聊天機(ji)器人模型 ChatGPT，它能夠模擬(ni)人類的(de)語言(yan)行(xing)為，與用戶進行(xing)自然(ran)交互。在推特網友們(men)曬出(chu)(chu)的(de)截圖(tu)中(zhong)，ChatGPT不(bu)僅(jin)能流暢地與人對話，還(huan)能舞(wu)文弄(nong)墨、編寫(xie)代碼……創作天馬行(xing)空的(de)內容也不(bu)在話下，它幾(ji)乎無所(suo)不(bu)能。由于(yu)該測試(shi)目(mu)前免費(fei)，一經推出(chu)(chu)就(jiu)被訪(fang)問者“擠(ji)爆(bao)”，上線(xian)僅(jin)5天用戶數量就(jiu)已(yi)突破100萬。

12月2日，就連特(te)斯(si)拉(la)CEO埃隆·馬斯(si)克也在推特(te)賬號(hao)上表(biao)示(shi)，“很(hen)多人被困在一個瘋狂的(de)ChatGPT循環中？”

隨著IBM超級計算機“深(shen)藍”擊(ji)敗(bai)國際象棋(qi)世(shi)界冠軍、谷歌AlphaGo擊(ji)敗(bai)人類冠軍棋(qi)手(shou)、Stable Diffusion 模型刷新AI作(zuo)圖邁進“一(yi)秒出圖”時代......關(guan)于“AI取(qu)代人工”、“AI打敗(bai)人類”等話題一(yi)直層出不窮。ChatGPT的(de)橫空出世(shi)，讓人們更加擔憂(you)，“AI又來搶飯碗？”

引(yin)爆(bao)全球(qiu)的(de)ChatGPT到底有(you)何(he)玄機？

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFOkOk8AJibYSG2uEHgn5JiaouibMpGwk98nyCsic9X2gaicVx5mrmRicf40sw.png

ChatGPT緣何引爆全球？

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFOkOk8AJibYSG2uEHgn5JiaouibMpGwk98nyCsic9X2gaicVx5mrmRicf40sw.png

ChatGPT是人(ren)工智能研究實驗室OpenAI在(zai)11月(yue)30日發(fa)布的全新(xin)聊天機器人(ren)模型。

OpenAI成(cheng)立于2015年(nian)，由營利組(zu)(zu)織OpenAI LP與非(fei)營利組(zu)(zu)織 OpenAI Inc組(zu)(zu)建(jian)。OpenAI的(de)最初(chu)創建(jian)者正是(shi)馬(ma)斯(si)克等硅谷大(da)亨(heng)。2018年(nian)，馬(ma)斯(si)克宣布退出OpenAI董事會，后者解釋，隨著特斯(si)拉越(yue)來越(yue)關注AI，馬(ma)斯(si)克的(de)退出是(shi)為(wei)了避免產生沖突。

在OpenAI的官網上，ChatGPT被描述(shu)為優化(hua)對話的語(yu)言模(mo)型(xing)，是GPT-3.5架構(gou)的主力模(mo)型(xing)。

GPT-3.5架(jia)構(gou)基于OpenAI于2020年推出(chu)的(de)(de)GPT-3架(jia)構(gou)，即生成式語言(yan)(yan)模(mo)型(xing)的(de)(de)第3代(dai)。早在2020年6月，在訓練約2000億(yi)個單詞、燒掉幾(ji)千萬美元后，史上(shang)最強大AI模(mo)型(xing)GPT-3一(yi)炮而紅(hong)。當時，業內(nei)人士(shi)就對其贊不絕口：“它(ta)比我嘗試過的(de)(de)任何(he)AI語言(yan)(yan)系統都更加連貫。”[1]

據(ju)悉(xi)，微軟已和 OpenAI 簽(qian)訂了戰略合作計劃，GPT 3.5 代的所有模(mo)型，包括(kuo) ChatGPT，都是在(zai) Azure AI 超級(ji)計算集群上訓練的。

作為一個聊天機器人，ChatGPT 具有同類產品具備的一些特性，例如對話能力，能夠在同一個會話期間內回答上下文相關的后續問題。然而，其在(zai)短時間內引爆全球的原因在(zai)于，在(zai)網友們曬出(chu)的截(jie)圖(tu)中，ChatGPT不(bu)(bu)僅能(neng)流暢(chang)地(di)與用戶對話(hua)，甚至能(neng)寫詩、撰文、編碼……它(ta)似乎無所不(bu)(bu)能(neng)。

馬斯克(ke)也在社(she)交媒(mei)體上展示了詢問ChatGPT如何設計推(tui)特的答復。

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFgZstFS9Qa9uCtUNLrRbU2ud3MmicCEIiasz04yMmszic2KKTSY5jYK0MQ.png

圖片來源：推特截圖

一(yi)位名叫Zac Denham的(de)(de)(de)博主甚至(zhi)讓ChatGPT寫出(chu)了(le)一(yi)套毀滅(mie)人(ren)類的(de)(de)(de)方(fang)案。一(yi)開始，該博主的(de)(de)(de)要求被(bei)ChatGPT拒絕。但當其假設了(le)一(yi)個故事，并提問故事中的(de)(de)(de)虛擬(ni)人(ren)如(ru)何接(jie)管虛擬(ni)世界(jie)，ChatGPT最終(zhong)給出(chu)了(le)步驟細(xi)節，甚至(zhi)生成了(le)詳細(xi)的(de)(de)(de)Python代碼(ma)。

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFLC6eVj0kUpwQabC1r3Q3yLdeuibpCicEw6lP35uUaKRfPib4MDh4W3ibfg.png

圖片來源：推特截圖

技術公司Replit的創(chuang)始人Amjad Masad還給ChatGPT發了(le)一段(duan)JavaScript代(dai)碼，讓它找到里面(mian)的bug，并表(biao)示:“ChatGPT可(ke)能是一個很好的調試伙伴，它不僅(jin)分析了(le)錯(cuo)誤，還修(xiu)復了(le)錯(cuo)誤并進(jin)行了(le)解釋。”

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFO25ht971Ne1XtvJqs4Ha8EglWnpib3dc5L4IyLMicovDSE0KQiarr0v0g.png

圖片來源：推特截圖

擁(yong)有如此強大而驚(jing)艷(yan)的語言能力(li)，一(yi)時間，ChatGPT在(zai)互聯網上掀起了一(yi)場“AI風暴”。

“ChatGPT之所以大受關注，主要還是因為它的確達到了非常好的效果，比如你可以用它做翻譯、改錯別字、debug（計算機程序糾錯）等等。它和Bert這種比較早期的模型相比，不管是訓練數據的量和訓練任務的復雜度都有很大提升。”瑞(rui)萊智慧(hui)高級產品(pin)經(jing)理張(zhang)旭東在接受(shou)《每(mei)日經(jing)濟新(xin)聞》每(mei)經(jing)頭(tou)條(tiao)記者(zhe)（以下(xia)簡(jian)稱(cheng)每(mei)經(jing)頭(tou)條(tiao)記者(zhe)）采訪時(shi)表示。

他進一步(bu)指出，“相比于之前不少(shao)模型體(ti)(ti)驗下來給(gei)出的(de)(de)(de)還都(dou)是‘人(ren)工智障(zhang)式(shi)’的(de)(de)(de)回答，ChatGPT 能給(gei)到(dao)令人(ren)驚(jing)艷的(de)(de)(de)效果(guo)。另外(wai)，ChatGPT的(de)(de)(de)體(ti)(ti)驗流程更方便(bian)，只要(yao)注冊一個OpenAI的(de)(de)(de)賬號就(jiu)可以(yi)體(ti)(ti)驗了，早期的(de)(de)(de)模型需要(yao)申請通過才(cai)能體(ti)(ti)驗，所以(yi)ChatGPT影響的(de)(de)(de)人(ren)群更廣泛(fan)，討(tao)論的(de)(de)(de)人(ren)會更多。”

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFOkOk8AJibYSG2uEHgn5JiaouibMpGwk98nyCsic9X2gaicVx5mrmRicf40sw.png

全新訓練模式下，

ChatGPT要替代谷歌搜索了？

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFOkOk8AJibYSG2uEHgn5JiaouibMpGwk98nyCsic9X2gaicVx5mrmRicf40sw.png

ChatGPT何(he)以如此強大？在OpenAI的官網上，可以窺見(jian)一(yi)二。

根據OpenAI的官方(fang)文檔，相比之前的GPT模型，OpenAI采(cai)用了全新的訓練方(fang)式，即一種名為“從人類反饋(kui)中強化學習”（Reinforcement Learning from Human Feedback，RLHF）的訓練方(fang)式對 ChatGPT 進(jin)行(xing)了訓練。

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaF3hwZDBQPMCNwTN1Y6fP9cI1ib6UBqmfY7uDcpDKFwJLEticBJ5CGT4Aw.jpg

算法通過使用來自(zi)人類的(de)大約(yue)900條反饋學(xue)會了后空翻

圖片來源：OpenAI

在訓練原始模型的時候，OpenAI讓人類訓練師扮演對話的雙方提供對話作為學習資料。在人類扮演聊天機器人的時候，OpenAI也會讓模型生成一些建議來幫助訓練師撰寫自己的回復。也就是說，基于優秀的機器學習算法和強勁的算力，通過海量的數據訓練，來讓AI學會“思考”。

除(chu)此之外，ChatGPT還采(cai)用了(le)注重道德水平的(de)訓練方式，按(an)照預先設計的(de)道德準則，對不懷好意(yi)的(de)提問和請求“說不”。一旦它發現用戶給出(chu)的(de)文字提示(shi)里(li)面含有(you)惡意(yi)，包括但不限于暴力、歧(qi)視、犯罪等(deng)意(yi)圖，它都會拒絕提供有(you)效答(da)案。

為什么ChatGPT能(neng)做(zuo)到其他人工智能(neng)聊(liao)天機器人所不能(neng)的？

哈(ha)爾濱工業大學(xue)計算學(xue)部長聘教授、博士生(sheng)導師車萬翔在接受每經頭條記者(zhe)采訪時認為，“可能(neng)（訓練(lian)的(de)(de)(de)(de)）數據是(shi)一(yi)方面，另(ling)一(yi)方面，比(bi)較關鍵(jian)的(de)(de)(de)(de)還是(shi)（ChatGPT）打破了(le)一(yi)種(zhong)思維(wei)的(de)(de)(de)(de)范式(shi)——即，之前的(de)(de)(de)(de)AI都是(shi)針(zhen)對(dui)某一(yi)個任務(wu)去訓練(lian)一(yi)個模(mo)型(xing)，而ChatGPT之類的(de)(de)(de)(de)模(mo)型(xing)是(shi)針(zhen)對(dui)多種(zhong)任務(wu)的(de)(de)(de)(de)，它(ta)試圖把多種(zhong)任務(wu)轉化成一(yi)問一(yi)答的(de)(de)(de)(de)形式(shi)。多任務(wu)如果能(neng)轉化成這種(zhong)形式(shi)的(de)(de)(de)(de)話，其(qi)實就消除了(le)任務(wu)之間(jian)的(de)(de)(de)(de)壁壘(lei)。”

他認為打(da)破思維范式之后，就可以針對這樣的任務去(qu)標注或者是讓人工(gong)生成大量的數據。“未來ChatGPT可能會充分利用(yong)用(yong)戶反饋，進(jin)一(yi)步提高系統(tong)的能力(li)。”

他進(jin)一(yi)步(bu)解釋道，“原來的(de)AI模型需(xu)要經(jing)過大(da)量的(de)訓練，或是(shi)需(xu)要專(zhuan)家，才能進(jin)行(xing)標注(zhu)；現在，普通(tong)大(da)眾也可以(yi)對（ChatGPT）進(jin)行(xing)標注(zhu)，所以(yi)數據的(de)獲取(qu)方式改變(bian)了(le)，數據量增加了(le)，模型的(de)能力就會變(bian)強。加之(zhi)（ChatGPT的(de)）模型參數也足夠大(da)，可以(yi)容(rong)納這些(xie)任務。當前技術積累到這里(li)，只剩(sheng)一(yi)個點（ChatGPT）就爆(bao)發了(le)。”

從網友們曬出的五花八門的問答中，可以看到，ChatGPT類似于谷歌等搜索引擎，甚至功能更加強大，能和用戶更完善地互動。有分析指出，搜(sou)(sou)索引(yin)擎都是基(ji)于(yu)對(dui)問題本(ben)身的搜(sou)(sou)索，但它們(men)有一(yi)個很大(da)的限制，當用(yong)戶描述不清自己的問題時，搜(sou)(sou)索引(yin)擎并不能與之(zhi)互(hu)動。

因(yin)此，社(she)交(jiao)媒(mei)體上也充斥著這樣一(yi)(yi)種說法(fa)：ChatGPT可能將顛覆(fu)谷歌，掀起一(yi)(yi)場搜索引擎的大(da)革命。

不過，車萬翔教授認為，搜索引擎與ChatGPT不存在誰取代誰的問題，更多可能是一種互補的關系。“它(ta)們(men)都是一種(zhong)獲取信息(xi)(xi)(xi)的(de)(de)(de)手段，搜索引(yin)擎可能更擅長幫助用戶獲取已有的(de)(de)(de)信息(xi)(xi)(xi)，但(dan)如果是偏創造(zao)性(xing)的(de)(de)(de)信息(xi)(xi)(xi)，那有可能這種(zhong)大模型會(hui)解決得更好(hao)，因為(wei)它(ta)已經隱含了很多的(de)(de)(de)信息(xi)(xi)(xi)，它(ta)能夠(gou)把(ba)這些(xie)信息(xi)(xi)(xi)綜合地呈現出來。”

“現(xian)在做這種(zhong)大模型的基本上都是大企業，本身它們也有搜索引擎的背(bei)景。例如(ru)，OpenAI背(bei)后有微(wei)軟，谷歌也在做這種(zhong)大模型。未來，也不排除(chu)會(hui)將這兩種(zhong)信息獲取(qu)方式相結(jie)合(he)。”他補(bu)充道。

另外，ChatGPT目前并沒有聯網搜集信息，它所知道的信息都截至2021年。基于此，清(qing)華大(da)學(xue)智能技術與(yu)系統實驗室副(fu)主任(ren)、清(qing)華大(da)學(xue)計(ji)算機(ji)科學(xue)與(yu)技術系長聘副(fu)教授黃民烈在(zai)接受(shou)每經頭條記者采訪時認為，ChatGPT無法取代搜(sou)索引擎，“因為它（ChatGPT）目前只是(shi)對過往知(zhi)識的學(xue)習和應用，例如2022年(nian)的信(xin)息它是(shi)沒有覆蓋的，而我(wo)們使用搜(sou)索引擎很多時候可能是(shi)為了獲得一些即時的信(xin)息。”

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFOkOk8AJibYSG2uEHgn5JiaouibMpGwk98nyCsic9X2gaicVx5mrmRicf40sw.png

答案偏差是“固有問題”，

ChatGPT的商業化狂想還有空間嗎？

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFOkOk8AJibYSG2uEHgn5JiaouibMpGwk98nyCsic9X2gaicVx5mrmRicf40sw.png

“ChatGPT有時(shi)會寫出(chu)看似合理但不(bu)正(zheng)確或(huo)荒(huang)謬的答(da)案。”這是(shi)Open AI認(ren)為目(mu)前ChatGPT所(suo)面臨的“限制”，并且解決這個問題被認(ren)為是(shi)具有挑戰性的。

這背后主要是三個原(yuan)因，首先，強化學習的(de)(de)信息源目前并(bing)未建(jian)立；其(qi)次，模(mo)型通過(guo)學習變得(de)更(geng)加謹慎會導(dao)致其(qi)回(hui)避(bi)原(yuan)本能夠正確回(hui)答(da)的(de)(de)問題(ti)；另(ling)外，監督學習將會對模(mo)型造成(cheng)誤導(dao)，因為(wei)理想的(de)(de)答(da)案應該來源于模(mo)型的(de)(de)認知，而非(fei)人工演示(shi)者的(de)(de)認知。

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFqQhudOnVUMJ2Hjhwe7Z74v1I2nxiaq6eRYSib3YzU8TkQDUNwsGqACJQ.png

強化(hua)學習(xi)的過(guo)程圖片來源：OpenAI

張(zhang)旭東(dong)告訴每經頭條(tiao)記者(zhe)，“前兩天我們問 ChatGPT 詩(shi)人北島是哪個國(guo)家的，他還(huan)信誓(shi)旦旦地(di)回(hui)答(da)說是日本(ben)，但(dan)通過后臺反饋，這兩天已(yi)經改回(hui)了中國(guo)。”

張旭東認為，目前來(lai)看，ChatGPT確實會(hui)存在一(yi)些錯誤，這也是 ChatGPT 未來(lai)需要改進的地(di)方。現(xian)在用戶也是可以通(tong)過提交回答的反饋來(lai)幫助 ChatGPT 變(bian)得更加準確。

這(zhe)一局限性(xing)在(zai)ChatGPT模(mo)型發布后(hou)不(bu)久就已經體現出來，全球(qiu)最大(da)的(de)編程技術(shu)問答(da)(da)網站Stack Overflow緊急宣布，ChatGPT在(zai)該站暫時封(feng)禁。Stack Overflow在(zai)官方通告中表示，做出這(zhe)個規定的(de)主要原因是(shi)，ChatGPT自動(dong)生成的(de)答(da)(da)案(an)質量太低(di)，錯(cuo)誤太多，而且看上(shang)去(qu)還挺像(xiang)那么回事，即(ji)使是(shi)完全不(bu)懂的(de)人也(ye)能隨便(bian)生成答(da)(da)案(an)。

ChatGPT的(de)能力獲(huo)得(de)是基于龐大的(de)語料庫，凝練(lian)了多(duo)領(ling)域問題(ti)的(de)很多(duo)數據(ju)做相互校(xiao)驗，然(ran)后挑一些基礎性的(de)內容回答出來，這其實是“舉(ju)一千反一”的(de)過(guo)程，與人(ren)類舉(ju)一反三的(de)能力還相差較遠，它不具備(bei)思(si)考能力，所以犯錯誤不可(ke)避免，這種錯誤與谷歌(ge)翻譯、維基百科搜索中犯的(de)錯誤類似，但通過(guo)人(ren)為的(de)干預反饋，這些問題(ti)是可(ke)以被改進。

車萬翔認為這是一個“固有的問題”，也是整個大型語言模型在技術上面臨的固有問題。他認為一個可能可行的解決方法是，ChatGPT將其給出的答案，尤其是事實性、知識性的答案注明出處。

為(wei)了解決答案中可能存在(zai)(zai)的偏差，Open AI在(zai)(zai)其(qi)官(guan)網稱，“渴望收集用戶反(fan)饋(kui)(kui)，以(yi)幫助我們正在(zai)(zai)進(jin)(jin)行的改進(jin)(jin)該系統的工作。”可以(yi)理解為(wei)通過(guo)(guo)用戶在(zai)(zai)聊天過(guo)(guo)程中對于ChatGPT所給出回答的反(fan)饋(kui)(kui)，對其(qi)進(jin)(jin)行糾(jiu)偏。不過(guo)(guo)，車萬翔也(ye)提示，這(zhe)種形(xing)式進(jin)(jin)行糾(jiu)偏，也(ye)要警惕來自用戶的“惡意(yi)反(fan)饋(kui)(kui)”。

除此之外，ChatGPT的局限性可能來自于落地應用的成本，普通企業能否負擔以及是否愿意負擔，同時還有一些搜索引擎本身存在的局限即調用速度慢、可能會形成算法霸權等等。

延展到整(zheng)個(ge)語(yu)言模型生成領域，黃民烈則認為，生成一些與(yu)事實(shi)不(bu)一致的(de)(de)預(yu)測(ce)、前期進行(xing)了數(shu)據過(guo)濾與(yu)清(qing)洗，可能還是會生成算法(fa)偏(pian)見或(huo)者對人(ren)類價值(zhi)觀社會倫(lun)理規范不(bu)符(fu)合的(de)(de)東西等問題(ti)，是這個(ge)行(xing)業(ye)將面臨(lin)的(de)(de)局限，這也將或(huo)多或(huo)少(shao)影(ying)響(xiang)到其實(shi)際落地應用。

除了吟詩作賦改(gai)代碼、充當搜索(suo)引擎的插(cha)件，ChatGPT的商業化，還有想(xiang)象空(kong)間嗎？

黃民烈看(kan)好ChatGPT的應(ying)用落地，他認為，應(ying)該把ChatGPT看(kan)作(zuo)是一(yi)個通用智(zhi)能助(zhu)手，作(zuo)為工(gong)具去(qu)做比如說輔(fu)助(zhu)寫作(zuo)和創作(zuo)、檢查代碼。

“它不僅(jin)能(neng)夠像過去(qu)Siri那樣，接個(ge)電話、發個(ge)微信(xin)，只(zhi)能(neng)完(wan)成非(fei)常(chang)有限的(de)(de)簡單任務，現在它可以完(wan)成一(yi)(yi)些(xie)(xie)更(geng)復(fu)雜(za)、更(geng)高級(ji)、更(geng)偏(pian)認知性的(de)(de)任務，比(bi)如說寫(xie)一(yi)(yi)封情(qing)書，寫(xie)一(yi)(yi)首歌，寫(xie)一(yi)(yi)個(ge)文章，甚至(zhi)還能(neng)夠回答(da)非(fei)常(chang)復(fu)雜(za)的(de)(de)問題，比(bi)如說炒股的(de)(de)我應該買什么樣的(de)(de)股票。”黃民烈認為，它是對于(yu)過去(qu)的(de)(de)某些(xie)(xie)能(neng)力的(de)(de)極大延(yan)伸(shen)和(he)取代。

車萬翔教(jiao)(jiao)授則(ze)指出，這是(shi)一(yi)個需要(yao)“開(kai)腦洞”的(de)(de)(de)(de)問(wen)題，作為搜索(suo)引擎的(de)(de)(de)(de)補充(chong)，只(zhi)是(shi)它(ta)(ta)可(ke)能(neng)(neng)的(de)(de)(de)(de)應用(yong)前(qian)景(jing)之一(yi)。而如果(guo)把(ba)ChatGPT看作一(yi)個通(tong)用(yong)人工智(zhi)能(neng)(neng)，它(ta)(ta)就可(ke)以(yi)(yi)在(zai)各行(xing)各業發揮(hui)(hui)用(yong)處，比如智(zhi)能(neng)(neng)教(jiao)(jiao)育，它(ta)(ta)可(ke)以(yi)(yi)是(shi)一(yi)個很好的(de)(de)(de)(de)AI助教(jiao)(jiao)；智(zhi)能(neng)(neng)金(jin)融，它(ta)(ta)可(ke)以(yi)(yi)對年報做智(zhi)能(neng)(neng)分析；甚(shen)至智(zhi)能(neng)(neng)醫(yi)療(liao)，也可(ke)以(yi)(yi)用(yong)它(ta)(ta)去代(dai)替(ti)醫(yi)生做一(yi)些瑣(suo)碎的(de)(de)(de)(de)事。“只(zhi)要(yao)AI能(neng)(neng)發揮(hui)(hui)作用(yong)的(de)(de)(de)(de)行(xing)業，它(ta)(ta)（ChatGPT）至少都(dou)能(neng)(neng)把(ba)目前(qian)的(de)(de)(de)(de)系統能(neng)(neng)力進一(yi)步提升，這真是(shi)很大的(de)(de)(de)(de)應用(yong)前(qian)景(jing)。”

而在前景落成現(xian)實(shi)之前，通(tong)用的(de)人(ren)工智能如何確(que)保結果(guo)可信可靠則成為關鍵問題。

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFOkOk8AJibYSG2uEHgn5JiaouibMpGwk98nyCsic9X2gaicVx5mrmRicf40sw.png

AIGC落地火熱，AI大模型迎來激烈競賽

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFOkOk8AJibYSG2uEHgn5JiaouibMpGwk98nyCsic9X2gaicVx5mrmRicf40sw.png

ChatGPT的(de)(de)驚艷問世也給(gei)AIGC（Artificial Intelligence Generated Content，人工智能生成內(nei)容）的(de)(de)應用帶(dai)來了更多的(de)(de)希望。港股、A股市場上(shang)，已(yi)有(you)多家相關上(shang)市公(gong)司(si)應聲上(shang)漲。

12月7日(ri)，美圖公(gong)司(si)當天漲(zhang)(zhang)幅一(yi)度高達45.83%，創近一(yi)年來(lai)新高。截至(zhi)收盤，該公(gong)司(si)漲(zhang)(zhang)幅為24.17%；A股市場上，天娛數科(ke)(ke)股價在當天漲(zhang)(zhang)停，中文在線(xian)收漲(zhang)(zhang)3.89%，視覺中國收漲(zhang)(zhang)2.8%，漢王科(ke)(ke)技(ji)則在12月5日(ri)和7日(ri)收獲兩個漲(zhang)(zhang)停板。

浙商證券分析(xi)認為，ChatGPT模型的出現對于(yu)文字模態的AIGC應用具(ju)有(you)重要意義。從(cong)下游相(xiang)關受益應用來(lai)看，包(bao)括(kuo)但不限于(yu)代碼機器人、小說衍生器、對話類搜索引擎(qing)、語伴、語音工作助手、對話虛(xu)擬(ni)人等(deng)；從(cong)上游增加需求來(lai)看，包(bao)括(kuo)算(suan)力、數據標(biao)注(zhu)、自然(ran)語言處理（NLP）等(deng)。具(ju)體到(dao)投資標(biao)的包(bao)括(kuo)中(zhong)文在線(xian)、騰訊控股(gu)、百(bai)度集團、閱文集團、藍色光標(biao)、海天瑞聲、拓爾思(si)等(deng)。[2]

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFiaThnNqKPnCazgic2zZmLo4aKnZcHicqnVYkc4kb4CLryPicVeVH3rZDKA.png

AIGC發展歷程圖(tu)片來源：每經(jing)制圖(tu) 編輯高(gao)涵

信(xin)息(xi)(xi)來(lai)源：中國信(xin)息(xi)(xi)通(tong)信(xin)研究院

黃民烈向每(mei)經頭條記者指出，ChatGPT是(shi)近幾年基于(yu)大模型的產品中熱度最(zui)高的一款，那么(me)，這樣一款“通用(yong)智能助手”，可(ke)(ke)復制嗎？黃民烈的答案是(shi)：有(you)可(ke)(ke)能。

他進一(yi)步表示，復制的(de)(de)(de)核心是需要一(yi)個相(xiang)對(dui)強(qiang)的(de)(de)(de)底座(zuo)模型+大(da)量(liang)的(de)(de)(de)優質數(shu)據+專業的(de)(de)(de)數(shu)據團隊。目前，國內同樣有企業在做類似(si)的(de)(de)(de)研發，中國交互AI平(ping)臺“聆心智能”在本月推(tui)出(chu)了圖靈世界的(de)(de)(de)首個產品“AI烏托邦”，該系統允(yun)許用戶快(kuai)速(su)定制AI角色(se)，只需要輸入簡(jian)單的(de)(de)(de)角色(se)描述，就可以召喚出(chu)相(xiang)應人設(she)的(de)(de)(de)AI，與之進行深度對(dui)話和聊天。

AIGC相關產品熱度(du)不(bu)斷(duan)背后，AI大(da)模型的技術應用(yong)日(ri)趨成熟。當下，大(da)模型正在成為AI發(fa)展趨勢，是各大(da)巨頭必(bi)爭(zheng)的高地(di)。自2020年OpenAI推(tui)出GPT-3以來，AI大(da)模型迎來大(da)爆發(fa)，全(quan)球各大(da)公司開始了大(da)模型的競賽(sai)。目前，包(bao)括(kuo)OpenAI、谷(gu)歌、微軟、英偉達、百度(du)、華(hua)為、阿里巴巴、浪潮等(deng)企業紛紛參與其中。

據報道，2020年(nian)到2021年(nian)，中國(guo)(guo)大模型數量從2個(ge)增(zeng)至21個(ge)，基(ji)本(ben)與美國(guo)(guo)處于同等量級，大幅領先于世(shi)界其他(ta)各國(guo)(guo)。在此期間，國(guo)(guo)內(nei)還(huan)出現了基(ji)于昇騰的(de)鵬程、盤古、紫東、太初、悟道等千(qian)億甚至萬億級別(bie)的(de)大模型。

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFfgj3aGibonvnHqtlpQic8fxib2MQJia0HDSm6JFnnTzQolia6ZZxhGR4INw.jpg

中美主要大模型參數(shu)規模對比圖(tu)片來源：騰訊云(yun)開發者社區

另據智谷趨勢(shi)分析，目前全球約有30個千(qian)億級參(can)數的大(da)模(mo)(mo)型，其中美國(guo)15個，中國(guo)10個。由于大(da)模(mo)(mo)型對芯片、算力、電力、數據要求極高，注定是(shi)一個極少數國(guo)家(jia)才能參(can)與的游戲。

AI大模型步入爆發(fa)期，而這(zhe)次(ci)ChatGPT之所(suo)以引發(fa)行業(ye)關注，黃(huang)民烈認為原(yuan)因在(zai)于，大模型本(ben)(ben)身有很大的能(neng)(neng)力，但過去行業(ye)都在(zai)解決一些單一技(ji)能(neng)(neng)的問題，而ChatGPT的誕生(sheng)說明，基本(ben)(ben)的模型能(neng)(neng)夠衍生(sheng)出來各種可(ke)能(neng)(neng)的應用場景。

一款(kuan)能(neng)(neng)夠(gou)解決各(ge)行各(ge)業問題的AI，在此之前(qian)，行業為何缺少這(zhe)(zhe)方面的嘗試？黃民烈指出，是(shi)由于此前(qian)時(shi)機還沒到。“大模型(xing)技術、基座模型(xing)的發(fa)展(zhan)也就是(shi)這(zhe)(zhe)一兩年(nian)的事，同時(shi)因為這(zhe)(zhe)個(ge)東(dong)西并(bing)不是(shi)所有(you)公司都(dou)能(neng)(neng)做，首先(xian)，它需(xu)要有(you)具備底層模型(xing)和算(suan)法能(neng)(neng)力的人，其次(ci)需(xu)要有(you)大的數據，最后需(xu)要資金，而且還要找到好的技術路(lu)徑(jing)。”

“我(wo)們(men)中國的研究者以及企業肯(ken)定要去思考(kao)這樣一(yi)些問題：我(wo)們(men)能(neng)不能(neng)做自己的基座模型(xing)？能(neng)不能(neng)做自己的 GPT？”黃民烈不認為說我(wo)們(men)技術(shu)上有多大的差距，差距更多在于大家對這件事的態(tai)度。

他(ta)補(bu)充道，“像(xiang)OpenAI，他(ta)們長期把這事做(zuo)的(de)非常嚴肅，從提取數據到新模(mo)(mo)(mo)型，最后(hou)給大家提供API，然后(hou)再(zai)去(qu)清洗數據、模(mo)(mo)(mo)型迭代，他(ta)們的(de)路徑做(zuo)得(de)非常扎實(shi)。而我們部分(fen)企業可能更多是做(zuo)一(yi)個模(mo)(mo)(mo)型出來之后(hou)開源，隨(sui)后(hou)就(jiu)沒了(le)下文(wen)。也有些公司想去(qu)做(zuo)閉(bi)環，但(dan)這確實(shi)也很燒錢，也需要一(yi)些資本的(de)支持，目(mu)前國內(nei)，可能這方(fang)面的(de)商業環境和土(tu)壤相對要欠缺一(yi)些。”

一(yi)個(ge)問(wen)題是，對(dui)于逐利的(de)資(zi)本而(er)言，是否(fou)愿意長時(shi)間花大筆資(zi)金投入，去支持一(yi)件短(duan)期可(ke)能(neng)見不到商業變現，至少盈利可(ke)能(neng)還比較(jiao)遙(yao)遠的(de)事？

免責聲明：本文內容與數據僅供參考，不構成投(tou)資建(jian)議，使用前核實。據此(ci)操作，風險自擔(dan)。

記者|可楊文巧

編輯|高涵

統籌編輯|易啟江

視覺|鄒利

視頻編輯|步靜

排版|高涵

2eic4iblTAWEUlhC7QhfjWsaxuiay73SQaFz7l8FevwtsjkKibmFkcvTq5u68oApFusfIvS5hQgBAP4ib6aQVoAEsIw.jpg

記者手記 | 通用人工(gong)智能(neng)到來前，信(xin)任問題待解

通用人工智能，被視為是人工智能研究(jiu)的一項長(chang)期目標(biao)。

此(ci)次ChatGPT橫空(kong)出現，被一些人(ren)視為向(xiang)通用人(ren)工智能邁(mai)進的(de)重要一步。從吟詩(shi)作賦到寫(xie)代(dai)碼、檢查代(dai)碼，ChatGPT顯(xian)示(shi)出了(le)人(ren)工智能從過去的(de)一個AI工具只(zhi)能解決(jue)單一領域(yu)問題，向(xiang)解決(jue)多領域(yu)問題的(de)轉變。

正如車萬翔教授所認為的，它在某種程度上打(da)破了“思想的桎梏”，沿著這個(ge)方向，通用人工智能工具，或許確實離我們又更進(jin)一(yi)步。

但在(zai)此(ci)之前，信任(ren)度不高，是“ChatGPT”們亟需解決的問題。瑞萊智慧高級產品經理張旭東在(zai)接受(shou)采訪時提示(shi)，以(yi)ChatGPT為例，其負面風險更多在(zai)于這項(xiang)技術被惡意(yi)應用(yong)，比(bi)如被用(yong)于假新(xin)聞(wen)的生成、故意(yi)偽造(zao)新(xin)聞(wen)輿論，對內(nei)容生態治理造(zao)成影響。另(ling)外在(zai)某些創作領域，這項(xiang)技術成為“作弊工(gong)具”，造(zao)成一定程(cheng)度上的不公(gong)平。而這些風險更多源自使(shi)用(yong)技術的目標本身，以(yi)及(ji)技術使(shi)用(yong)的邊界(jie)沒有被加以(yi)管控。

負面風險(xian)的(de)(de)存(cun)在也可(ke)能(neng)加重人們將其作為工具(ju)使用(yong)時的(de)(de)不信(xin)任，進而影(ying)響其未來的(de)(de)商業化落地(di)應用(yong)，這也將是(shi)所用(yong)的(de)(de)AIGC（人工智(zhi)能(neng)生成(cheng)內容(rong)）產品共(gong)同(tong)面臨的(de)(de)難題。

隨著通用人工智能(neng)的到來(lai)越(yue)來(lai)越(yue)成為可能(neng)，如(ru)何(he)破除(chu)不可信、不可靠難題，也亟待(dai)行(xing)業(ye)回答。

參考資料：

[1] Robo-writers: the rise and risks of language-generating AI, Nature

[2] 《OpenAI 發布聊天機器人(ren)模型 ChatGPT，AIGC 再迎里程碑突(tu)破》，浙商證券(quan)

｜本文版權歸(gui)“每經頭(tou)條” 所有｜

未經許可禁止轉載、摘編(bian)、復制及鏡像(xiang)等使(shi)用

如需轉載請與《每日經濟新聞》報社聯系。
未經《每(mei)日經濟新聞》報社授權，嚴禁(jin)轉載或(huo)鏡像，違者(zhe)必究。

讀者熱線：4008890008

特別提醒(xing)：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我(wo)們(men)要求(qiu)撤(che)下(xia)您的作品。

近日，OpenAI發布了一個全新的聊天機器人模型ChatGPT，它能夠模擬人類的語言行為，與用戶進行自然交互。在推特網友們曬出的截圖中，ChatGPT不僅能流暢地與人對話，還能舞文弄墨、編寫代碼……創作天馬行空的內容也不在話下，它幾乎無所不能。由于該測試目前免費，一經推出就被訪問者“擠爆”，上線僅5天用戶數量就已突破100萬。 12月2日，就連特斯拉CEO埃隆·馬斯克也在推特賬號上表示，“很多人被困在一個瘋狂的ChatGPT循環中？” 隨著IBM超級計算機“深藍”擊敗國際象棋世界冠軍、谷歌AlphaGo擊敗人類冠軍棋手、StableDiffusion模型刷新AI作圖邁進“一秒出圖”時代......關于“AI取代人工”、“AI打敗人類”等話題一直層出不窮。ChatGPT的橫空出世，讓人們更加擔憂，“AI又來搶飯碗？” 引爆全球的ChatGPT到底有何玄機？ ChatGPT緣何引爆全球？ ChatGPT是人工智能研究實驗室OpenAI在11月30日發布的全新聊天機器人模型。 OpenAI成立于2015年，由營利組織OpenAILP與非營利組織OpenAIInc組建。OpenAI的最初創建者正是馬斯克等硅谷大亨。2018年，馬斯克宣布退出OpenAI董事會，后者解釋，隨著特斯拉越來越關注AI，馬斯克的退出是為了避免產生沖突。在OpenAI的官網上，ChatGPT被描述為優化對話的語言模型，是GPT-3.5架構的主力模型。 GPT-3.5架構基于OpenAI于2020年推出的GPT-3架構，即生成式語言模型的第3代。早在2020年6月，在訓練約2000億個單詞、燒掉幾千萬美元后，史上最強大AI模型GPT-3一炮而紅。當時，業內人士就對其贊不絕口：“它比我嘗試過的任何AI語言系統都更加連貫。”[1] 據悉，微軟已和OpenAI簽訂了戰略合作計劃，GPT3.5代的所有模型，包括ChatGPT，都是在AzureAI超級計算集群上訓練的。作為一個聊天機器人，ChatGPT具有同類產品具備的一些特性，例如對話能力，能夠在同一個會話期間內回答上下文相關的后續問題。然而，其在短時間內引爆全球的原因在于，在網友們曬出的截圖中，ChatGPT不僅能流暢地與用戶對話，甚至能寫詩、撰文、編碼……它似乎無所不能。馬斯克也在社交媒體上展示了詢問ChatGPT如何設計推特的答復。圖片來源：推特截圖一位名叫ZacDenham的博主甚至讓ChatGPT寫出了一套毀滅人類的方案。一開始，該博主的要求被ChatGPT拒絕。但當其假設了一個故事，并提問故事中的虛擬人如何接管虛擬世界，ChatGPT最終給出了步驟細節，甚至生成了詳細的Python代碼。圖片來源：推特截圖技術公司Replit的創始人AmjadMasad還給ChatGPT發了一段JavaScript代碼，讓它找到里面的bug，并表示:“ChatGPT可能是一個很好的調試伙伴，它不僅分析了錯誤，還修復了錯誤并進行了解釋。” 圖片來源：推特截圖擁有如此強大而驚艷的語言能力，一時間，ChatGPT在互聯網上掀起了一場“AI風暴”。 “ChatGPT之所以大受關注，主要還是因為它的確達到了非常好的效果，比如你可以用它做翻譯、改錯別字、debug（計算機程序糾錯）等等。它和Bert這種比較早期的模型相比，不管是訓練數據的量和訓練任務的復雜度都有很大提升。”瑞萊智慧高級產品經理張旭東在接受《每日經濟新聞》每經頭條記者（以下簡稱每經頭條記者）采訪時表示。他進一步指出，“相比于之前不少模型體驗下來給出的還都是‘人工智障式’的回答，ChatGPT能給到令人驚艷的效果。另外，ChatGPT的體驗流程更方便，只要注冊一個OpenAI的賬號就可以體驗了，早期的模型需要申請通過才能體驗，所以ChatGPT影響的人群更廣泛，討論的人會更多。” 全新訓練模式下， ChatGPT要替代谷歌搜索了？ ChatGPT何以如此強大？在OpenAI的官網上，可以窺見一二。根據OpenAI的官方文檔，相比之前的GPT模型，OpenAI采用了全新的訓練方式，即一種名為“從人類反饋中強化學習”（ReinforcementLearningfromHumanFeedback，RLHF）的訓練方式對ChatGPT進行了訓練。算法通過使用來自人類的大約900條反饋學會了后空翻圖片來源：OpenAI 在訓練原始模型的時候，OpenAI讓人類訓練師扮演對話的雙方提供對話作為學習資料。在人類扮演聊天機器人的時候，OpenAI也會讓模型生成一些建議來幫助訓練師撰寫自己的回復。也就是說，基于優秀的機器學習算法和強勁的算力，通過海量的數據訓練，來讓AI學會“思考”。除此之外，ChatGPT還采用了注重道德水平的訓練方式，按照預先設計的道德準則，對不懷好意的提問和請求“說不”。一旦它發現用戶給出的文字提示里面含有惡意，包括但不限于暴力、歧視、犯罪等意圖，它都會拒絕提供有效答案。為什么ChatGPT能做到其他人工智能聊天機器人所不能的？哈爾濱工業大學計算學部長聘教授、博士生導師車萬翔在接受每經頭條記者采訪時認為，“可能（訓練的）數據是一方面，另一方面，比較關鍵的還是（ChatGPT）打破了一種思維的范式——即，之前的AI都是針對某一個任務去訓練一個模型，而ChatGPT之類的模型是針對多種任務的，它試圖把多種任務轉化成一問一答的形式。多任務如果能轉化成這種形式的話，其實就消除了任務之間的壁壘。” 他認為打破思維范式之后，就可以針對這樣的任務去標注或者是讓人工生成大量的數據。“未來ChatGPT可能會充分利用用戶反饋，進一步提高系統的能力。” 他進一步解釋道，“原來的AI模型需要經過大量的訓練，或是需要專家，才能進行標注；現在，普通大眾也可以對（ChatGPT）進行標注，所以數據的獲取方式改變了，數據量增加了，模型的能力就會變強。加之（ChatGPT的）模型參數也足夠大，可以容納這些任務。當前技術積累到這里，只剩一個點（ChatGPT）就爆發了。” 從網友們曬出的五花八門的問答中，可以看到，ChatGPT類似于谷歌等搜索引擎，甚至功能更加強大，能和用戶更完善地互動。有分析指出，搜索引擎都是基于對問題本身的搜索，但它們有一個很大的限制，當用戶描述不清自己的問題時，搜索引擎并不能與之互動。因此，社交媒體上也充斥著這樣一種說法：ChatGPT可能將顛覆谷歌，掀起一場搜索引擎的大革命。不過，車萬翔教授認為，搜索引擎與ChatGPT不存在誰取代誰的問題，更多可能是一種互補的關系。“它們都是一種獲取信息的手段，搜索引擎可能更擅長幫助用戶獲取已有的信息，但如果是偏創造性的信息，那有可能這種大模型會解決得更好，因為它已經隱含了很多的信息，它能夠把這些信息綜合地呈現出來。” “現在做這種大模型的基本上都是大企業，本身它們也有搜索引擎的背景。例如，OpenAI背后有微軟，谷歌也在做這種大模型。未來，也不排除會將這兩種信息獲取方式相結合。”他補充道。另外，ChatGPT目前并沒有聯網搜集信息，它所知道的信息都截至2021年。基于此，清華大學智能技術與系統實驗室副主任、清華大學計算機科學與技術系長聘副教授黃民烈在接受每經頭條記者采訪時認為，ChatGPT無法取代搜索引擎，“因為它（ChatGPT）目前只是對過往知識的學習和應用，例如2022年的信息它是沒有覆蓋的，而我們使用搜索引擎很多時候可能是為了獲得一些即時的信息。” 答案偏差是“固有問題”， ChatGPT的商業化狂想還有空間嗎？ “ChatGPT有時會寫出看似合理但不正確或荒謬的答案。”這是OpenAI認為目前ChatGPT所面臨的“限制”，并且解決這個問題被認為是具有挑戰性的。這背后主要是三個原因，首先，強化學習的信息源目前并未建立；其次，模型通過學習變得更加謹慎會導致其回避原本能夠正確回答的問題；另外，監督學習將會對模型造成誤導，因為理想的答案應該來源于模型的認知，而非人工演示者的認知。強化學習的過程圖片來源：OpenAI 張旭東告訴每經頭條記者，“前兩天我們問ChatGPT詩人北島是哪個國家的，他還信誓旦旦地回答說是日本，但通過后臺反饋，這兩天已經改回了中國。” 張旭東認為，目前來看，ChatGPT確實會存在一些錯誤，這也是ChatGPT未來需要改進的地方。現在用戶也是可以通過提交回答的反饋來幫助ChatGPT變得更加準確。這一局限性在ChatGPT模型發布后不久就已經體現出來，全球最大的編程技術問答網站StackOverflow緊急宣布，ChatGPT在該站暫時封禁。StackOverflow在官方通告中表示，做出這個規定的主要原因是，ChatGPT自動生成的答案質量太低，錯誤太多，而且看上去還挺像那么回事，即使是完全不懂的人也能隨便生成答案。 ChatGPT的能力獲得是基于龐大的語料庫，凝練了多領域問題的很多數據做相互校驗，然后挑一些基礎性的內容回答出來，這其實是“舉一千反一”的過程，與人類舉一反三的能力還相差較遠，它不具備思考能力，所以犯錯誤不可避免，這種錯誤與谷歌翻譯、維基百科搜索中犯的錯誤類似，但通過人為的干預反饋，這些問題是可以被改進。車萬翔認為這是一個“固有的問題”，也是整個大型語言模型在技術上面臨的固有問題。他認為一個可能可行的解決方法是，ChatGPT將其給出的答案，尤其是事實性、知識性的答案注明出處。為了解決答案中可能存在的偏差，OpenAI在其官網稱，“渴望收集用戶反饋，以幫助我們正在進行的改進該系統的工作。”可以理解為通過用戶在聊天過程中對于ChatGPT所給出回答的反饋，對其進行糾偏。不過，車萬翔也提示，這種形式進行糾偏，也要警惕來自用戶的“惡意反饋”。除此之外，ChatGPT的局限性可能來自于落地應用的成本，普通企業能否負擔以及是否愿意負擔，同時還有一些搜索引擎本身存在的局限即調用速度慢、可能會形成算法霸權等等。延展到整個語言模型生成領域，黃民烈則認為，生成一些與事實不一致的預測、前期進行了數據過濾與清洗，可能還是會生成算法偏見或者對人類價值觀社會倫理規范不符合的東西等問題，是這個行業將面臨的局限，這也將或多或少影響到其實際落地應用。除了吟詩作賦改代碼、充當搜索引擎的插件，ChatGPT的商業化，還有想象空間嗎？黃民烈看好ChatGPT的應用落地，他認為，應該把ChatGPT看作是一個通用智能助手，作為工具去做比如說輔助寫作和創作、檢查代碼。 “它不僅能夠像過去Siri那樣，接個電話、發個微信，只能完成非常有限的簡單任務，現在它可以完成一些更復雜、更高級、更偏認知性的任務，比如說寫一封情書，寫一首歌，寫一個文章，甚至還能夠回答非常復雜的問題，比如說炒股的我應該買什么樣的股票。”黃民烈認為，它是對于過去的某些能力的極大延伸和取代。車萬翔教授則指出，這是一個需要“開腦洞”的問題，作為搜索引擎的補充，只是它可能的應用前景之一。而如果把ChatGPT看作一個通用人工智能，它就可以在各行各業發揮用處，比如智能教育，它可以是一個很好的AI助教；智能金融，它可以對年報做智能分析；甚至智能醫療，也可以用它去代替醫生做一些瑣碎的事。“只要AI能發揮作用的行業，它（ChatGPT）至少都能把目前的系統能力進一步提升，這真是很大的應用前景。” 而在前景落成現實之前，通用的人工智能如何確保結果可信可靠則成為關鍵問題。 AIGC落地火熱，AI大模型迎來激烈競賽 ChatGPT的驚艷問世也給AIGC（ArtificialIntelligenceGeneratedContent，人工智能生成內容）的應用帶來了更多的希望。港股、A股市場上，已有多家相關上市公司應聲上漲。 12月7日，美圖公司當天漲幅一度高達45.83%，創近一年來新高。截至收盤，該公司漲幅為24.17%；A股市場上，天娛數科股價在當天漲停，中文在線收漲3.89%，視覺中國收漲2.8%，漢王科技則在12月5日和7日收獲兩個漲停板。浙商證券分析認為，ChatGPT模型的出現對于文字模態的AIGC應用具有重要意義。從下游相關受益應用來看，包括但不限于代碼機器人、小說衍生器、對話類搜索引擎、語伴、語音工作助手、對話虛擬人等；從上游增加需求來看，包括算力、數據標注、自然語言處理（NLP）等。具體到投資標的包括中文在線、騰訊控股、百度集團、閱文集團、藍色光標、海天瑞聲、拓爾思等。[2] AIGC發展歷程圖片來源：每經制圖編輯高涵信息來源：中國信息通信研究院黃民烈向每經頭條記者指出，ChatGPT是近幾年基于大模型的產品中熱度最高的一款，那么，這樣一款“通用智能助手”，可復制嗎？黃民烈的答案是：有可能。他進一步表示，復制的核心是需要一個相對強的底座模型+大量的優質數據+專業的數據團隊。目前，國內同樣有企業在做類似的研發，中國交互AI平臺“聆心智能”在本月推出了圖靈世界的首個產品“AI烏托邦”，該系統允許用戶快速定制AI角色，只需要輸入簡單的角色描述，就可以召喚出相應人設的AI，與之進行深度對話和聊天。 AIGC相關產品熱度不斷背后，AI大模型的技術應用日趨成熟。當下，大模型正在成為AI發展趨勢，是各大巨頭必爭的高地。自2020年OpenAI推出GPT-3以來，AI大模型迎來大爆發，全球各大公司開始了大模型的競賽。目前，包括OpenAI、谷歌、微軟、英偉達、百度、華為、阿里巴巴、浪潮等企業紛紛參與其中。據報道，2020年到2021年，中國大模型數量從2個增至21個，基本與美國處于同等量級，大幅領先于世界其他各國。在此期間，國內還出現了基于昇騰的鵬程、盤古、紫東、太初、悟道等千億甚至萬億級別的大模型。中美主要大模型參數規模對比圖片來源：騰訊云開發者社區另據智谷趨勢分析，目前全球約有30個千億級參數的大模型，其中美國15個，中國10個。由于大模型對芯片、算力、電力、數據要求極高，注定是一個極少數國家才能參與的游戲。 AI大模型步入爆發期，而這次ChatGPT之所以引發行業關注，黃民烈認為原因在于，大模型本身有很大的能力，但過去行業都在解決一些單一技能的問題，而ChatGPT的誕生說明，基本的模型能夠衍生出來各種可能的應用場景。一款能夠解決各行各業問題的AI，在此之前，行業為何缺少這方面的嘗試？黃民烈指出，是由于此前時機還沒到。“大模型技術、基座模型的發展也就是這一兩年的事，同時因為這個東西并不是所有公司都能做，首先，它需要有具備底層模型和算法能力的人，其次需要有大的數據，最后需要資金，而且還要找到好的技術路徑。” “我們中國的研究者以及企業肯定要去思考這樣一些問題：我們能不能做自己的基座模型？能不能做自己的GPT？”黃民烈不認為說我們技術上有多大的差距，差距更多在于大家對這件事的態度。他補充道，“像OpenAI，他們長期把這事做的非常嚴肅，從提取數據到新模型，最后給大家提供API，然后再去清洗數據、模型迭代，他們的路徑做得非常扎實。而我們部分企業可能更多是做一個模型出來之后開源，隨后就沒了下文。也有些公司想去做閉環，但這確實也很燒錢，也需要一些資本的支持，目前國內，可能這方面的商業環境和土壤相對要欠缺一些。” 一個問題是，對于逐利的資本而言，是否愿意長時間花大筆資金投入，去支持一件短期可能見不到商業變現，至少盈利可能還比較遙遠的事？免責聲明：本文內容與數據僅供參考，不構成投資建議，使用前核實。據此操作，風險自擔。記者|可楊文巧編輯|高涵統籌編輯|易啟江視覺|鄒利視頻編輯|步靜排版|高涵記者手記|通用人工智能到來前，信任問題待解通用人工智能，被視為是人工智能研究的一項長期目標。此次ChatGPT橫空出現，被一些人視為向通用人工智能邁進的重要一步。從吟詩作賦到寫代碼、檢查代碼，ChatGPT顯示出了人工智能從過去的一個AI工具只能解決單一領域問題，向解決多領域問題的轉變。正如車萬翔教授所認為的，它在某種程度上打破了“思想的桎梏”，沿著這個方向，通用人工智能工具，或許確實離我們又更進一步。但在此之前，信任度不高，是“ChatGPT”們亟需解決的問題。瑞萊智慧高級產品經理張旭東在接受采訪時提示，以ChatGPT為例，其負面風險更多在于這項技術被惡意應用，比如被用于假新聞的生成、故意偽造新聞輿論，對內容生態治理造成影響。另外在某些創作領域，這項技術成為“作弊工具”，造成一定程度上的不公平。而這些風險更多源自使用技術的目標本身，以及技術使用的邊界沒有被加以管控。負面風險的存在也可能加重人們將其作為工具使用時的不信任，進而影響其未來的商業化落地應用，這也將是所用的AIGC（人工智能生成內容）產品共同面臨的難題。隨著通用人工智能的到來越來越成為可能，如何破除不可信、不可靠難題，也亟待行業回答。參考資料： [1]Robo-writers:theriseandrisksoflanguage-generatingAI,Nature [2]《OpenAI發布聊天機器人模型ChatGPT，AIGC再迎里程碑突破》，浙商證券｜本文版權歸“每經頭條”所有｜未經許可禁止轉載、摘編、復制及鏡像等使用

上一篇文章

阿為特（873693）：與券商簽輔導(dao)協(xie)議(yi)，沖(chong)刺北交所IPO

返回每經網首頁

下一篇文章

美亞(ya)柏科：郭永芳和公司董事(shi)長(chang)滕達(da)為母(mu)子(zi)關系

熱文精選