每日經濟(ji)新(xin)聞 2022-12-13 10:39:21
每經AI快訊(xun),中國銀河12月13日發布研報稱:給予計算機推薦(維持)評級。
事件:12月(yue)1日,美國人(ren)工智能公司OpenAI在網頁上推出自(zi)然(ran)(ran)語言處理領域(yu)(NLP)的(de)(de)(de)模型ChatGPT,它能夠通過對話方式(shi)進行交互,并根據用戶輸入的(de)(de)(de)自(zi)然(ran)(ran)語言文本內(nei)容(rong),自(zi)動生(sheng)成新的(de)(de)(de)文本內(nei)容(rong)。一周內(nei),ChatGPT的(de)(de)(de)用戶已突(tu)破(po)100萬。
什么是ChatGPT:ChatGPT是在GPT3.5大(da)模(mo)型(xing)(xing)語言(yan)模(mo)型(xing)(xing)(LLM,即LargeLanguageModel)的(de)(de)基(ji)礎上(shang),加入(ru)“基(ji)于人類反饋的(de)(de)強化學習(RLHF,ReinforcementLearningfromHumanFeedback)”來不(bu)斷微調(Fine-tune)預訓練語言(yan)模(mo)型(xing)(xing),使得(de)LLM模(mo)型(xing)(xing)學會理解不(bu)同類型(xing)(xing)的(de)(de)命令指令,并通(tong)過多重標(biao)(biao)準(zhun)合理判斷基(ji)于給定的(de)(de)prompt輸(shu)入(ru)指令,輸(shu)出的(de)(de)是否為優質(zhi)信(xin)息(xi)(xi)(這些標(biao)(biao)準(zhun)包括:富含信(xin)息(xi)(xi)、內容豐富、對(dui)用戶有幫助、無害、不(bu)包含歧視(shi)信(xin)息(xi)(xi)等)。
ChatGPT引(yin)爆AIGC,AIGC將迎(ying)多(duo)場(chang)景爆發(fa)(fa)期:AIGC即AI-GeneratedContent,是(shi)繼UGC、PGC之后利用AI技術(shu)自動(dong)生(sheng)成內容的(de)新型(xing)生(sheng)產方式。相比UGC和PGC,AIGC的(de)最大不同是(shi)基(ji)于海量數據、風格(ge)隨機(ji)多(duo)變、跨模態融(rong)合、認(ren)知交互力等新技術(shu)導(dao)向特征。隨著(zhu)ChatGPT的(de)技術(shu)日漸成熟,AIGC將在(zai)電商(shang)虛(xu)擬主播、教育、金融(rong)、醫療、影視娛樂等多(duo)場(chang)景爆發(fa)(fa),并進(jin)一步催生(sheng)元宇宙(zhou)的(de)快速發(fa)(fa)展(zhan)。
ChatGPT的(de)(de)(de)(de)(de)(de)(de)(de)(de)技術發展路徑(jing):從GPT-1到InstructGPT,數(shu)(shu)據(ju)量(liang)(liang)與參(can)數(shu)(shu)量(liang)(liang)不斷增加,模(mo)(mo)型(xing)精度和(he)能(neng)力提升:2018年(nian),在(zai)(zai)(zai)自然(ran)語(yu)言(yan)處理(li)領(ling)域(yu)(NLP)剛興(xing)起時,OpenAI就(jiu)推出了(le)初代(dai)GPT,它的(de)(de)(de)(de)(de)(de)(de)(de)(de)運(yun)行(xing)邏輯(ji)是(shi):先通(tong)過無(wu)標(biao)簽數(shu)(shu)據(ju)學(xue)習(xi)(xi)(xi)(xi)生(sheng)(sheng)成語(yu)言(yan)模(mo)(mo)型(xing),并能(neng)夠運(yun)用(yong)(yong)于(yu)(yu)一些與有(you)監(jian)(jian)督任(ren)(ren)(ren)務(wu)無(wu)關的(de)(de)(de)(de)(de)(de)(de)(de)(de)NLP任(ren)(ren)(ren)務(wu)中(zhong)。此后再根據(ju)特定的(de)(de)(de)(de)(de)(de)(de)(de)(de)下游任(ren)(ren)(ren)務(wu)進行(xing)有(you)監(jian)(jian)督的(de)(de)(de)(de)(de)(de)(de)(de)(de)微調,提高(gao)其泛化(hua)能(neng)力。GPT-2擴展了(le)網絡參(can)數(shu)(shu)和(he)數(shu)(shu)據(ju)集,進行(xing)多(duo)任(ren)(ren)(ren)務(wu)學(xue)習(xi)(xi)(xi)(xi),可(ke)以在(zai)(zai)(zai)數(shu)(shu)據(ju)量(liang)(liang)足夠豐富且(qie)模(mo)(mo)型(xing)容(rong)量(liang)(liang)足夠大(da)(da)時,通(tong)過訓(xun)練語(yu)言(yan)模(mo)(mo)型(xing)就(jiu)能(neng)夠完成有(you)監(jian)(jian)督學(xue)習(xi)(xi)(xi)(xi)的(de)(de)(de)(de)(de)(de)(de)(de)(de)任(ren)(ren)(ren)務(wu)。對比GPT-2,2020年(nian)推出的(de)(de)(de)(de)(de)(de)(de)(de)(de)GPT-3最(zui)(zui)顯(xian)著的(de)(de)(de)(de)(de)(de)(de)(de)(de)特征(zheng)是(shi)龐大(da)(da)的(de)(de)(de)(de)(de)(de)(de)(de)(de)數(shu)(shu)據(ju)量(liang)(liang)和(he)參(can)數(shu)(shu)投入,整體訓(xun)練過程耗(hao)資1200萬美元,投入數(shu)(shu)據(ju)量(liang)(liang)達上萬億(yi),模(mo)(mo)型(xing)參(can)數(shu)(shu)量(liang)(liang)達到1750億(yi)。GPT-3延(yan)續了(le)前(qian)兩代(dai)GPT的(de)(de)(de)(de)(de)(de)(de)(de)(de)技術架構,但(dan)改(gai)變(bian)了(le)“大(da)(da)規模(mo)(mo)數(shu)(shu)據(ju)集預(yu)訓(xun)練+下游數(shu)(shu)據(ju)標(biao)注微調”的(de)(de)(de)(de)(de)(de)(de)(de)(de)方(fang)(fang)式(shi),采(cai)用(yong)(yong)情(qing)境(jing)學(xue)習(xi)(xi)(xi)(xi)(in-contextlearning)來提高(gao)模(mo)(mo)型(xing)對話輸(shu)出的(de)(de)(de)(de)(de)(de)(de)(de)(de)性(xing)能(neng)。GPT-3的(de)(de)(de)(de)(de)(de)(de)(de)(de)規模(mo)(mo)和(he)語(yu)言(yan)能(neng)力幾乎(hu)是(shi)最(zui)(zui)強(qiang)大(da)(da)的(de)(de)(de)(de)(de)(de)(de)(de)(de)。它能(neng)在(zai)(zai)(zai)不做微調的(de)(de)(de)(de)(de)(de)(de)(de)(de)情(qing)況下,在(zai)(zai)(zai)一些傳統的(de)(de)(de)(de)(de)(de)(de)(de)(de)NLP任(ren)(ren)(ren)務(wu)中(zhong)表現得更(geng)(geng)好,包(bao)括實(shi)現閉卷問(wen)答、模(mo)(mo)式(shi)解(jie)析、純語(yu)言(yan)建模(mo)(mo)、機(ji)器(qi)翻譯等;在(zai)(zai)(zai)新(xin)的(de)(de)(de)(de)(de)(de)(de)(de)(de)領(ling)域(yu),GPT-3將NLP的(de)(de)(de)(de)(de)(de)(de)(de)(de)應用(yong)(yong)擴展到缺乏足夠訓(xun)練數(shu)(shu)據(ju)的(de)(de)(de)(de)(de)(de)(de)(de)(de)領(ling)域(yu),例如在(zai)(zai)(zai)開發程序代(dai)碼(ma)、文章生(sheng)(sheng)成和(he)信息檢索領(ling)域(yu)取(qu)得了(le)實(shi)質性(xing)的(de)(de)(de)(de)(de)(de)(de)(de)(de)進展。然(ran)而,GPT-3在(zai)(zai)(zai)推理(li)和(he)理(li)解(jie)能(neng)力上還有(you)較長(chang)的(de)(de)(de)(de)(de)(de)(de)(de)(de)路要走,在(zai)(zai)(zai)自然(ran)語(yu)言(yan)推理(li)(NLI)任(ren)(ren)(ren)務(wu)中(zhong)表現不佳(jia)。InstructGPT和(he)ChatGPT:更(geng)(geng)好地遵循用(yong)(yong)戶意圖、更(geng)(geng)少的(de)(de)(de)(de)(de)(de)(de)(de)(de)虛假信息。OpenAI在(zai)(zai)(zai)2022年(nian)初發布了(le)InstructGPT。該語(yu)言(yan)模(mo)(mo)型(xing)通(tong)過“基于(yu)(yu)人類反饋的(de)(de)(de)(de)(de)(de)(de)(de)(de)強(qiang)化(hua)學(xue)習(xi)(xi)(xi)(xi)(RLHF)和(he)監(jian)(jian)督學(xue)習(xi)(xi)(xi)(xi)”來提高(gao)輸(shu)出質量(liang)(liang)。雖(sui)然(ran)InstructGPT的(de)(de)(de)(de)(de)(de)(de)(de)(de)參(can)數(shu)(shu)量(liang)(liang)僅為13億(yi)左右,相比于(yu)(yu)GPT-3縮小(xiao)了(le)100倍以上;但(dan)在(zai)(zai)(zai)遵循指令方(fang)(fang)面,能(neng)夠更(geng)(geng)好地遵循用(yong)(yong)戶意圖,將有(you)害的(de)(de)(de)(de)(de)(de)(de)(de)(de)、不真實(shi)或者有(you)偏差的(de)(de)(de)(de)(de)(de)(de)(de)(de)信息輸(shu)出最(zui)(zui)小(xiao)化(hua)。在(zai)(zai)(zai)優化(hua)的(de)(de)(de)(de)(de)(de)(de)(de)(de)模(mo)(mo)型(xing)上,ChatGPT基于(yu)(yu)InstructGPT進一步(bu)改(gai)進,在(zai)(zai)(zai)模(mo)(mo)型(xing)結構和(he)訓(xun)練流程上遵循上述方(fang)(fang)式(shi),但(dan)收集和(he)標(biao)注數(shu)(shu)據(ju)的(de)(de)(de)(de)(de)(de)(de)(de)(de)方(fang)(fang)式(shi)上發生(sheng)(sheng)了(le)變(bian)化(hua),通(tong)過采(cai)取(qu)監(jian)(jian)督學(xue)習(xi)(xi)(xi)(xi)的(de)(de)(de)(de)(de)(de)(de)(de)(de)方(fang)(fang)式(shi)讓(rang)模(mo)(mo)型(xing)學(xue)習(xi)(xi)(xi)(xi)人類排序的(de)(de)(de)(de)(de)(de)(de)(de)(de)方(fang)(fang)式(shi)。
ChatGPT的(de)(de)(de)(de)(de)(de)(de)(de)優勢與缺陷:優勢是(shi)ChatGPT不(bu)(bu)需要(yao)任何(he)額外的(de)(de)(de)(de)(de)(de)(de)(de)訓(xun)練(lian)就能(neng)(neng)在(zai)(zai)多種不(bu)(bu)同的(de)(de)(de)(de)(de)(de)(de)(de)領域中應用(yong)(yong)并快速輸出高質量的(de)(de)(de)(de)(de)(de)(de)(de)文本,相較(jiao)(jiao)于(yu)(yu)以前的(de)(de)(de)(de)(de)(de)(de)(de)模(mo)型已具備較(jiao)(jiao)強(qiang)的(de)(de)(de)(de)(de)(de)(de)(de)自然語(yu)言處(chu)理(li)能(neng)(neng)力。但(dan)目前ChatGPT在(zai)(zai)精(jing)準性、真(zhen)實(shi)性、重(zhong)復率(lv)和依賴(lai)性等(deng)問(wen)(wen)題(ti)(ti)上尚待改善:第一、由于(yu)(yu)技術實(shi)現的(de)(de)(de)(de)(de)(de)(de)(de)問(wen)(wen)題(ti)(ti),ChatGPT會(hui)不(bu)(bu)可(ke)避免地寫(xie)出一些(xie)似是(shi)而非(fei)、或者荒謬的(de)(de)(de)(de)(de)(de)(de)(de)答案,這(zhe)將導(dao)致植(zhi)入(ru)虛假數據(ju)和誤導(dao)用(yong)(yong)戶的(de)(de)(de)(de)(de)(de)(de)(de)風險。ChatGPT依然沒(mei)有(you)完(wan)全克服大型語(yu)言模(mo)型(LLM)的(de)(de)(de)(de)(de)(de)(de)(de)這(zhe)一常見缺點;第二(er)、在(zai)(zai)較(jiao)(jiao)長的(de)(de)(de)(de)(de)(de)(de)(de)會(hui)話中,由于(yu)(yu)訓(xun)練(lian)數據(ju)的(de)(de)(de)(de)(de)(de)(de)(de)偏差(cha)和過度(du)修正,ChatGPT會(hui)過度(du)強(qiang)調某些(xie)短語(yu)或者句子,導(dao)致重(zhong)復性高的(de)(de)(de)(de)(de)(de)(de)(de)問(wen)(wen)題(ti)(ti);第三、ChatGPT的(de)(de)(de)(de)(de)(de)(de)(de)強(qiang)大能(neng)(neng)力依賴(lai)語(yu)料(liao)庫、數據(ju)量的(de)(de)(de)(de)(de)(de)(de)(de)抓取和復雜的(de)(de)(de)(de)(de)(de)(de)(de)訓(xun)練(lian)過程。ChatGPT模(mo)型依賴(lai)于(yu)(yu)大規模(mo)離線(xian)語(yu)料(liao)進行(xing)訓(xun)練(lian),往往不(bu)(bu)能(neng)(neng)充分接受并采(cai)用(yong)(yong)在(zai)(zai)線(xian)提供的(de)(de)(de)(de)(de)(de)(de)(de)即(ji)時信(xin)息(xi),難以理(li)解(jie)對(dui)話中提及的(de)(de)(de)(de)(de)(de)(de)(de)因(yin)果關系,也無法基于(yu)(yu)已有(you)信(xin)息(xi)進行(xing)推測,這(zhe)距離人類舉(ju)一反三的(de)(de)(de)(de)(de)(de)(de)(de)能(neng)(neng)力相差(cha)較(jiao)(jiao)遠。
可(ke)能(neng)存在的(de)(de)(de)(de)(de)(de)瓶頸(jing)(jing):ChatGPT本(ben)(ben)身的(de)(de)(de)(de)(de)(de)缺陷可(ke)能(neng)通(tong)過(guo)技術進(jin)步和優(you)化訓(xun)練(lian)方式得到解決,但(dan)它的(de)(de)(de)(de)(de)(de)爆火卻引(yin)(yin)(yin)發了人(ren)們對AIGC行(xing)業中安(an)(an)全性(xing)、倫理約束和創造(zao)力(li)(li)的(de)(de)(de)(de)(de)(de)思考(kao),或(huo)將成為(wei)(wei)(wei)發展瓶頸(jing)(jing):一方面(mian)(mian),由于(yu)RLFH并(bing)不能(neng)完全避免(mian)ChatGPT訓(xun)練(lian)庫中學(xue)習到的(de)(de)(de)(de)(de)(de)不道德或(huo)有(you)(you)偏見的(de)(de)(de)(de)(de)(de)回答(da)(da),也會(hui)導致(zhi)在模糊提示或(huo)引(yin)(yin)(yin)導回答(da)(da)的(de)(de)(de)(de)(de)(de)過(guo)程中讓ChatGPT輸出一些有(you)(you)害(hai)信息,導致(zhi)輸出結(jie)果的(de)(de)(de)(de)(de)(de)安(an)(an)全性(xing)降(jiang)低(di)。另一方面(mian)(mian),在創造(zao)性(xing)、創作(zuo)倫理和知識產權(quan)等(deng)方面(mian)(mian)并(bing)未形成有(you)(you)效界定。在數(shu)據挖掘、大規模計算、統計、多線程工(gong)作(zuo)等(deng)數(shu)據處(chu)理分析領(ling)域(yu),人(ren)工(gong)智能(neng)有(you)(you)著人(ren)類不可(ke)比擬的(de)(de)(de)(de)(de)(de)優(you)勢,但(dan)是(shi)以“創新和感(gan)知”為(wei)(wei)(wei)基(ji)礎(chu)的(de)(de)(de)(de)(de)(de)創造(zao)過(guo)程是(shi)機器學(xue)習和模型難以訓(xun)練(lian)的(de)(de)(de)(de)(de)(de)。目前ChatGPT能(neng)夠在用戶的(de)(de)(de)(de)(de)(de)引(yin)(yin)(yin)導下快(kuai)速生成小說(shuo)、詩歌、散文(wen)、編(bian)程等(deng)需要(yao)創造(zao)力(li)(li)的(de)(de)(de)(de)(de)(de)內(nei)容(rong),或(huo)許將對創作(zuo)者和以版權(quan)為(wei)(wei)(wei)基(ji)礎(chu)的(de)(de)(de)(de)(de)(de)行(xing)業造(zao)成沖擊。文(wen)本(ben)(ben)生成的(de)(de)(de)(de)(de)(de)過(guo)程是(shi)基(ji)于(yu)數(shu)據庫內(nei)容(rong)的(de)(de)(de)(de)(de)(de)學(xue)習,這是(shi)否(fou)會(hui)構(gou)成對被(bei)抓取(qu)作(zuo)品的(de)(de)(de)(de)(de)(de)侵權(quan),ChatGPT生成的(de)(de)(de)(de)(de)(de)文(wen)本(ben)(ben)內(nei)容(rong)是(shi)否(fou)具有(you)(you)著作(zuo)權(quan),是(shi)否(fou)屬(shu)于(yu)該(gai)用戶等(deng)一系列問題的(de)(de)(de)(de)(de)(de)答(da)(da)案尚不明確。
ChatGPT的(de)(de)能(neng)力(li)目(mu)(mu)前(qian)幾(ji)乎可以(yi)涵(han)蓋各個自(zi)然語言(yan)交互(hu)領(ling)(ling)域,例(li)如聊天機器(qi)人(ren)、對話(hua)系統(tong)、智能(neng)客(ke)服(fu)、信息檢索(suo)、主題建(jian)模、文本(ben)生成(cheng)和(he)(he)總(zong)(zong)結、NLP作為服(fu)務(wu)的(de)(de)翻譯、轉錄、總(zong)(zong)結等等,未來應用(yong)領(ling)(ling)域將(jiang)面向藍(lan)海:例(li)如,在(zai)聊天機器(qi)人(ren)領(ling)(ling)域,目(mu)(mu)前(qian)ChatGPT已(yi)經(jing)能(neng)基(ji)本(ben)滿足(zu)用(yong)戶(hu)的(de)(de)提(ti)供個性化需(xu)求和(he)(he)信息提(ti)供服(fu)務(wu);在(zai)需(xu)要智能(neng)客(ke)服(fu)的(de)(de)電商、金融、醫(yi)療(liao)、教(jiao)育(yu)、政務(wu)等垂直領(ling)(ling)域等,ChatGPT能(neng)夠結合行(xing)業(ye)特點和(he)(he)需(xu)求,構(gou)建(jian)自(zi)動應答系統(tong),為客(ke)戶(hu)提(ti)供快速、準確的(de)(de)問題解答。除此(ci)外,在(zai)傳(chuan)媒、娛樂(le)、設計(ji)和(he)(he)影視領(ling)(ling)域,ChatGPT能(neng)夠協助完成(cheng)一些較低層次的(de)(de)任務(wu),包括文稿生成(cheng)、采(cai)訪助手、摘(zhai)要總(zong)(zong)結等,或將(jiang)提(ti)高(gao)行(xing)業(ye)的(de)(de)運行(xing)效率。
ChatGPT的(de)(de)(de)商(shang)業化落地方(fang)式還待商(shang)榷:第(di)一、由于(yu)GPT-3的(de)(de)(de)訓(xun)練耗(hao)資巨(ju)大,且(qie)需(xu)(xu)要大量的(de)(de)(de)數(shu)據集和算力,即使ChatGPT未(wei)來(lai)應用前(qian)景廣闊,如果(guo)不(bu)能降(jiang)低模型(xing)的(de)(de)(de)更新訓(xun)練成本和推(tui)理成本,將限制中小B端企業的(de)(de)(de)采購(gou)意愿。第(di)二、目(mu)前(qian)正在免費(fei)測試階段的(de)(de)(de)ChatGPT還未(wei)解決(jue)GPT-3模型(xing)存在的(de)(de)(de)準確性和安全性問題,還需(xu)(xu)要進(jin)一步優(you)化迭代(dai)。此前(qian),OpenAI已嘗試過通(tong)過API接(jie)口的(de)(de)(de)方(fang)式推(tui)動(dong)GPT-3的(de)(de)(de)商(shang)業化,但由于(yu)模型(xing)問題并(bing)未(wei)通(tong)過測試階段。雖然目(mu)前(qian)OpenAI已找到方(fang)式優(you)化輸(shu)出虛假信息的(de)(de)(de)問題,但效力遠遠不(bu)足(zu)。如果(guo)不(bu)能解決(jue)這兩個問題,GPT的(de)(de)(de)商(shang)業化道路還需(xu)(xu)等待。
投(tou)資建議:ChatGPT代表(biao)自然(ran)語言處理技術一大進步,利好相關AI公司的技術與產品落地,可重點關注拓爾思(300229.SZ)、商湯-W(0020.HK)、科大訊飛(002230.SZ)。
風(feng)險(xian)提示(shi):技術研發(fa)不及(ji)預期(qi)的(de)風(feng)險(xian);商業化落地(di)方式(shi)尚不明確的(de)風(feng)險(xian);下游需求不及(ji)預期(qi)的(de)風(feng)險(xian)。
每(mei)經頭條(tiao)(nbdtoutiao)——
(記者 王曉波)
免(mian)責聲明:本文(wen)內容(rong)與(yu)數(shu)據(ju)僅供參(can)考,不構(gou)成(cheng)投資建(jian)議(yi),使用前請(qing)核實。據(ju)此操作,風險自擔。
如需轉載請與《每日經濟新聞》報社聯系。
未(wei)經《每日經濟新聞》報社授權(quan),嚴禁轉載或鏡(jing)像(xiang),違者必究(jiu)。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。
歡迎關注每日經濟(ji)新聞APP