AI快訊

中國銀河給予計算機行業推薦評級：聊天機器人頂流ChatGPT，開啟自然語言處理領域新篇章

每日經濟(ji)新(xin)聞 2022-12-13 10:39:21

每經AI快訊(xun)，中國銀河12月13日發布研報稱：給予計算機推薦（維持）評級。

事件：12月(yue)1日，美國人(ren)工智能公司OpenAI在網頁上推出自(zi)然(ran)(ran)語言處理領域(yu)（NLP）的(de)(de)(de)模型ChatGPT，它能夠通過對話方式(shi)進行交互，并根據用戶輸入的(de)(de)(de)自(zi)然(ran)(ran)語言文本內(nei)容(rong)，自(zi)動生(sheng)成新的(de)(de)(de)文本內(nei)容(rong)。一周內(nei)，ChatGPT的(de)(de)(de)用戶已突(tu)破(po)100萬。

什么是ChatGPT：ChatGPT是在GPT3.5大(da)模(mo)型(xing)(xing)語言(yan)模(mo)型(xing)(xing)（LLM,即LargeLanguageModel）的(de)(de)基(ji)礎上(shang)，加入(ru)“基(ji)于人類反饋的(de)(de)強化學習（RLHF，ReinforcementLearningfromHumanFeedback）”來不(bu)斷微調（Fine-tune）預訓練語言(yan)模(mo)型(xing)(xing)，使得(de)LLM模(mo)型(xing)(xing)學會理解不(bu)同類型(xing)(xing)的(de)(de)命令指令，并通(tong)過多重標(biao)(biao)準(zhun)合理判斷基(ji)于給定的(de)(de)prompt輸(shu)入(ru)指令，輸(shu)出的(de)(de)是否為優質(zhi)信(xin)息(xi)(xi)（這些標(biao)(biao)準(zhun)包括：富含信(xin)息(xi)(xi)、內容豐富、對(dui)用戶有幫助、無害、不(bu)包含歧視(shi)信(xin)息(xi)(xi)等）。

ChatGPT引(yin)爆AIGC，AIGC將迎(ying)多(duo)場(chang)景爆發(fa)(fa)期：AIGC即AI-GeneratedContent，是(shi)繼UGC、PGC之后利用AI技術(shu)自動(dong)生(sheng)成內容的(de)新型(xing)生(sheng)產方式。相比UGC和PGC，AIGC的(de)最大不同是(shi)基(ji)于海量數據、風格(ge)隨機(ji)多(duo)變、跨模態融(rong)合、認(ren)知交互力等新技術(shu)導(dao)向特征。隨著(zhu)ChatGPT的(de)技術(shu)日漸成熟，AIGC將在(zai)電商(shang)虛(xu)擬主播、教育、金融(rong)、醫療、影視娛樂等多(duo)場(chang)景爆發(fa)(fa)，并進(jin)一步催生(sheng)元宇宙(zhou)的(de)快速發(fa)(fa)展(zhan)。

ChatGPT的(de)(de)(de)(de)(de)(de)(de)(de)(de)技術發展路徑(jing):從GPT-1到InstructGPT，數(shu)(shu)據(ju)量(liang)(liang)與參(can)數(shu)(shu)量(liang)(liang)不斷增加，模(mo)(mo)型(xing)精度和(he)能(neng)力提升：2018年(nian)，在(zai)(zai)(zai)自然(ran)語(yu)言(yan)處理(li)領(ling)域(yu)（NLP）剛興(xing)起時，OpenAI就(jiu)推出了(le)初代(dai)GPT，它的(de)(de)(de)(de)(de)(de)(de)(de)(de)運(yun)行(xing)邏輯(ji)是(shi)：先通(tong)過無(wu)標(biao)簽數(shu)(shu)據(ju)學(xue)習(xi)(xi)(xi)(xi)生(sheng)(sheng)成語(yu)言(yan)模(mo)(mo)型(xing)，并能(neng)夠運(yun)用(yong)(yong)于(yu)(yu)一些與有(you)監(jian)(jian)督任(ren)(ren)(ren)務(wu)無(wu)關的(de)(de)(de)(de)(de)(de)(de)(de)(de)NLP任(ren)(ren)(ren)務(wu)中(zhong)。此后再根據(ju)特定的(de)(de)(de)(de)(de)(de)(de)(de)(de)下游任(ren)(ren)(ren)務(wu)進行(xing)有(you)監(jian)(jian)督的(de)(de)(de)(de)(de)(de)(de)(de)(de)微調，提高(gao)其泛化(hua)能(neng)力。GPT-2擴展了(le)網絡參(can)數(shu)(shu)和(he)數(shu)(shu)據(ju)集，進行(xing)多(duo)任(ren)(ren)(ren)務(wu)學(xue)習(xi)(xi)(xi)(xi)，可(ke)以在(zai)(zai)(zai)數(shu)(shu)據(ju)量(liang)(liang)足夠豐富且(qie)模(mo)(mo)型(xing)容(rong)量(liang)(liang)足夠大(da)(da)時，通(tong)過訓(xun)練語(yu)言(yan)模(mo)(mo)型(xing)就(jiu)能(neng)夠完成有(you)監(jian)(jian)督學(xue)習(xi)(xi)(xi)(xi)的(de)(de)(de)(de)(de)(de)(de)(de)(de)任(ren)(ren)(ren)務(wu)。對比GPT-2，2020年(nian)推出的(de)(de)(de)(de)(de)(de)(de)(de)(de)GPT-3最(zui)(zui)顯(xian)著的(de)(de)(de)(de)(de)(de)(de)(de)(de)特征(zheng)是(shi)龐大(da)(da)的(de)(de)(de)(de)(de)(de)(de)(de)(de)數(shu)(shu)據(ju)量(liang)(liang)和(he)參(can)數(shu)(shu)投入，整體訓(xun)練過程耗(hao)資1200萬美元，投入數(shu)(shu)據(ju)量(liang)(liang)達上萬億(yi)，模(mo)(mo)型(xing)參(can)數(shu)(shu)量(liang)(liang)達到1750億(yi)。GPT-3延(yan)續了(le)前(qian)兩代(dai)GPT的(de)(de)(de)(de)(de)(de)(de)(de)(de)技術架構，但(dan)改(gai)變(bian)了(le)“大(da)(da)規模(mo)(mo)數(shu)(shu)據(ju)集預(yu)訓(xun)練+下游數(shu)(shu)據(ju)標(biao)注微調”的(de)(de)(de)(de)(de)(de)(de)(de)(de)方(fang)(fang)式(shi)，采(cai)用(yong)(yong)情(qing)境(jing)學(xue)習(xi)(xi)(xi)(xi)（in-contextlearning）來提高(gao)模(mo)(mo)型(xing)對話輸(shu)出的(de)(de)(de)(de)(de)(de)(de)(de)(de)性(xing)能(neng)。GPT-3的(de)(de)(de)(de)(de)(de)(de)(de)(de)規模(mo)(mo)和(he)語(yu)言(yan)能(neng)力幾乎(hu)是(shi)最(zui)(zui)強(qiang)大(da)(da)的(de)(de)(de)(de)(de)(de)(de)(de)(de)。它能(neng)在(zai)(zai)(zai)不做微調的(de)(de)(de)(de)(de)(de)(de)(de)(de)情(qing)況下，在(zai)(zai)(zai)一些傳統的(de)(de)(de)(de)(de)(de)(de)(de)(de)NLP任(ren)(ren)(ren)務(wu)中(zhong)表現得更(geng)(geng)好，包(bao)括實(shi)現閉卷問(wen)答、模(mo)(mo)式(shi)解(jie)析、純語(yu)言(yan)建模(mo)(mo)、機(ji)器(qi)翻譯等；在(zai)(zai)(zai)新(xin)的(de)(de)(de)(de)(de)(de)(de)(de)(de)領(ling)域(yu)，GPT-3將NLP的(de)(de)(de)(de)(de)(de)(de)(de)(de)應用(yong)(yong)擴展到缺乏足夠訓(xun)練數(shu)(shu)據(ju)的(de)(de)(de)(de)(de)(de)(de)(de)(de)領(ling)域(yu)，例如在(zai)(zai)(zai)開發程序代(dai)碼(ma)、文章生(sheng)(sheng)成和(he)信息檢索領(ling)域(yu)取(qu)得了(le)實(shi)質性(xing)的(de)(de)(de)(de)(de)(de)(de)(de)(de)進展。然(ran)而，GPT-3在(zai)(zai)(zai)推理(li)和(he)理(li)解(jie)能(neng)力上還有(you)較長(chang)的(de)(de)(de)(de)(de)(de)(de)(de)(de)路要走，在(zai)(zai)(zai)自然(ran)語(yu)言(yan)推理(li)（NLI）任(ren)(ren)(ren)務(wu)中(zhong)表現不佳(jia)。InstructGPT和(he)ChatGPT：更(geng)(geng)好地遵循用(yong)(yong)戶意圖、更(geng)(geng)少的(de)(de)(de)(de)(de)(de)(de)(de)(de)虛假信息。OpenAI在(zai)(zai)(zai)2022年(nian)初發布了(le)InstructGPT。該語(yu)言(yan)模(mo)(mo)型(xing)通(tong)過“基于(yu)(yu)人類反饋的(de)(de)(de)(de)(de)(de)(de)(de)(de)強(qiang)化(hua)學(xue)習(xi)(xi)(xi)(xi)（RLHF）和(he)監(jian)(jian)督學(xue)習(xi)(xi)(xi)(xi)”來提高(gao)輸(shu)出質量(liang)(liang)。雖(sui)然(ran)InstructGPT的(de)(de)(de)(de)(de)(de)(de)(de)(de)參(can)數(shu)(shu)量(liang)(liang)僅為13億(yi)左右，相比于(yu)(yu)GPT-3縮小(xiao)了(le)100倍以上；但(dan)在(zai)(zai)(zai)遵循指令方(fang)(fang)面，能(neng)夠更(geng)(geng)好地遵循用(yong)(yong)戶意圖，將有(you)害的(de)(de)(de)(de)(de)(de)(de)(de)(de)、不真實(shi)或者有(you)偏差的(de)(de)(de)(de)(de)(de)(de)(de)(de)信息輸(shu)出最(zui)(zui)小(xiao)化(hua)。在(zai)(zai)(zai)優化(hua)的(de)(de)(de)(de)(de)(de)(de)(de)(de)模(mo)(mo)型(xing)上，ChatGPT基于(yu)(yu)InstructGPT進一步(bu)改(gai)進，在(zai)(zai)(zai)模(mo)(mo)型(xing)結構和(he)訓(xun)練流程上遵循上述方(fang)(fang)式(shi)，但(dan)收集和(he)標(biao)注數(shu)(shu)據(ju)的(de)(de)(de)(de)(de)(de)(de)(de)(de)方(fang)(fang)式(shi)上發生(sheng)(sheng)了(le)變(bian)化(hua)，通(tong)過采(cai)取(qu)監(jian)(jian)督學(xue)習(xi)(xi)(xi)(xi)的(de)(de)(de)(de)(de)(de)(de)(de)(de)方(fang)(fang)式(shi)讓(rang)模(mo)(mo)型(xing)學(xue)習(xi)(xi)(xi)(xi)人類排序的(de)(de)(de)(de)(de)(de)(de)(de)(de)方(fang)(fang)式(shi)。

ChatGPT的(de)(de)(de)(de)(de)(de)(de)(de)優勢與缺陷：優勢是(shi)ChatGPT不(bu)(bu)需要(yao)任何(he)額外的(de)(de)(de)(de)(de)(de)(de)(de)訓(xun)練(lian)就能(neng)(neng)在(zai)(zai)多種不(bu)(bu)同的(de)(de)(de)(de)(de)(de)(de)(de)領域中應用(yong)(yong)并快速輸出高質量的(de)(de)(de)(de)(de)(de)(de)(de)文本，相較(jiao)(jiao)于(yu)(yu)以前的(de)(de)(de)(de)(de)(de)(de)(de)模(mo)型已具備較(jiao)(jiao)強(qiang)的(de)(de)(de)(de)(de)(de)(de)(de)自然語(yu)言處(chu)理(li)能(neng)(neng)力。但(dan)目前ChatGPT在(zai)(zai)精(jing)準性、真(zhen)實(shi)性、重(zhong)復率(lv)和依賴(lai)性等(deng)問(wen)(wen)題(ti)(ti)上尚待改善：第一、由于(yu)(yu)技術實(shi)現的(de)(de)(de)(de)(de)(de)(de)(de)問(wen)(wen)題(ti)(ti)，ChatGPT會(hui)不(bu)(bu)可(ke)避免地寫(xie)出一些(xie)似是(shi)而非(fei)、或者荒謬的(de)(de)(de)(de)(de)(de)(de)(de)答案，這(zhe)將導(dao)致植(zhi)入(ru)虛假數據(ju)和誤導(dao)用(yong)(yong)戶的(de)(de)(de)(de)(de)(de)(de)(de)風險。ChatGPT依然沒(mei)有(you)完(wan)全克服大型語(yu)言模(mo)型（LLM）的(de)(de)(de)(de)(de)(de)(de)(de)這(zhe)一常見缺點；第二(er)、在(zai)(zai)較(jiao)(jiao)長的(de)(de)(de)(de)(de)(de)(de)(de)會(hui)話中，由于(yu)(yu)訓(xun)練(lian)數據(ju)的(de)(de)(de)(de)(de)(de)(de)(de)偏差(cha)和過度(du)修正，ChatGPT會(hui)過度(du)強(qiang)調某些(xie)短語(yu)或者句子，導(dao)致重(zhong)復性高的(de)(de)(de)(de)(de)(de)(de)(de)問(wen)(wen)題(ti)(ti)；第三、ChatGPT的(de)(de)(de)(de)(de)(de)(de)(de)強(qiang)大能(neng)(neng)力依賴(lai)語(yu)料(liao)庫、數據(ju)量的(de)(de)(de)(de)(de)(de)(de)(de)抓取和復雜的(de)(de)(de)(de)(de)(de)(de)(de)訓(xun)練(lian)過程。ChatGPT模(mo)型依賴(lai)于(yu)(yu)大規模(mo)離線(xian)語(yu)料(liao)進行(xing)訓(xun)練(lian)，往往不(bu)(bu)能(neng)(neng)充分接受并采(cai)用(yong)(yong)在(zai)(zai)線(xian)提供的(de)(de)(de)(de)(de)(de)(de)(de)即(ji)時信(xin)息(xi)，難以理(li)解(jie)對(dui)話中提及的(de)(de)(de)(de)(de)(de)(de)(de)因(yin)果關系，也無法基于(yu)(yu)已有(you)信(xin)息(xi)進行(xing)推測，這(zhe)距離人類舉(ju)一反三的(de)(de)(de)(de)(de)(de)(de)(de)能(neng)(neng)力相差(cha)較(jiao)(jiao)遠。

可(ke)能(neng)存在的(de)(de)(de)(de)(de)(de)瓶頸(jing)(jing)：ChatGPT本(ben)(ben)身的(de)(de)(de)(de)(de)(de)缺陷可(ke)能(neng)通(tong)過(guo)技術進(jin)步和優(you)化訓(xun)練(lian)方式得到解決，但(dan)它的(de)(de)(de)(de)(de)(de)爆火卻引(yin)(yin)(yin)發了人(ren)們對AIGC行(xing)業中安(an)(an)全性(xing)、倫理約束和創造(zao)力(li)(li)的(de)(de)(de)(de)(de)(de)思考(kao)，或(huo)將成為(wei)(wei)(wei)發展瓶頸(jing)(jing)：一方面(mian)(mian)，由于(yu)RLFH并(bing)不能(neng)完全避免(mian)ChatGPT訓(xun)練(lian)庫中學(xue)習到的(de)(de)(de)(de)(de)(de)不道德或(huo)有(you)(you)偏見的(de)(de)(de)(de)(de)(de)回答(da)(da)，也會(hui)導致(zhi)在模糊提示或(huo)引(yin)(yin)(yin)導回答(da)(da)的(de)(de)(de)(de)(de)(de)過(guo)程中讓ChatGPT輸出一些有(you)(you)害(hai)信息，導致(zhi)輸出結(jie)果的(de)(de)(de)(de)(de)(de)安(an)(an)全性(xing)降(jiang)低(di)。另一方面(mian)(mian)，在創造(zao)性(xing)、創作(zuo)倫理和知識產權(quan)等(deng)方面(mian)(mian)并(bing)未形成有(you)(you)效界定。在數(shu)據挖掘、大規模計算、統計、多線程工(gong)作(zuo)等(deng)數(shu)據處(chu)理分析領(ling)域(yu)，人(ren)工(gong)智能(neng)有(you)(you)著人(ren)類不可(ke)比擬的(de)(de)(de)(de)(de)(de)優(you)勢，但(dan)是(shi)以“創新和感(gan)知”為(wei)(wei)(wei)基(ji)礎(chu)的(de)(de)(de)(de)(de)(de)創造(zao)過(guo)程是(shi)機器學(xue)習和模型難以訓(xun)練(lian)的(de)(de)(de)(de)(de)(de)。目前ChatGPT能(neng)夠在用戶的(de)(de)(de)(de)(de)(de)引(yin)(yin)(yin)導下快(kuai)速生成小說(shuo)、詩歌、散文(wen)、編(bian)程等(deng)需要(yao)創造(zao)力(li)(li)的(de)(de)(de)(de)(de)(de)內(nei)容(rong)，或(huo)許將對創作(zuo)者和以版權(quan)為(wei)(wei)(wei)基(ji)礎(chu)的(de)(de)(de)(de)(de)(de)行(xing)業造(zao)成沖擊。文(wen)本(ben)(ben)生成的(de)(de)(de)(de)(de)(de)過(guo)程是(shi)基(ji)于(yu)數(shu)據庫內(nei)容(rong)的(de)(de)(de)(de)(de)(de)學(xue)習，這是(shi)否(fou)會(hui)構(gou)成對被(bei)抓取(qu)作(zuo)品的(de)(de)(de)(de)(de)(de)侵權(quan)，ChatGPT生成的(de)(de)(de)(de)(de)(de)文(wen)本(ben)(ben)內(nei)容(rong)是(shi)否(fou)具有(you)(you)著作(zuo)權(quan)，是(shi)否(fou)屬(shu)于(yu)該(gai)用戶等(deng)一系列問題的(de)(de)(de)(de)(de)(de)答(da)(da)案尚不明確。

ChatGPT的(de)(de)能(neng)力(li)目(mu)(mu)前(qian)幾(ji)乎可以(yi)涵(han)蓋各個自(zi)然語言(yan)交互(hu)領(ling)(ling)域，例(li)如聊天機器(qi)人(ren)、對話(hua)系統(tong)、智能(neng)客(ke)服(fu)、信息檢索(suo)、主題建(jian)模、文本(ben)生成(cheng)和(he)(he)總(zong)(zong)結、NLP作為服(fu)務(wu)的(de)(de)翻譯、轉錄、總(zong)(zong)結等等，未來應用(yong)領(ling)(ling)域將(jiang)面向藍(lan)海：例(li)如，在(zai)聊天機器(qi)人(ren)領(ling)(ling)域，目(mu)(mu)前(qian)ChatGPT已(yi)經(jing)能(neng)基(ji)本(ben)滿足(zu)用(yong)戶(hu)的(de)(de)提(ti)供個性化需(xu)求和(he)(he)信息提(ti)供服(fu)務(wu)；在(zai)需(xu)要智能(neng)客(ke)服(fu)的(de)(de)電商、金融、醫(yi)療(liao)、教(jiao)育(yu)、政務(wu)等垂直領(ling)(ling)域等，ChatGPT能(neng)夠結合行(xing)業(ye)特點和(he)(he)需(xu)求，構(gou)建(jian)自(zi)動應答系統(tong)，為客(ke)戶(hu)提(ti)供快速、準確的(de)(de)問題解答。除此(ci)外，在(zai)傳(chuan)媒、娛樂(le)、設計(ji)和(he)(he)影視領(ling)(ling)域，ChatGPT能(neng)夠協助完成(cheng)一些較低層次的(de)(de)任務(wu)，包括文稿生成(cheng)、采(cai)訪助手、摘(zhai)要總(zong)(zong)結等，或將(jiang)提(ti)高(gao)行(xing)業(ye)的(de)(de)運行(xing)效率。

ChatGPT的(de)(de)(de)商(shang)業化落地方(fang)式還待商(shang)榷：第(di)一、由于(yu)GPT-3的(de)(de)(de)訓(xun)練耗(hao)資巨(ju)大，且(qie)需(xu)(xu)要大量的(de)(de)(de)數(shu)據集和算力，即使ChatGPT未(wei)來(lai)應用前(qian)景廣闊，如果(guo)不(bu)能降(jiang)低模型(xing)的(de)(de)(de)更新訓(xun)練成本和推(tui)理成本，將限制中小B端企業的(de)(de)(de)采購(gou)意愿。第(di)二、目(mu)前(qian)正在免費(fei)測試階段的(de)(de)(de)ChatGPT還未(wei)解決(jue)GPT-3模型(xing)存在的(de)(de)(de)準確性和安全性問題，還需(xu)(xu)要進(jin)一步優(you)化迭代(dai)。此前(qian)，OpenAI已嘗試過通(tong)過API接(jie)口的(de)(de)(de)方(fang)式推(tui)動(dong)GPT-3的(de)(de)(de)商(shang)業化，但由于(yu)模型(xing)問題并(bing)未(wei)通(tong)過測試階段。雖然目(mu)前(qian)OpenAI已找到方(fang)式優(you)化輸(shu)出虛假信息的(de)(de)(de)問題，但效力遠遠不(bu)足(zu)。如果(guo)不(bu)能解決(jue)這兩個問題，GPT的(de)(de)(de)商(shang)業化道路還需(xu)(xu)等待。

投(tou)資建議：ChatGPT代表(biao)自然(ran)語言處理技術一大進步，利好相關AI公司的技術與產品落地，可重點關注拓爾思（300229.SZ)、商湯-W（0020.HK)、科大訊飛(002230.SZ)。

風(feng)險(xian)提示(shi)：技術研發(fa)不及(ji)預期(qi)的(de)風(feng)險(xian)；商業化落地(di)方式(shi)尚不明確的(de)風(feng)險(xian)；下游需求不及(ji)預期(qi)的(de)風(feng)險(xian)。

每(mei)經頭條(tiao)（nbdtoutiao）——

(記者王曉波)

免(mian)責聲明：本文(wen)內容(rong)與(yu)數(shu)據(ju)僅供參(can)考，不構(gou)成(cheng)投資建(jian)議(yi)，使用前請(qing)核實。據(ju)此操作，風險自擔。

如需轉載請與《每日經濟新聞》報社聯系。
未(wei)經《每日經濟新聞》報社授權(quan)，嚴禁轉載或鏡(jing)像(xiang)，違者必究(jiu)。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現在本站，可聯系我們要求撤下您的作品。

每經AI快訊，中國銀河12月13日發布研報稱：給予計算機推薦（維持）評級。事件：12月1日，美國人工智能公司OpenAI在網頁上推出自然語言處理領域（NLP）的模型ChatGPT，它能夠通過對話方式進行交互，并根據用戶輸入的自然語言文本內容，自動生成新的文本內容。一周內，ChatGPT的用戶已突破100萬。什么是ChatGPT：ChatGPT是在GPT3.5大模型語言模型（LLM,即LargeLanguageModel）的基礎上，加入“基于人類反饋的強化學習（RLHF，ReinforcementLearningfromHumanFeedback）”來不斷微調（Fine-tune）預訓練語言模型，使得LLM模型學會理解不同類型的命令指令，并通過多重標準合理判斷基于給定的prompt輸入指令，輸出的是否為優質信息（這些標準包括：富含信息、內容豐富、對用戶有幫助、無害、不包含歧視信息等）。 ChatGPT引爆AIGC，AIGC將迎多場景爆發期：AIGC即AI-GeneratedContent，是繼UGC、PGC之后利用AI技術自動生成內容的新型生產方式。相比UGC和PGC，AIGC的最大不同是基于海量數據、風格隨機多變、跨模態融合、認知交互力等新技術導向特征。隨著ChatGPT的技術日漸成熟，AIGC將在電商虛擬主播、教育、金融、醫療、影視娛樂等多場景爆發，并進一步催生元宇宙的快速發展。 ChatGPT的技術發展路徑:從GPT-1到InstructGPT，數據量與參數量不斷增加，模型精度和能力提升：2018年，在自然語言處理領域（NLP）剛興起時，OpenAI就推出了初代GPT，它的運行邏輯是：先通過無標簽數據學習生成語言模型，并能夠運用于一些與有監督任務無關的NLP任務中。此后再根據特定的下游任務進行有監督的微調，提高其泛化能力。GPT-2擴展了網絡參數和數據集，進行多任務學習，可以在數據量足夠豐富且模型容量足夠大時，通過訓練語言模型就能夠完成有監督學習的任務。對比GPT-2，2020年推出的GPT-3最顯著的特征是龐大的數據量和參數投入，整體訓練過程耗資1200萬美元，投入數據量達上萬億，模型參數量達到1750億。GPT-3延續了前兩代GPT的技術架構，但改變了“大規模數據集預訓練+下游數據標注微調”的方式，采用情境學習（in-contextlearning）來提高模型對話輸出的性能。GPT-3的規模和語言能力幾乎是最強大的。它能在不做微調的情況下，在一些傳統的NLP任務中表現得更好，包括實現閉卷問答、模式解析、純語言建模、機器翻譯等；在新的領域，GPT-3將NLP的應用擴展到缺乏足夠訓練數據的領域，例如在開發程序代碼、文章生成和信息檢索領域取得了實質性的進展。然而，GPT-3在推理和理解能力上還有較長的路要走，在自然語言推理（NLI）任務中表現不佳。InstructGPT和ChatGPT：更好地遵循用戶意圖、更少的虛假信息。OpenAI在2022年初發布了InstructGPT。該語言模型通過“基于人類反饋的強化學習（RLHF）和監督學習”來提高輸出質量。雖然InstructGPT的參數量僅為13億左右，相比于GPT-3縮小了100倍以上；但在遵循指令方面，能夠更好地遵循用戶意圖，將有害的、不真實或者有偏差的信息輸出最小化。在優化的模型上，ChatGPT基于InstructGPT進一步改進，在模型結構和訓練流程上遵循上述方式，但收集和標注數據的方式上發生了變化，通過采取監督學習的方式讓模型學習人類排序的方式。 ChatGPT的優勢與缺陷：優勢是ChatGPT不需要任何額外的訓練就能在多種不同的領域中應用并快速輸出高質量的文本，相較于以前的模型已具備較強的自然語言處理能力。但目前ChatGPT在精準性、真實性、重復率和依賴性等問題上尚待改善：第一、由于技術實現的問題，ChatGPT會不可避免地寫出一些似是而非、或者荒謬的答案，這將導致植入虛假數據和誤導用戶的風險。ChatGPT依然沒有完全克服大型語言模型（LLM）的這一常見缺點；第二、在較長的會話中，由于訓練數據的偏差和過度修正，ChatGPT會過度強調某些短語或者句子，導致重復性高的問題；第三、ChatGPT的強大能力依賴語料庫、數據量的抓取和復雜的訓練過程。ChatGPT模型依賴于大規模離線語料進行訓練，往往不能充分接受并采用在線提供的即時信息，難以理解對話中提及的因果關系，也無法基于已有信息進行推測，這距離人類舉一反三的能力相差較遠。可能存在的瓶頸：ChatGPT本身的缺陷可能通過技術進步和優化訓練方式得到解決，但它的爆火卻引發了人們對AIGC行業中安全性、倫理約束和創造力的思考，或將成為發展瓶頸：一方面，由于RLFH并不能完全避免ChatGPT訓練庫中學習到的不道德或有偏見的回答，也會導致在模糊提示或引導回答的過程中讓ChatGPT輸出一些有害信息，導致輸出結果的安全性降低。另一方面，在創造性、創作倫理和知識產權等方面并未形成有效界定。在數據挖掘、大規模計算、統計、多線程工作等數據處理分析領域，人工智能有著人類不可比擬的優勢，但是以“創新和感知”為基礎的創造過程是機器學習和模型難以訓練的。目前ChatGPT能夠在用戶的引導下快速生成小說、詩歌、散文、編程等需要創造力的內容，或許將對創作者和以版權為基礎的行業造成沖擊。文本生成的過程是基于數據庫內容的學習，這是否會構成對被抓取作品的侵權，ChatGPT生成的文本內容是否具有著作權，是否屬于該用戶等一系列問題的答案尚不明確。 ChatGPT的能力目前幾乎可以涵蓋各個自然語言交互領域，例如聊天機器人、對話系統、智能客服、信息檢索、主題建模、文本生成和總結、NLP作為服務的翻譯、轉錄、總結等等，未來應用領域將面向藍海：例如，在聊天機器人領域，目前ChatGPT已經能基本滿足用戶的提供個性化需求和信息提供服務；在需要智能客服的電商、金融、醫療、教育、政務等垂直領域等，ChatGPT能夠結合行業特點和需求，構建自動應答系統，為客戶提供快速、準確的問題解答。除此外，在傳媒、娛樂、設計和影視領域，ChatGPT能夠協助完成一些較低層次的任務，包括文稿生成、采訪助手、摘要總結等，或將提高行業的運行效率。 ChatGPT的商業化落地方式還待商榷：第一、由于GPT-3的訓練耗資巨大，且需要大量的數據集和算力，即使ChatGPT未來應用前景廣闊，如果不能降低模型的更新訓練成本和推理成本，將限制中小B端企業的采購意愿。第二、目前正在免費測試階段的ChatGPT還未解決GPT-3模型存在的準確性和安全性問題，還需要進一步優化迭代。此前，OpenAI已嘗試過通過API接口的方式推動GPT-3的商業化，但由于模型問題并未通過測試階段。雖然目前OpenAI已找到方式優化輸出虛假信息的問題，但效力遠遠不足。如果不能解決這兩個問題，GPT的商業化道路還需等待。投資建議：ChatGPT代表自然語言處理技術一大進步，利好相關AI公司的技術與產品落地，可重點關注拓爾思（300229.SZ)、商湯-W（0020.HK)、科大訊飛(002230.SZ)。風險提示：技術研發不及預期的風險；商業化落地方式尚不明確的風險；下游需求不及預期的風險。免責聲明：本文內容與數據僅供參考，不構成投資建議，使用前核實。據此操作，風險自擔。

上一篇文章

張朝陽、彭凱平《星空下的對話(hua)》：談(tan)焦慮、大腦可塑性和(he)行為心理學

返回每經網首頁

下一篇文章

教(jiao)育(yu)部：進一步加強學科(ke)類隱(yin)形變異培訓防范治理工(gong)作

熱文精選