每(mei)日經濟新聞 2023-10-27 14:43:49
◎騰訊(xun)機器學(xue)習(xi)平臺算法負責人(ren)康戰輝表(biao)示(shi),目前騰訊(xun)研發大(da)模(mo)型有兩(liang)個方向:在通用大(da)模(mo)型上,相比于成本(ben)投(tou)入而言,騰訊(xun)更(geng)重視效果,強(qiang)調長期(qi)投(tou)入;在小型模(mo)型上,希望能(neng)更(geng)加(jia)精細化,將不同的(de)模(mo)型應用到不同場景,同時更(geng)加(jia)考(kao)慮投(tou)入和產出的(de)性價比和效益。
◎在能力提升方面,混元大模型(xing)一大亮點是(shi)開放“文(wen)生圖(tu)”功能。“文(wen)生圖(tu)”能夠實(shi)現輸入對(dui)圖(tu)片(pian)(pian)的描述(shu)文(wen)字后(hou),AI(人工(gong)智能)平臺(tai)根(gen)據文(wen)字描述(shu)生成(cheng)對(dui)應的圖(tu)片(pian)(pian),是(shi)AIGC(生成(cheng)式人工(gong)智能)具有廣泛應用前景的場景之一,也是(shi)全球大模型(xing)競速(su)下(xia)的“主(zhu)戰場”之一。
每經(jing)記(ji)者|王(wang)帆 每經(jing)編(bian)輯|魏官紅(hong)
10月26日(ri),《每日(ri)經濟新聞》記者從騰(teng)訊方面獲悉,騰(teng)訊混(hun)元(yuan)(yuan)大(da)模(mo)型迎來(lai)全(quan)新升級,升級后的騰(teng)訊混(hun)元(yuan)(yuan)中文能(neng)(neng)力(li)整體超過GPT3.5,代碼(ma)能(neng)(neng)力(li)大(da)幅提(ti)升20%。此(ci)外,騰(teng)訊宣布正式(shi)對外開放(fang)混(hun)元(yuan)(yuan)大(da)模(mo)型“文生圖”功能(neng)(neng)。
本次升級距離騰訊(xun)正(zheng)式發布混(hun)元(yuan)大(da)模型不到兩個(ge)月。據騰訊(xun)透(tou)露,目前超過(guo)180個(ge)騰訊(xun)內部業(ye)務(wu)已接入騰訊(xun)混(hun)元(yuan),已有來自零(ling)售、教育、金融、醫(yi)療、傳媒(mei)、交通(tong)、政務(wu)等多個(ge)行業(ye)的客戶通(tong)過(guo)騰訊(xun)云調用騰訊(xun)混(hun)元(yuan)大(da)模型API。
對(dui)于(yu)(yu)混元(yuan)大(da)模型前(qian)期訓(xun)(xun)練成(cheng)本投(tou)入(ru)(ru)的(de)(de)(de)問題(ti),騰訊機器學習平臺算法負責人康戰輝在接受采訪(fang)時(shi)表示(shi),混元(yuan)作為千億(yi)級(ji)參數規模的(de)(de)(de)大(da)模型,目前(qian)訓(xun)(xun)練成(cheng)本較高(gao)。對(dui)于(yu)(yu)適(shi)用于(yu)(yu)復雜場景的(de)(de)(de)通用大(da)模型,相比于(yu)(yu)成(cheng)本投(tou)入(ru)(ru)而(er)言,騰訊更(geng)重視(shi)效果;而(er)一(yi)些(xie)細化場景可以使用小模型,更(geng)強調成(cheng)本投(tou)入(ru)(ru)的(de)(de)(de)高(gao)性價比。
9月7日,在2023騰訊(xun)全(quan)球數字生(sheng)態大(da)會上(shang),騰訊(xun)混元大(da)模(mo)型正式亮相,并宣布通過騰訊(xun)云(yun)對外開(kai)放。如今,騰訊(xun)公布了最新進展。
在內部(bu)應用(yong)上,超過(guo)180個(ge)騰(teng)訊(xun)內部(bu)業務已接入(ru)騰(teng)訊(xun)混元(yuan),包括騰(teng)訊(xun)會(hui)議、騰(teng)訊(xun)文檔(dang)、企業微信(xin)、騰(teng)訊(xun)廣告和(he)微信(xin)搜一搜等(deng)。最近,QQ瀏覽器還基于騰(teng)訊(xun)混元(yuan)推(tui)出(chu)了“PDF閱讀助手”,具備智能(neng)(neng)摘要、智能(neng)(neng)問答(da)和(he)多輪提問等(deng)功能(neng)(neng)。記者注意到(dao),實際上,騰(teng)訊(xun)混元(yuan)通過(guo)自家應用(yong),也間接面向(xiang)外部(bu)C端用(yong)戶。
外部用(yong)戶方面(mian)(mian),已(yi)有來(lai)自零(ling)售(shou)、教育、金融、醫療、傳媒、交通、政務(wu)等多個(ge)行業(ye)的客(ke)戶,通過(guo)(guo)騰(teng)訊云調用(yong)騰(teng)訊混(hun)元(yuan)(yuan)大(da)模(mo)型(xing)API,應用(yong)領域涉及智能問答(da)、內容(rong)創作(zuo)、數據分(fen)析、代碼助手(shou)等多個(ge)場景。今年9月首批通過(guo)(guo)備案后(hou),騰(teng)訊混(hun)元(yuan)(yuan)大(da)模(mo)型(xing)也已(yi)經面(mian)(mian)向C端(duan)用(yong)戶陸續開放體(ti)驗,用(yong)戶通過(guo)(guo)小(xiao)程序(xu)或網(wang)頁端(duan),就能與騰(teng)訊混(hun)元(yuan)(yuan)對話。
在能(neng)力提升方(fang)面,一大(da)亮點是(shi)開放混元大(da)模型(xing)“文生圖(tu)(tu)”功能(neng)。“文生圖(tu)(tu)”能(neng)夠(gou)實現輸入(ru)對圖(tu)(tu)片的(de)(de)描(miao)(miao)述文字(zi)后(hou),AI(人工智能(neng))平臺根據(ju)文字(zi)描(miao)(miao)述生成(cheng)(cheng)對應的(de)(de)圖(tu)(tu)片,是(shi)AIGC(生成(cheng)(cheng)式(shi)人工智能(neng))具(ju)有廣泛應用(yong)前景的(de)(de)場景之一,也是(shi)全球大(da)模型(xing)競(jing)速下的(de)(de)“主(zhu)戰場”之一。
10月26日(ri),騰(teng)訊(xun)混(hun)元(yuan)大模型“文生(sheng)圖”技術負責人蘆清林(lin)在接受包括每日(ri)經(jing)濟(ji)新聞(wen)在內(nei)的(de)媒(mei)體采訪(fang)時表示(shi),大模型“文生(sheng)圖”的(de)難點體現在對(dui)提(ti)示(shi)詞的(de)語(yu)義理(li)解、生(sheng)成(cheng)(cheng)內(nei)容(rong)的(de)合理(li)性(xing)以及生(sheng)成(cheng)(cheng)圖片(pian)的(de)效(xiao)果。針對(dui)這(zhe)三個技術難點,騰(teng)訊(xun)進行了專項(xiang)的(de)技術研究,提(ti)出了一(yi)系(xi)列原(yuan)創(chuang)算法(fa)來保證(zheng)生(sheng)成(cheng)(cheng)圖片(pian)的(de)可(ke)用(yong)性(xing)和畫質。目前騰(teng)訊(xun)混(hun)元(yuan)“文生(sheng)圖”能(neng)力,已經(jing)被用(yong)于素材創(chuang)作、商品合成(cheng)(cheng)、游戲出圖等(deng)多項(xiang)業務(wu)中。
此外(wai),騰訊(xun)(xun)也升級了(le)混(hun)元(yuan)(yuan)的(de)代(dai)(dai)碼、數(shu)學能力。記者(zhe)了(le)解到,混(hun)元(yuan)(yuan)大模(mo)(mo)型(xing)經過(guo)對32種(zhong)主(zhu)流(liu)語言代(dai)(dai)碼文件、各(ge)類計(ji)算(suan)機(ji)書籍和(he)博(bo)客的(de)學習增訓,代(dai)(dai)碼處理水平提升超過(guo)20%,騰訊(xun)(xun)內(nei)部(bu)目前已經有多個開發平臺接入了(le)騰訊(xun)(xun)混(hun)元(yuan)(yuan)大模(mo)(mo)型(xing),工程師們可以使用騰訊(xun)(xun)混(hun)元(yuan)(yuan)來進行代(dai)(dai)碼生成(cheng)、代(dai)(dai)碼補全(quan)、代(dai)(dai)碼漏洞檢測和(he)修(xiu)復、表格數(shu)據(ju)處理、數(shu)據(ju)庫查詢(xun)等工作。
混(hun)元大模型擁有超千億參數(shu)規(gui)模,預訓練語(yu)料超2萬(wan)億tokens,相比于(yu)同行十億、百億級別的參數(shu)規(gui)模,研(yan)發與(yu)訓練成本較高(gao)。
談到(dao)大(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)的研發成(cheng)本(ben),騰訊機器學(xue)習(xi)平(ping)臺算法負責人康戰(zhan)輝在接(jie)受媒體群訪時(shi)表示,目(mu)前騰訊研發大(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)有兩個(ge)方向:在通用大(da)(da)模(mo)(mo)(mo)型(xing)(xing)(xing)上(shang),相(xiang)比于成(cheng)本(ben)投入而言(yan),騰訊更重視效果,強調長期(qi)投入;在小型(xing)(xing)(xing)模(mo)(mo)(mo)型(xing)(xing)(xing)上(shang),希望(wang)能更加精細化(hua),將不同(tong)(tong)的模(mo)(mo)(mo)型(xing)(xing)(xing)應用到(dao)不同(tong)(tong)場(chang)景,同(tong)(tong)時(shi)更加考慮投入和產出的性價(jia)比和效益。通俗來說,就是“大(da)(da)模(mo)(mo)(mo)大(da)(da)做,小模(mo)(mo)(mo)小做”。
出(chu)于上述邏輯,騰訊超180個內部業務(wu)(wu)接入混元(yuan)大模(mo)(mo)型(xing)(xing)的(de)參數量(liang)規模(mo)(mo)也有所差別。“模(mo)(mo)型(xing)(xing)的(de)選(xuan)擇關鍵(jian)還要看場景(jing),要結(jie)合(he)業務(wu)(wu)場景(jing)給出(chu)靈活的(de)方案,例如現在騰訊的(de)業務(wu)(wu)部門有的(de)用(yong)千(qian)億(yi)模(mo)(mo)型(xing)(xing),有的(de)用(yong)中小模(mo)(mo)型(xing)(xing),有的(de)用(yong)混合(he)模(mo)(mo)型(xing)(xing),我們(men)不斷根(gen)據業務(wu)(wu)流量(liang)和商業模(mo)(mo)式去調(diao)整(zheng)出(chu)我們(men)自(zi)己的(de)技術底座。”康戰輝說道(dao)。
《每(mei)日經濟(ji)新聞》記者注意到,就(jiu)在本月,多個(ge)廠商(shang)陸續發(fa)布大(da)模(mo)型(xing)(xing)商(shang)業(ye)應(ying)用(yong):百度(du)發(fa)布文(wen)心一(yi)言大(da)模(mo)型(xing)(xing)4.0版本,并推出十余款AI原生應(ying)用(yong)全面賦能業(ye)務生態(tai)。在垂(chui)直領域,美圖發(fa)布了自(zi)研AI視覺大(da)模(mo)型(xing)(xing)MiracleVision(奇(qi)想(xiang)(xiang)智(zhi)能)3.0版本,通(tong)過“提(ti)示(shi)(shi)詞智(zhi)能聯(lian)想(xiang)(xiang)”“提(ti)示(shi)(shi)詞精準控制”等功(gong)能,可以讓用(yong)戶的各種奇(qi)思妙想(xiang)(xiang)實(shi)現所想(xiang)(xiang)即所得;宇(yu)信科技推出了首批金融行業(ye)大(da)模(mo)型(xing)(xing)應(ying)用(yong)產品(pin)和解決方案,包(bao)括4個(ge)應(ying)用(yong)級產品(pin)和1個(ge)開發(fa)平臺(tai)。
大模(mo)型(xing)商(shang)業化進程正持續推進,騰訊(xun)(xun)對(dui)此(ci)也有一(yi)些思考。蘆(lu)清(qing)林以“文生(sheng)圖”為(wei)例,闡述對(dui)未(wei)來應用路徑(jing)的展(zhan)望(wang)。“‘文生(sheng)圖’的應用價值在廣(guang)(guang)告(gao)場景是(shi)(shi)非常(chang)明確(que)的,第(di)一(yi)是(shi)(shi)能夠幫助廣(guang)(guang)告(gao)主更(geng)快地提升(sheng)投(tou)放(fang)廣(guang)(guang)告(gao)的效率,第(di)二是(shi)(shi)騰訊(xun)(xun)擁有豐富(fu)的廣(guang)(guang)告(gao)經(jing)驗和知識,知道如何針(zhen)對(dui)廣(guang)(guang)告(gao)主投(tou)放(fang)廣(guang)(guang)告(gao)的人群,生(sheng)成更(geng)符合人群特點的廣(guang)(guang)告(gao),因(yin)此(ci)廣(guang)(guang)告(gao)主愿意(yi)在這個產品上投(tou)入。”他說道。
據騰訊(xun)透露,目前(qian)在廣(guang)告(gao)業務下(xia)的多輪(lun)測評中,騰訊(xun)混元“文生(sheng)圖(tu)”的案例(li)優秀(xiu)率(lv)和廣(guang)告(gao)主采納率(lv)分別(bie)達到86%和26%。
封面圖片來源:每經(jing)記者 張(zhang)涵(han) 攝
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴(yan)禁轉載(zai)或鏡(jing)像,違(wei)者必究(jiu)。
讀者熱(re)線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取(qu)稿(gao)酬。如您不(bu)希望作品出現在本站,可(ke)聯系我們(men)要求撤下您的作品。
歡迎關注每日(ri)經濟新聞APP