每(mei)日經濟新聞 2023-02-17 21:22:58
◎目前虛擬人在實(shi)際應用中,普遍缺(que)乏(fa)真實(shi)的(de)人物表(biao)情(qing)。但(dan)在影(ying)視制作領域(yu),卻已能生成生動的(de)面部表(biao)情(qing)。比如年(nian)前火熱的(de)電影(ying)——《阿凡(fan)達2水(shui)之道(dao)》。
◎在Unity看(kan)來,中(zhong)國擁(yong)有(you)世(shi)界上最大(da)的(de)游戲市(shi)(shi)場和汽(qi)車市(shi)(shi)場,也是最大(da)的(de)制(zhi)造業國家、基建國家。這意味著,中(zhong)國擁(yong)有(you)全(quan)球(qiu)最大(da)的(de)數字孿生市(shi)(shi)場,也很(hen)可(ke)能誕生最大(da)的(de)元(yuan)宇宙世(shi)界。
每(mei)經記者(zhe)|朱成祥(xiang) 每(mei)經編輯|梁梟
近期,無論是科技領域(yu)還(huan)是資本市場,最火熱的概(gai)念莫過于ChatGPT和AIGC(人工智(zhi)能技術生成內容)。從(cong)文本到圖片,AIGC都有豐富的應(ying)用。
那么,在3D世界,AIGC有沒有應用(yong)空間?3D引擎與ChatGPT以(yi)及GPT類工具,能否擦出火花?
針對以(yi)上問題(ti),《每日經濟新聞》記(ji)者近日采訪了(le)國際3D引擎巨頭Unity多位專(zhuan)家。Unity中國高級經理兼跨端移(yi)植技術負(fu)責人孫(sun)志鵬告訴記(ji)者,對應AI作畫,3D引擎可能實現(xian)“一句話建(jian)模”。
ChatGPT可實現人工智(zhi)能(neng)(neng)創(chuang)作文本(ben),基于(yu)(yu)文本(ben),AI作畫可實現人工智(zhi)能(neng)(neng)創(chuang)作圖片,即(ji)從一(yi)維的文本(ben)到二維的平面圖片。那么(me),基于(yu)(yu)文本(ben),能(neng)(neng)否形成三維的視頻呢?即(ji)利用CG(計算機動畫)技術(shu)以及(ji)3D引擎技術(shu),進一(yi)步由AI制(zhi)作微電影。如此前,藝術(shu)家團體Sagans就(jiu)借(jie)助虛幻引擎5和(he)AI算法(fa),創(chuang)造出賽博(bo)朋(peng)克風格(ge)的MV。
對此,孫志鵬表示,AI已被(bei)不斷(duan)集成至Unity的(de)(de)工具流中,主(zhu)要用于強化管線的(de)(de)渲染(ran)能力(li),同時也會在程序(xu)化數字資產(chan)生(sheng)成和可微渲染(ran)的(de)(de)部(bu)分,為AIGC的(de)(de)落地做能力(li)加強和生(sheng)態儲(chu)備,并參與GPT之類(lei)的(de)(de)預訓練模型的(de)(de)使用探索。在多(duo)模態、數據合(he)成、對比學(xue)習等領(ling)域緊跟學(xue)術界成果,爭取早日(ri)在3D數字資產(chan)創作領(ling)域實現AIGC。
對(dui)應(ying)AI作(zuo)畫,3D引(yin)擎可(ke)能實(shi)現(xian)“一(yi)句話(hua)建模(mo)”。以場景生(sheng)成(cheng)為例,目(mu)前看起來一(yi)個(ge)可(ke)能的(de)(de)路徑是:首先通(tong)過(guo)(guo)GPT之類的(de)(de)生(sheng)成(cheng)模(mo)塊(kuai)(kuai),自動(dong)生(sheng)成(cheng)對(dui)一(yi)個(ge)用戶(hu)需(xu)要的(de)(de)場景足(zu)夠詳細的(de)(de)描(miao)述,然后通(tong)過(guo)(guo)一(yi)個(ge)多模(mo)態(tai)(tai)模(mo)塊(kuai)(kuai)進行模(mo)態(tai)(tai)融合,去驅動(dong)一(yi)個(ge)全可(ke)微的(de)(de)程(cheng)序化(hua)建模(mo)模(mo)塊(kuai)(kuai)來生(sheng)成(cheng)場景,繼而通(tong)過(guo)(guo)可(ke)微渲染器渲染的(de)(de)結果,最(zui)(zui)后把這個(ge)結果交給類似CLIP(文末注)的(de)(de)模(mo)塊(kuai)(kuai)去生(sheng)成(cheng)符合最(zui)(zui)初(chu)描(miao)述的(de)(de)圖像或(huo)視頻(pin)。
而類似過(guo)(guo)程可以用在(zai)(zai)很多類型的資產生成過(guo)(guo)程中,“一(yi)句話建模”也就由此實現了(le)。在(zai)(zai)此之(zhi)前,工具引擎需要在(zai)(zai)程序化和(he)可微的方向上做好準(zhun)備,同時(shi)時(shi)刻緊跟AIGC相關領域的科研進(jin)展,在(zai)(zai)新銳技術落(luo)地的第一(yi)時(shi)間(jian),讓(rang)一(yi)切(qie)成為可能。
三維空(kong)間(jian)除了(le)視頻,還(huan)有(you)直播等(deng)場景。目前,虛擬人(ren)技(ji)術發展迅速(su),那么Unity能否進一步將自(zi)身技(ji)術應用到電(dian)視直播中,從虛擬人(ren)升(sheng)級(ji)到虛擬演播室?
對此(ci),Unity中國回復記者稱(cheng),此(ci)前(qian),由韓(han)國開發者使用Unity打造(zao)的虛(xu)擬人(ren)SUA已經吸引了全世界的關注。作為實(shi)(shi)(shi)時(shi)渲染(ran)的數字(zi)人(ren)類,SUA全身都基于實(shi)(shi)(shi)時(shi)渲染(ran)實(shi)(shi)(shi)現。實(shi)(shi)(shi)時(shi)渲染(ran)的渲染(ran)速度與交互性,讓SUA可(ke)以(yi)與觀(guan)眾實(shi)(shi)(shi)時(shi)互動,也就讓虛(xu)擬演播室成為可(ke)能。
另外,目前(qian)(qian)虛(xu)擬人(ren)在實(shi)際應(ying)用(yong)中,普遍缺乏真實(shi)的(de)(de)人(ren)物表(biao)情。但(dan)在影(ying)視制作領域,卻已(yi)能生(sheng)成生(sheng)動(dong)的(de)(de)面部(bu)表(biao)情。比(bi)如年前(qian)(qian)火熱的(de)(de)電影(ying)——《阿凡達2水之道(dao)》。該影(ying)片的(de)(de)CG技術(shu)提供(gong)方WētāFX,和此前(qian)(qian)已(yi)被Unity收購的(de)(de)Wētā Digital師出同門。
圖(tu)片來源(yuan):Unity供圖(tu)
Unity Wētā Tools對《每日經濟(ji)新(xin)聞》記者表(biao)示,制作中的(de)(de)最大突破是(shi)為影片(pian)中的(de)(de)數字角色制作創新(xin)地提出了APFS系統(Anatomically Plausible Facial System),這是(shi)一(yi)個基于肌肉纖(xian)維曲線的(de)(de)面部(bu)動畫參數化系統,同時(shi)Wētā也提供了一(yi)整套與之配合的(de)(de)特效畫面制作生產流程。
全新的(de)APFS系統提供了一個(ge)更(geng)基于解剖學基礎、更(geng)以(yi)動(dong)畫(hua)(hua)師(shi)為(wei)中心的(de)創(chuang)作(zuo)(zuo)環境。在(zai)(zai)幫(bang)助動(dong)畫(hua)(hua)師(shi)通過肌肉曲線直接控制(zhi)面部(bu)肌肉,生成高(gao)(gao)保(bao)真(zhen)的(de)面部(bu)表情(qing)的(de)同時,也(ye)將復雜的(de)非線性(xing)皮膚表現納入深度神經(jing)網絡(luo)(一種模仿(fang)動(dong)物神經(jing)網絡(luo)行(xing)為(wei)特征(zheng),進行(xing)分布(bu)式并行(xing)信(xin)息(xi)處(chu)理的(de)算法(fa)數學模型),繼而通過大(da)約7~10萬次的(de)高(gao)(gao)質量面部(bu)掃描來訓練AI模型,旨在(zai)(zai)幫(bang)助電影(ying)創(chuang)作(zuo)(zuo)者更(geng)高(gao)(gao)效地(di)制(zhi)作(zuo)(zuo)高(gao)(gao)逼真(zhen)度畫(hua)(hua)面。
Unity在3D引(yin)擎(qing)和CG技術領域擁有的技術實(shi)力,能給中國(guo)的相關產業發(fa)展帶來哪些助力?
Unity中國(guo)(guo)表示,公司致力于打造中國(guo)(guo)本土的、適配各(ge)類國(guo)(guo)產軟硬件平臺(tai)的數(shu)字生產力工具,豐(feng)富(fu)由(you)實時(shi)圖形渲染技術支撐的AR、VR、MR以及(ji)數(shu)字孿生體驗(yan),賦能(neng)中國(guo)(guo)數(shu)字經濟安全、穩定、健康發展。
在(zai)Unity看來,中國擁(yong)有世界(jie)上最(zui)大(da)的游(you)戲市場和(he)汽車市場,也是最(zui)大(da)的制造(zao)業國家(jia)、基建國家(jia)。這意味著,中國擁(yong)有全球最(zui)大(da)的數字孿(luan)生市場,也很可能誕生最(zui)大(da)的元宇(yu)宙世界(jie)。
注:CLIP,Contrastive Language-Image Pre-training,是一種機器學習技術,它可以準確理解和(he)分類圖像和(he)自(zi)然(ran)語言文本,這對圖像和(he)語言處理具有深遠的影響。
封面圖(tu)片來(lai)源:Unity供(gong)圖(tu)
如需轉載請與《每日經濟新聞》報社聯系。
未經(jing)《每(mei)日經(jing)濟新聞(wen)》報社授權,嚴禁(jin)轉載或鏡(jing)像,違者必(bi)究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿(gao)酬(chou)。如您(nin)不希(xi)望作(zuo)品出現在本站,可(ke)聯系我們要求撤下您(nin)的(de)作(zuo)品。
歡迎關注每日經濟新聞APP