每日(ri)經濟新聞 2024-03-17 20:46:41
◎3月15日(ri),商湯智(zhi)能(neng)產業研究院院長田(tian)豐在接(jie)受(shou)《每日(ri)經(jing)濟新聞》記(ji)者專訪時表示,我(wo)們既要借鑒OpenAI的(de)“踏腳石理論(lun)”,同(tong)時也要學(xue)習錢(qian)學(xue)森所推崇的(de)科研要遵(zun)循“冰山理論(lun)”。他認為:“我(wo)們不能(neng)只看水面上,別(bie)人做到(dao)哪兒,我(wo)們就(jiu)馬上去跟,也要看到(dao)水面之下應該怎么走(zou)。”
每經記者|可楊 每經編輯|文多
錢學(xue)森在《從(cong)飛機、導(dao)彈(dan)說到生產過程的(de)自(zi)動化(hua)》一書中寫下:“用機器代替(ti)人(ren)的(de)體(ti)力(li)勞動,是第一次(ci)(ci)工業(ye)(ye)革命,即機械化(hua);用機械系統來替(ti)人(ren)作非創造性的(de)腦(nao)力(li)勞動,是第二次(ci)(ci)工業(ye)(ye)革命,即自(zi)動化(hua)。”
3月15日,由工(gong)業和(he)信息化(hua)(hua)部工(gong)業文(wen)化(hua)(hua)發展中心牽頭成(cheng)立的(de)(de)AI應用工(gong)作組主(zhu)辦(ban),每日經濟(ji)新聞承辦(ban)、數(shu)智(zhi)未來場景實驗室協(xie)辦(ban)的(de)(de)“Sora的(de)(de)啟示(shi):AI應用再飛躍”主(zhu)題沙龍活動在京成(cheng)功舉辦(ban)。
活動(dong)期間,商湯智能(neng)產業(ye)研究(jiu)院院長田(tian)豐在接受《每日經(jing)濟新聞》記者專訪(fang)時提到(dao),當(dang)前我(wo)們正在經(jing)歷“機械化(hua)(hua)”到(dao)“自(zi)動(dong)化(hua)(hua)”階段。
大模型,是人類邁向自動化的(de)關鍵基礎(chu)設施。隨(sui)著Sora的(de)推出,圍繞大模型的(de)競(jing)爭繼續提速。就(jiu)Sora帶來的(de)啟示、智能基礎(chu)設施的(de)建設、算力的(de)普(pu)惠之路(lu),《每日(ri)經(jing)濟新聞》記者與田豐展開對話。
田(tian)豐(feng)認為(wei),我們(men)既要(yao)借鑒OpenAI的(de)“踏(ta)腳石理論”,同時也(ye)要(yao)學習(xi)錢學森(sen)所推崇的(de)科研(yan)要(yao)遵循(xun)“冰(bing)山理論”。“我們(men)不能只看(kan)水(shui)面上(shang),別人做到哪兒,我們(men)就(jiu)馬上(shang)去跟,也(ye)要(yao)看(kan)到水(shui)面之下應該怎(zen)么走。”田(tian)豐(feng)表示。
商湯(tang)智(zhi)能(neng)產業研究院院長 田豐圖(tu)片來源:受訪者提(ti)供
Scaling Laws(尺度(du)定律),指的(de)(de)是模(mo)(mo)(mo)型訓(xun)練計算量、訓(xun)練數(shu)據規模(mo)(mo)(mo)、模(mo)(mo)(mo)型參數(shu)量與模(mo)(mo)(mo)型效能之間的(de)(de)正(zheng)相關關系,一個更通俗的(de)(de)說法是“大力出奇(qi)跡”。
“Sora雖(sui)然(ran)不完美并且處于早期階段,但它(ta)確(que)實是尺度(du)定(ding)律(lv)的又一(yi)次驗證,也是一(yi)個大(da)模(mo)型工(gong)程化(hua)的進(jin)展。”在田豐看來,Sora的誕生(sheng),首(shou)先(xian)代表著尺度(du)定(ding)律(lv)的又一(yi)次成功。
田豐指出,Sora所采用的(de)Diffusion Transformer(DiT)架構,是(shi)多種(zhong)已有架構之間的(de)工程化融合(he),故而具備(bei)Diffusion(擴散)等架構的(de)長處(chu),也不可避免地帶有一(yi)些缺陷。目(mu)前,全(quan)球范圍內的(de)研究者同(tong)時在探(tan)索不同(tong)架構方(fang)向(xiang)。田豐將這(zhe)種(zhong)探(tan)索比喻為一(yi)棵科技樹,Sora是(shi)在其(qi)中(zhong)某一(yi)條(tiao)路(lu)徑(jing)上(shang)領先,而其(qi)他研究者會在其(qi)他路(lu)徑(jing)上(shang)積極探(tan)索,最終互相借(jie)鑒,讓AI基礎科研更快發展。
田豐認為,Sora所帶來的(de)(de)另一個啟示是,Sora是OpenAI邁(mai)向AGI(人工通用智(zhi)能)的(de)(de)“踏腳(jiao)石”。
“新(xin)(xin)奇(qi)事(shi)物的重要性在(zai)于,它們(men)往往可(ke)以成為(wei)踏腳石(shi)探測器(qi),因為(wei)任(ren)何新(xin)(xin)奇(qi)的東西,都(dou)是催生更新(xin)(xin)奇(qi)事(shi)物的潛在(zai)踏腳石(shi)。”OpenAI科學家在(zai)其撰寫的《為(wei)什么偉大不能被計劃》一書中,提到了“踏腳石(shi)”。
在專訪(fang)中,田(tian)豐(feng)也反復提及“踏腳石理論”。他表示,在基礎(chu)研發(fa)中,想(xiang)達到(dao)A點,有(you)可能需要往(wang)反方向走到(dao)B點,進而再到(dao)達A點。因為創造力是(shi)一(yi)(yi)種“搜索(suo)”,基礎(chu)研發(fa)是(shi)在龐(pang)大“解空(kong)間”中通(tong)過多(duo)個路徑深入探索(suo),而無法完全(quan)通(tong)過目標找到(dao)最(zui)短(duan)的直線。“怎么去定義踏腳石,就是(shi)一(yi)(yi)定要有(you)新奇性。”
田豐表示,基于(yu)這個(ge)理(li)論,中(zhong)國技術研(yan)發也(ye)要(yao)找到更(geng)多踏(ta)腳石。“你(ni)有更(geng)多的(de)踏(ta)腳石之后(hou),就(jiu)(jiu)能發現跨領域、跨學科的(de)相關性,上(shang)面‘長’出的(de)基礎研(yan)發突破就(jiu)(jiu)會更(geng)多。”
除此(ci)之外,田豐(feng)同樣談到(dao)錢(qian)學森所推崇的“科研遵循‘冰山(shan)(shan)理論’”,即人們(men)看(kan)到(dao)的AI“技術突變”只是水面(mian)之上(shang)的“冰山(shan)(shan)一角”,水面(mian)之下(xia)(xia)還(huan)有更多“隱(yin)藏創新(xin)”在支(zhi)撐。“我們(men)不能只看(kan)水面(mian)上(shang),別人做到(dao)哪兒,我們(men)就(jiu)馬上(shang)去跟,也要(yao)看(kan)到(dao)水面(mian)之下(xia)(xia)基礎科研布局,應該怎么走。”
那在(zai)大(da)模型競(jing)爭(zheng)中,水面之(zhi)下的技術(shu)應該如(ru)何(he)挖掘?
田豐認為(wei),目前大(da)家有(you)不同(tong)的(de)探索方向。例如,自動駕(jia)(jia)駛的(de)大(da)模(mo)型旨在(zai)模(mo)擬(ni)現(xian)(xian)實世界,實現(xian)(xian)自動駕(jia)(jia)駛的(de)仿(fang)真,并(bing)通過神經網(wang)絡(luo)來完(wan)成(cheng)感知、決策、執行及反(fan)(fan)饋等任務。而特斯拉(la)將自動駕(jia)(jia)駛模(mo)式遷移到人(ren)形(xing)(xing)機器人(ren)上(shang)。于是,人(ren)形(xing)(xing)機器人(ren)的(de)出(chu)現(xian)(xian),又可以進一步作為(wei)數據和反(fan)(fan)饋來源,驗證基礎大(da)模(mo)型對現(xian)(xian)實世界的(de)認知誤差、糾正幻覺(jue)。
當前對(dui)于(yu)大模(mo)型的(de)驗證還(huan)依賴于(yu)人類反(fan)饋強化學習(Reinforcement Learning from Human Feedback,簡稱RLHF),而(er)這面臨反(fan)饋速度慢、成本(ben)高以及人的(de)自(zi)身(shen)認知偏(pian)(pian)差(cha)等問題。因此,科(ke)研界(jie)(jie)同(tong)樣(yang)在(zai)嘗(chang)試(shi)采用(yong)“具身(shen)智(zhi)能”等其他新研究方向(xiang),以在(zai)復雜(za)多變的(de)物理世界(jie)(jie)環(huan)境中直接(jie)驗證機器智(zhi)能,讓人工智(zhi)能不再局限于(yu)對(dui)人的(de)模(mo)仿(fang),而(er)是更直接(jie)地(di)探索世界(jie)(jie)、糾偏(pian)(pian)認知。
“通往AGI的(de)路,絕對(dui)不是只有(you)一條(tiao)。”田豐認為(wei)(wei),基于這(zhe)樣多元(yuan)化(hua)的(de)探索(suo)(suo),才(cai)會有(you)可能(neng)逐(zhu)步到達AGI。而單純依(yi)靠(kao)模(mo)仿人(ren)類思考方式(shi)的(de)大模(mo)型,對(dui)于極為(wei)(wei)復雜的(de)整(zheng)個(ge)物理世界,尤其是人(ren)類已知(zhi)知(zhi)識以外的(de)更大的(de)知(zhi)識領域是無(wu)法去(qu)探索(suo)(suo)的(de)。正(zheng)如(ru)錢學森(sen)所說(shuo)——“Nothing is Final”,現在(zai)認為(wei)(wei)正(zheng)確(que)的(de)人(ren)類知(zhi)識,在(zai)下(xia)一個(ge)時代看來就會具有(you)局限性和偏差(cha)。
田豐在沙龍(long)中演講(jiang) 圖片來(lai)源(yuan):每經記者 韓陽 攝
對(dui)于通用大模(mo)型而言,尺度定律(lv)(Scaling Laws),有(you)沒(mei)有(you)可能在某一階(jie)段失效(xiao)?
“(在(zai))訓練數(shu)據用光(guang)時”——這是田豐的答案(an)。
田豐(feng)認(ren)為,數(shu)據(ju)(ju)多(duo)模態非常重要(yao)。“文字語言(yan)(yan)具有(you)最(zui)高的(de)知(zhi)識密度,但是(shi)光有(you)文字語言(yan)(yan)也(ye)不夠,視覺和語言(yan)(yan)的(de)融合也(ye)很重要(yao)。”他表(biao)(biao)示(shi),純視覺學(xue)習未必會(hui)學(xue)到(dao)物理(li)之間的(de)因果關系,視覺加語言(yan)(yan)的(de)數(shu)據(ju)(ju),會(hui)帶來更好的(de)訓練效果,讓大模型(xing)能(neng)夠理(li)解(jie)復雜環(huan)境、復雜任(ren)務中(zhong)的(de)表(biao)(biao)征(zheng)和表(biao)(biao)意內(nei)容,也(ye)能(neng)讓Sora現在存在的(de)一些物理(li)上的(de)混亂,得到(dao)改善。
從數(shu)據(ju)層面看,田豐認為,目(mu)前存在多個潛在的訓練數(shu)據(ju)增長點(dian)。
首要的(de)是(shi)人(ren)(ren)們日常使用的(de)應用。例如(ru)(ru)微(wei)博,每日有2.6億(yi)用戶在(zai)微(wei)博發帖,這為模型訓(xun)練(lian)提供(gong)了(le)豐富的(de)增量(liang)數據(ju)。其次,具(ju)身智能(neng)(neng)的(de)傳感(gan)技術,同樣(yang)能(neng)(neng)夠提供(gong)數據(ju)增量(liang),例如(ru)(ru)自(zi)動駕駛汽車和(he)人(ren)(ren)形機器人(ren)(ren)都是(shi)數據(ju)收集器。此外,商湯(tang)目(mu)前的(de)衛星遙(yao)感(gan)智能(neng)(neng)解譯(yi)技術,能(neng)(neng)夠觀察(cha)地球(qiu)物理環境每一天發生的(de)多維度(du)變化,同樣(yang)提供(gong)了(le)大(da)量(liang)的(de)數據(ju)資源。
當(dang)現(xian)實(shi)世界(jie)產生(sheng)的數(shu)據(ju)(ju)(ju)仍(reng)舊不足時,就需要同(tong)時在AI合成(cheng)(cheng)數(shu)據(ju)(ju)(ju)層面進行科(ke)研(yan)探索。田豐介紹,目前,合成(cheng)(cheng)數(shu)據(ju)(ju)(ju)仍(reng)處(chu)于前期階段,生(sheng)成(cheng)(cheng)的數(shu)據(ju)(ju)(ju)質(zhi)量(liang)(liang)參差(cha)不齊。業界(jie)期待多模態(tai)大模型不僅能輸入多模態(tai)數(shu)據(ju)(ju)(ju),同(tong)時還(huan)能產出(chu)接(jie)近真實(shi)世界(jie)的高質(zhi)量(liang)(liang)多模態(tai)數(shu)據(ju)(ju)(ju)。
但當(dang)前(qian)(qian),如果視頻數(shu)據(ju)自動標(biao)注的描述文字(zi)不精(jing)準,則會(hui)造成“Garbage in,garbage out”(指(zhi)輸(shu)入的垃圾數(shu)據(ju)會(hui)導致大模型輸(shu)出的垃圾結果),其(qi)風險依舊擺在AI合成數(shu)據(ju)面前(qian)(qian),各國AI基礎科研團隊正在攻堅(jian)。
對此,田(tian)豐則(ze)認為,業界(jie)都(dou)憧憬做成(cheng)“世(shi)界(jie)模擬器”,但目前生(sheng)成(cheng)的視(shi)頻(pin)數據與真(zhen)實世(shi)界(jie)仍有較(jiao)大距離。Sora所(suo)生(sheng)成(cheng)的最(zui)好的視(shi)頻(pin)內容是(shi)“我的世(shi)界(jie)”游戲視(shi)頻(pin),幾乎(hu)與玩家實際體驗(yan)無異。這得益于OpenAI對“我的世(shi)界(jie)”游戲公(gong)司(si)與游戲引(yin)擎的收(shou)購(gou)。
游(you)戲(xi)引擎為了讓玩家感覺(jue)更真(zhen)(zhen)實(shi),無論是(shi)光照、紋理還(huan)是(shi)人(ren)和(he)物體之間的(de)交互,都比較(jiao)接近現(xian)實(shi)世(shi)界(jie)。所以Sora用這樣的(de)訓練數據(ju)來生成,使得(de)大(da)模型(xing)能夠(gou)從中(zhong)學(xue)習并理解游(you)戲(xi)中(zhong)的(de)復(fu)雜因果關(guan)系,進而生成逼真(zhen)(zhen)的(de)內(nei)容(rong)。更為重要的(de)是(shi),游(you)戲(xi)世(shi)界(jie)會一直(zhi)產生大(da)量較(jiao)低成本的(de)世(shi)界(jie)仿(fang)真(zhen)(zhen)數據(ju),比從現(xian)實(shi)中(zhong)收(shou)集要快很多。
“但它(ta)(指Sora為(wei)代表的大模(mo)型)是不(bu)是真正理解現實世界、物理世界的所有因果規律?其實,人類目前(qian)仍沒(mei)有完全理解和掌握。”田豐繼(ji)續(xu)說道,從這(zhe)個角(jiao)度而(er)言(yan),合成(cheng)數據很(hen)重要(yao)的一點是,我們應像對(dui)抗(kang)神經網絡的邏輯一樣,必(bi)須有另一個模(mo)型驗證合成(cheng)數據與(yu)事實的接近程度。
將(jiang)視線聚焦于(yu)當前(qian)的(de)數據(ju)(ju)競爭態勢,田豐表示,中(zhong)國擁有(you)14億(yi)人口,每天都在產生海量(liang)的(de)數據(ju)(ju),這就意味著(zhu)巨(ju)大(da)的(de)潛力,我們有(you)能(neng)力以更(geng)低(di)的(de)成(cheng)本來采(cai)(cai)集(ji)這些數據(ju)(ju)。此外(wai),中(zhong)國還擁有(you)106億(yi)的(de)物聯(lian)網終端(duan),其(qi)中(zhong)尚(shang)未采(cai)(cai)集(ji)到的(de)各(ge)類數據(ju)(ju)——如工(gong)業傳(chuan)感信號(hao)等,都是極具價(jia)值的(de)資源。若能(neng)成(cheng)功(gong)采(cai)(cai)集(ji)到這些數據(ju)(ju),將(jiang)成(cheng)為訓(xun)練垂類大(da)模型(xing)的(de)優質(zhi)素材,也能(neng)幫(bang)助大(da)模型(xing)更(geng)深入地理解產業場景(jing)中(zhong)事物之(zhi)間的(de)因果關系。此外(wai),在合成(cheng)數據(ju)(ju)方面(mian),大(da)家也均處于(yu)起步(bu)階段,還在互相競爭。
田(tian)豐認(ren)為,人(ren)工智能是(shi)當今社會數據(ju)資源(yuan)最大的(de)需求方,若能在(zai)(zai)數據(ju)領域構建出完(wan)善的(de)體制機制,使數據(ju)成為市(shi)場(chang)化流通的(de)關鍵要素,那么便能在(zai)(zai)數據(ju)層面持續推動尺度定律(lv),加速大模(mo)型的(de)進步(bu)。
圖(tu)片來(lai)源:每日經濟新(xin)聞 靳水平 攝
如何(he)實現(xian)AGI?田豐提出(chu)兩個(ge)方向(xiang)。從生成智能(neng)(neng)的(de)角(jiao)度(du)來看(kan),生成式人工(gong)智能(neng)(neng)正在逐步轉(zhuan)向(xiang)更(geng)(geng)具創(chuang)意性(xing)的(de)工(gong)作(zuo),這需要更(geng)(geng)多大模(mo)型的(de)“幻(huan)覺”想(xiang)象力(li)(li)。在這條路徑上(shang),“幻(huan)覺”并不是壞(huai)事,創(chuang)作(zuo)科幻(huan)小說(shuo)、科幻(huan)電影就體現(xian)出(chu)了這一(yi)點——想(xiang)象力(li)(li)在其中扮演著至關重(zhong)要的(de)角(jiao)色。愛(ai)因斯坦(tan)也曾經提出(chu)“想(xiang)象力(li)(li)比知識更(geng)(geng)為重(zhong)要”。另一(yi)個(ge)方向(xiang)則更(geng)(geng)加側(ce)重(zhong)于科學(xue)和(he)(he)工(gong)業產業具體問題(ti)的(de)解決,這就需要致力(li)(li)于減少幻(huan)覺,持續提高準確度(du)和(he)(he)可靠(kao)性(xing),一(yi)旦(dan)能(neng)(neng)夠(gou)達到人類科學(xue)家、工(gong)程師的(de)平均水平,突破“工(gong)業紅線”,大模(mo)型就能(neng)(neng)全面普及到各個(ge)行業產業和(he)(he)科研領域(yu)。
在(zai)田豐(feng)看來,大模型實則(ze)是(shi)(shi)公共基(ji)礎設(she)(she)施(shi)的(de)一部(bu)分,是(shi)(shi)智能基(ji)礎設(she)(she)施(shi),而基(ji)礎設(she)(she)施(shi)的(de)特(te)點就是(shi)(shi)重資產型、重資本型。
在(zai)(zai)現有(you)情況下,大(da)模型(xing)(xing)研發與(yu)應(ying)用是一(yi)個長(chang)期投資。一(yi)方面(mian),基礎模型(xing)(xing)不(bu)(bu)能(neng)跟(gen)(gen)(gen)進(jin)到GPT4,就自認為“領先(xian)全球”,另一(yi)方面(mian),在(zai)(zai)國產(chan)基礎模型(xing)(xing)與(yu)國際縮小差(cha)距的(de)(de)同時,也要積極探索新的(de)(de)發展方向。“開拓者(zhe)創造(zao)方向,跟(gen)(gen)(gen)隨者(zhe)選擇(ze)方向,領先(xian)者(zhe)并不(bu)(bu)代(dai)表永遠的(de)(de)成功(gong),而(er)可(ke)能(neng)被具有(you)強大(da)創新能(neng)力的(de)(de)跟(gen)(gen)(gen)隨者(zhe)趕超。”從這一(yi)角度看,長(chang)周期持續的(de)(de)人(ren)工(gong)智能(neng)基礎科研、基礎建設資本(ben)投入(ru)至關(guan)重(zhong)要,這也是充(chong)分發揮(hui)制(zhi)度創新的(de)(de)機遇。
盡管資(zi)本通(tong)常會關注盈利問題,但(dan)也不是絕對,田豐用他在(zai)云計算產業的(de)經驗舉了個(ge)例子。2012年前后(hou),云計算公司主(zhu)要的(de)用戶群體(ti)是網(wang)站(zhan)站(zhan)主(zhu),且許(xu)多是個(ge)人網(wang)站(zhan)站(zhan)主(zhu),資(zi)金相對匱乏(fa)。新(xin)一(yi)代基礎設施的(de)早期,是投(tou)資(zi)與“裝置”期,表象(xiang)上就是盈利難。
然而,根據(ju)世(shi)界銀行《為發展提供基(ji)礎設(she)施(shi)》報告分析,基(ji)礎設(she)施(shi)投資(zi)、“裝置”期(qi)通(tong)(tong)(tong)常需要10年甚至(zhi)15年,而基(ji)礎設(she)施(shi)投資(zi)建(jian)設(she)往往伴隨著經濟周期(qi)的上升階段,當基(ji)礎設(she)施(shi)建(jian)設(she)成熟,則會(hui)持續產生廣泛普惠的社會(hui)全產業(ye)價值。例(li)如當前(qian),云計算已經逐漸成為企業(ye)和(he)(he)科研通(tong)(tong)(tong)用(yong)型技術(shu)(shu),廣泛應用(yong)于金(jin)融、能源(yuan)、交通(tong)(tong)(tong)等(deng)多(duo)個領域。因此,人工智能基(ji)礎設(she)施(shi)的建(jian)設(she)在前(qian)期(qi)更多(duo)地依賴于國家大基(ji)金(jin)和(he)(he)大型企業(ye)的投資(zi),類似(si)于高(gao)速公路(lu)、5G通(tong)(tong)(tong)信網(wang)絡(luo)的建(jian)設(she)。這種(zhong)資(zi)本增密的投資(zi)模式對于推動新質生產力技術(shu)(shu)的發展和(he)(he)新一波經濟繁榮至(zhi)關重要。
因(yin)此,目前我們(men)仍處于(yu)基礎設(she)施建設(she)階段,為了將來能建成“萬里長城(cheng)”,先要(yao)把地基打(da)好。在基礎設(she)施的“裝置”期,需(xu)要(yao)在超大規模AI算力中心、統一數據市場平臺上追加投入,充分挖掘并利(li)用我國的數據資源、大市場規模和科技(ji)人才儲備(bei)。
圖片來源:視覺中國
在重資(zi)產、重資(zi)本型(xing)的背景下,對于未來“百(bai)模大戰(zhan)”的終局(ju),田(tian)豐(feng)用操作系統(tong)的競爭(zheng)來舉例:
“當時多(duo)家廠商的(de)很多(duo)人覺得(操作系(xi)統(tong))就是‘大(da)B’的(de)事情,即大(da)模型從頭部大(da)企業端賺錢。以1981年個人電腦操作系(xi)統(tong)的(de)‘春秋戰國時期(qi)’為例,UCSD Pascal P-System(一(yi)種(zhong)(zhong)操作系(xi)統(tong))單機(ji)授權費(fei)高達450美元,CP/M-86(同為一(yi)種(zhong)(zhong)操作系(xi)統(tong))授權費(fei)是175美元,而(er)微軟MS-DOS僅向買PC的(de)消費(fei)者收60美金,而(er)IBM可(ke)免費(fei)使用(yong)微軟開(kai)發的(de)操作系(xi)統(tong),但不能獨占使用(yong)權。
“微軟選擇的差(cha)異化戰略是(shi)什(shen)么?比(bi)爾·蓋茨在《未(wei)來之路》一書里寫下:‘我們的目(mu)標不是(shi)要直(zhi)接從(cong)IBM(大企(qi)業)那里賺錢(qian),而是(shi)把(ba)軟件(jian)(jian)平(ping)臺(tai)的特(te)許使用(yong)(yong)權出售給個人計算機工業(所有硬(ying)件(jian)(jian))的生意。’比(bi)爾蓋茨的目(mu)標,是(shi)計算機的使用(yong)(yong)接近免費(fei)時,自己的操作系(xi)統將占有最(zui)大市(shi)場份額(e)。
“雖然大(da)(da)模(mo)型目前(qian)還處于企(qi)業級應用(yong)市(shi)場(chang)(chang),但伴(ban)隨AI芯片算力(li)價(jia)格(ge)的(de)持(chi)續下降、大(da)(da)模(mo)型個(ge)人(ren)終端涌(yong)現(xian)(xian),將會呈現(xian)(xian)大(da)(da)模(mo)型操作系(xi)統的(de)‘馬太效(xiao)應’,頭部廠商占有最大(da)(da)市(shi)場(chang)(chang)規模(mo)。”
田(tian)豐(feng)認為(wei),目前大(da)(da)模型(xing)(xing)(xing)的(de)(de)方向并非是(shi)(shi)向大(da)(da)型(xing)(xing)(xing)企業收取高額費用,而(er)是(shi)(shi)應當通過(guo)低價、易開發、快迭(die)代(dai)、硬(ying)件(jian)兼容等競爭策略致(zhi)力于最(zui)大(da)(da)限(xian)度搶占市場份額,并積(ji)極吸引各類AI新型(xing)(xing)(xing)硬(ying)件(jian)的(de)(de)支持。只要有越來越多的(de)(de)、不(bu)同類型(xing)(xing)(xing)的(de)(de)硬(ying)件(jian)終端(duan)支持同一款大(da)(da)模型(xing)(xing)(xing),它就能像操(cao)(cao)作系(xi)統(tong)一樣受(shou)到AI應用開發者的(de)(de)歡迎(ying)。而(er)終端(duan)硬(ying)件(jian)選擇(ze)大(da)(da)模型(xing)(xing)(xing),則(ze)源于消費者用戶(hu)群體的(de)(de)驅動(dong),而(er)用戶(hu)之所(suo)以選擇(ze)某一款“操(cao)(cao)作系(xi)統(tong)”,是(shi)(shi)因為(wei)其上集成(cheng)了眾多由小微或(huo)個人開發者開發的(de)(de)長尾大(da)(da)模型(xing)(xing)(xing)應用。這(zhe)是(shi)(shi)Windows和iOS等頭部操(cao)(cao)作系(xi)統(tong)得(de)以成(cheng)功的(de)(de)原因,也是(shi)(shi)大(da)(da)模型(xing)(xing)(xing)突(tu)破(po)紅海的(de)(de)一條(tiao)已驗證(zheng)的(de)(de)戰略路(lu)徑。
目前,應用所面臨的主要挑戰體現在兩大方面。
首先是算力成(cheng)本(ben)問(wen)題(ti)。若算力成(cheng)本(ben)持(chi)續(xu)高價(jia),長期來(lai)看,必然(ran)會抑制大模型應用創新(xin)(xin)的(de)蓬勃發展,就像互聯網APP早期不是靠(kao)用戶(hu)每月交納30美(mei)元會員費,而是以近乎(hu)免費的(de)使用權拉動新(xin)(xin)用戶(hu)“嘗鮮”。
因此,AI芯片行業勢必不斷(duan)降低成本(ben)(ben),并(bing)通過智算(suan)中(zhong)心架構(gou)創新推(tui)動AI云算(suan)力(li)的普及化、全(quan)民化。若GPU領域不進行快速改革,業界勢必出現新一代的芯片產(chan)品、計算(suan)力(li)架構(gou),以降低成本(ben)(ben)并(bing)促進AI應用的廣(guang)泛(fan)發展(zhan)。
另一(yi)方面,大(da)模型(xing)(xing)的(de)持續升級也會給應(ying)用(yong)(yong)(yong)(yong)帶來挑戰和(he)機遇。由于大(da)模型(xing)(xing)每(mei)月、每(mei)季度都在更新升級,應(ying)用(yong)(yong)(yong)(yong)在其原有基礎(chu)上(shang)的(de)改進可(ke)能很(hen)快被新版本大(da)模型(xing)(xing)所替代和(he)覆(fu)蓋,即大(da)模型(xing)(xing)操作系統和(he)應(ying)用(yong)(yong)(yong)(yong)的(de)“邊界”尚未確定,大(da)模型(xing)(xing)不斷嘗試做應(ying)用(yong)(yong)(yong)(yong)的(de)功能,應(ying)用(yong)(yong)(yong)(yong)則補上(shang)當(dang)前版本大(da)模型(xing)(xing)的(de)“短板(ban)”,降低(di)消費者使用(yong)(yong)(yong)(yong)門檻。
因(yin)此(ci),應用(yong)開(kai)(kai)發商(shang)(shang)加深(shen)行業(ye)(ye)應用(yong)“護城河”的(de)同時(shi),可尋求與大模(mo)型(xing)的(de)解(jie)耦,或提供跨多個(ge)大模(mo)型(xing)的(de)統一服(fu)務入口(kou)、一站式(shi)用(yong)戶(hu)開(kai)(kai)發環(huan)境,并尋找產(chan)業(ye)(ye)中最具盈利潛力的(de)商(shang)(shang)業(ye)(ye)路徑。
這樣(yang)一(yi)來(lai),即便大(da)模型升級(ji),應(ying)用(yong)也(ye)能(neng)迅速跟上或匹配更(geng)優競爭力(li)的(de)其(qi)他(ta)模型,保持應(ying)用(yong)層(ceng)對(dui)私(si)域用(yong)戶的(de)競爭力(li)。但(dan)長遠來(lai)看,應(ying)用(yong)開(kai)發者依(yi)舊會逐漸趨向使用(yong)更(geng)為穩定、功能(neng)強(qiang)大(da)的(de)頭部大(da)模型底座。
圍(wei)繞算(suan)力問(wen)題,田豐(feng)表示,目前,我們正處(chu)于人工智能時代的(de)(de)算(suan)力初期階(jie)段,算(suan)力成本仍然(ran)(ran)較高,只(zhi)有大(da)型企(qi)業能夠負擔。然(ran)(ran)而,隨著國(guo)產AI芯片、國(guo)產超大(da)規模(mo)AI智算(suan)中心技術的(de)(de)不斷進步,算(suan)力成本就會(hui)逐漸降(jiang)低(di),每個人也能接(jie)近以免(mian)費的(de)(de)方式享用(yong)新一(yi)代人工智能的(de)(de)科技紅利。龐大(da)市(shi)場(chang)的(de)(de)吸引力,將倒(dao)逼AI模(mo)型架構(gou)和AI算(suan)力集群架構(gou)的(de)(de)深(shen)刻(ke)變化。
因此,田豐認為,當前正(zheng)處于AI計算(suan)(suan)大(da)變革的前夜。他表示,當AI算(suan)(suan)力成本降至拐(guai)點時,社會(hui)(hui)(hui)(hui)需求量(liang)與用戶(hu)規模將會(hui)(hui)(hui)(hui)迅速飆升(sheng),助(zhu)推全民AI創業熱潮,普(pu)通用戶(hu)會(hui)(hui)(hui)(hui)發(fa)現算(suan)(suan)力成本已經逐步平攤(tan)到廣告成本或交易成本里。“科技發(fa)展史證明智能(neng)產業普(pu)及期是(shi)這樣的,但(dan)怎么會(hui)(hui)(hui)(hui)發(fa)生?就要回到新一代人工智能(neng)基(ji)礎研發(fa)的路徑上(shang),要找到新的踏腳石,一步一步走過去。”
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或(huo)鏡像,違者(zhe)必究。
讀者熱線(xian):4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您(nin)不希望作(zuo)品(pin)出現(xian)在本站,可聯系我們要(yao)求(qiu)撤下您(nin)的作(zuo)品(pin)。
歡(huan)迎關注每日經(jing)濟新聞APP