每日經濟新聞 2023-11-06 21:01:46
◎下半年,國(guo)內大(da)模型創業公(gong)司也(ye)進入了產品(pin)的密(mi)集發布和融資關鍵期。不過,現(xian)階(jie)段大(da)模型企業要(yao)(yao)脫穎而出,應(ying)該在用戶口碑中(zhong)拔得頭(tou)籌,大(da)模型企業要(yao)(yao)搶(qiang)占先機(ji),推(tui)出應(ying)用要(yao)(yao)快,要(yao)(yao)早。
每經(jing)記者|趙雯琪 每經(jing)編(bian)輯|劉(liu)雪梅(mei)
距離宣(xuan)布親自(zi)下場(chang)大模型(xing)創業“不僅(jin)僅(jin)要做中文ChatGPT”僅(jin)僅(jin)8個(ge)月(yue),李開(kai)復和他的AI公司迎來實質性進展。
11月6日,李開復帶隊創辦的(de)AI 2.0公司零一萬(wan)物(wu)正式(shi)開源(yuan)發布首(shou)款預(yu)訓練大模型Yi-34B,同時宣布啟動下一個千億參(can)數模型的(de)訓練。目前該AI大模型已開放(fang)商用(yong)申請,并在阿里云魔搭社區ModelScope首(shou)發。
《每日經(jing)濟新聞》記者同時獲悉,零一萬物已完成由(you)阿里(li)云領投的10億(yi)美元融資。目前,零一萬物估值已超10億(yi)美元,躋(ji)身獨角(jiao)獸行(xing)列。這也就意味著,創業8個月(yue),李開復再收獲一家(jia)AI獨角(jiao)獸公(gong)司(si)。
今年以來,生(sheng)成式AI成為資(zi)(zi)本市場最大的熱點和風口。國內大模型創(chuang)業賽道中(zhong)涌現出上百(bai)家創(chuang)業公司(si),多個(ge)科(ke)技大廠也(ye)親自(zi)下(xia)場。如今隨著越來越多頭部企業發(fa)布(bu)產品并陸續獲(huo)得融資(zi)(zi),國內大模型激(ji)戰也(ye)進入(ru)新的階段。
浙(zhe)江大(da)學(xue)國(guo)際聯合商(shang)學(xue)院數字經濟(ji)與(yu)金融創新研(yan)究(jiu)中(zhong)心聯席主任、研(yan)究(jiu)員盤和(he)(he)林(lin)在接(jie)受(shou)《每(mei)日經濟(ji)新聞》記者(zhe)采訪時表(biao)示,大(da)模(mo)型如今正呈現百(bai)舸(ge)爭流、千帆競渡的景象,實質上(shang)大(da)模(mo)型的基礎算法并不難,難的是(shi)通過數據學(xue)習和(he)(he)參數積累形成一個通用(yong)(yong)人工智(zhi)能,并被(bei)用(yong)(yong)戶(hu)(hu)廣(guang)泛(fan)認可(ke),現階(jie)段大(da)模(mo)型企(qi)業(ye)要脫穎而(er)出(chu),應(ying)該在用(yong)(yong)戶(hu)(hu)口碑中(zhong)拔得頭籌,大(da)模(mo)型企(qi)業(ye)要搶占先機,推出(chu)應(ying)用(yong)(yong)要快,要早。
據零一萬物介紹(shao),此次開源(yuan)發布(bu)的Yi系(xi)列模(mo)(mo)(mo)型(xing)(xing),包含34B和(he)6B兩個版本(ben)。在Hugging Face英(ying)文測(ce)試(shi)公開榜(bang)單Pretrained預訓(xun)練(lian)開源(yuan)模(mo)(mo)(mo)型(xing)(xing)排(pai)名中(zhong),Yi-34B各項性能以(yi)70.72的分數位列全(quan)球第一,公開資料顯示,Hugging Face是(shi)全(quan)球最(zui)受歡迎的大模(mo)(mo)(mo)型(xing)(xing)、數據集開源(yuan)社(she)區,被認為是(shi)大模(mo)(mo)(mo)型(xing)(xing)領域的GitHub,在大模(mo)(mo)(mo)型(xing)(xing)英(ying)文能力測(ce)試(shi)中(zhong)具有(you)相當權威(wei)性。
值得(de)一提的是,作(zuo)為(wei)國產(chan)大模型,Yi-34B更“懂”中(zhong)文。對比大模型標(biao)桿(gan)GPT-4,在(zai)CMMLU、E-Eval、Gaokao三個(ge)主要(yao)的中(zhong)文指標(biao)上,Yi-34B也具有優(you)勢,能(neng)更好(hao)地滿足國內(nei)市場需求。
各評測(ce)集得分:Yi模(mo)型(xing)v.s.其他開(kai)源(yuan)模(mo)型(xing) 圖片來源(yuan):零一萬物
《每日經濟(ji)新聞(wen)》記者(zhe)從零一(yi)萬(wan)物了解到,此次(ci)開源的Yi-34B模(mo)型,將發布(bu)全球最長、可支持200K超長上下文(wen)窗(chuang)口(kou)(kou)(context window)版本,可以(yi)處理約40萬(wan)漢(han)字(zi)超長文(wen)本輸入。相比之下,OpenAI的GPT-4上下文(wen)窗(chuang)口(kou)(kou)只有32K,文(wen)字(zi)處理量約2.5萬(wan)字(zi)。
據了解,在語(yu)言模(mo)型(xing)中,上下文(wen)(wen)窗口是大(da)模(mo)型(xing)綜合運算(suan)能(neng)力的金指標之(zhi)一(yi),對于理(li)解和(he)生成(cheng)與特定上下文(wen)(wen)相關的文(wen)(wen)本至關重要,擁(yong)有更長(chang)窗口的語(yu)言模(mo)型(xing)可(ke)以處理(li)更豐富的知識庫信息,生成(cheng)更連貫(guan)、準確的文(wen)(wen)本。
此(ci)外,在(zai)(zai)文(wen)檔摘要、基于文(wen)檔的(de)(de)問答等下游任(ren)務(wu)中,長上下文(wen)的(de)(de)能力(li)發揮(hui)著關鍵作用,行業應用場(chang)景(jing)廣闊。在(zai)(zai)法律、財(cai)務(wu)、傳媒、檔案整(zheng)理(li)等諸多垂直場(chang)景(jing)里,更準確、更連貫(guan)、速度更快的(de)(de)長文(wen)本窗(chuang)口功能,可以成為人們(men)更可靠(kao)的(de)(de)AI助理(li),讓生(sheng)產力(li)提升。
然而(er),受(shou)限(xian)于計(ji)算(suan)復雜度(du)(du)、數據完(wan)備(bei)度(du)(du)等(deng)問題(ti),上下(xia)文窗(chuang)口規(gui)模(mo)(mo)擴充從計(ji)算(suan)、內存和通(tong)信的(de)角度(du)(du)存在各種挑戰,因此大(da)多(duo)數發(fa)布(bu)的(de)大(da)型(xing)(xing)語言模(mo)(mo)型(xing)(xing)僅支持幾千tokens的(de)上下(xia)文長度(du)(du)。為了解決這個限(xian)制,零一(yi)萬物技術團隊實施(shi)了一(yi)系列(lie)(lie)優化,包括(kuo):計(ji)算(suan)通(tong)信重疊、序(xu)列(lie)(lie)并(bing)行、通(tong)信壓縮等(deng)。通(tong)過這些能(neng)力增強,實現了在大(da)規(gui)模(mo)(mo)模(mo)(mo)型(xing)(xing)訓練中近100倍的(de)能(neng)力提升,也為Yi系列(lie)(lie)模(mo)(mo)型(xing)(xing)上下(xia)文規(gui)模(mo)(mo)下(xia)一(yi)次(ci)躍升儲備(bei)了充足“電力”。
李開(kai)復表(biao)示,零一(yi)萬物堅定進軍全球第(di)(di)一(yi)梯(ti)隊目(mu)標,從招的第(di)(di)一(yi)個(ge)人,寫的第(di)(di)一(yi)行(xing)代碼,設計(ji)的第(di)(di)一(yi)個(ge)模型開(kai)始,就(jiu)一(yi)直(zhi)抱(bao)著成(cheng)為‘World's No.1’(世(shi)界第(di)(di)一(yi))的初衷和決(jue)心。
“我們組成了(le)一(yi)(yi)支有(you)潛力對標OpenAI、Google等一(yi)(yi)線大廠的(de)(de)團隊(dui),經歷了(le)近半(ban)年的(de)(de)厚積(ji)薄發,以(yi)穩(wen)定的(de)(de)節奏和(he)全球(qiu)齊平(ping)的(de)(de)研(yan)究工程能力,交出了(le)第一(yi)(yi)張極具(ju)全球(qiu)競爭力的(de)(de)耀眼成績單。Yi-34B可以(yi)說不負眾望(wang),一(yi)(yi)鳴驚人。”李開(kai)復表示。
創業8個(ge)月,如今隨著(zhu)首(shou)款大模(mo)型(xing)的發布,大模(mo)型(xing)賽(sai)道再添新的競爭力。
《每日經濟新聞》記者(zhe)在零一(yi)萬(wan)物(wu)官網發現,零一(yi)萬(wan)物(wu)預測,AI 2.0時(shi)代(dai)將(jiang)誕生(sheng)比移(yi)動互(hu)聯網大十(shi)倍的(de)(de)(de)(de)平臺(tai)機會(hui),將(jiang)把既有的(de)(de)(de)(de)軟件、使用界面和應用重寫一(yi)次,改寫用戶的(de)(de)(de)(de)交(jiao)互(hu)和入口。AI 2.0時(shi)代(dai)將(jiang)誕生(sheng)新一(yi)批AI-first(AI為先)的(de)(de)(de)(de)應用,催(cui)生(sheng)以AI為內核的(de)(de)(de)(de)應用生(sheng)態(tai),催(cui)生(sheng)未來(lai)的(de)(de)(de)(de)超級App及嶄新的(de)(de)(de)(de)商業模式。
這(zhe)或許也(ye)是李開(kai)復(fu)親自下(xia)場加入AI大(da)模型創(chuang)業(ye)并(bing)以最快速(su)度推出首款產品的(de)主要原因。
今年以(yi)來(lai),大(da)模(mo)型(xing)賽道吸引了包括阿里、百(bai)度、字節跳動等頭(tou)部大(da)廠和李開復、王(wang)慧文、王(wang)小川等科技大(da)佬(lao)的關注,圍繞(rao)大(da)模(mo)型(xing)的創業(ye)和競爭異常激烈(lie)。根(gen)據創業(ye)邦研究中心發布的《2023年H1 AIGC產業(ye)報(bao)告》,2023年上(shang)半年,國內AIGC領域的融(rong)資(zi)事件共(gong)57起,已披露融(rong)資(zi)總額63.13億元,涉及投資(zi)機構數66家。
到了(le)下(xia)半年,國內大模(mo)型創業公司(si)也進入了(le)產品的(de)密集(ji)發(fa)布(bu)(bu)和(he)融資關鍵期。公開數(shu)據顯示,截(jie)至2023年8月,我國已發(fa)布(bu)(bu)的(de)大模(mo)型已經達到156個,10億級參數(shu)規模(mo)以(yi)上大模(mo)型超80個,“百模(mo)大戰”蓄勢待發(fa)。
不(bu)(bu)過,在(zai)大模(mo)型(xing)(xing)創業(ye)浪潮下,很多業(ye)內(nei)人(ren)士不(bu)(bu)免擔心行業(ye)泡(pao)沫的(de)問題,大模(mo)型(xing)(xing)創業(ye)公司(si)瀾舟(zhou)科技創始人(ren)兼CEO周(zhou)明在(zai)接受媒體采訪時公開表示,中(zhong)國對新技術的(de)追求和自驅能力較強,但是行業(ye)需要注意泡(pao)沫問題。“花很大的(de)功夫訓(xun)練一個(ge)不(bu)(bu)好(hao)不(bu)(bu)賴的(de)模(mo)型(xing)(xing),對廠商自己(ji)是一個(ge)學習鍛煉的(de)過程,但對社會可能不(bu)(bu)一定有用。哪怕創業(ye),可能白白浪費(fei)了(le)很多創業(ye)資(zi)本(ben)和投入。”周(zhou)明說。
盤(pan)和林則認為(wei),當(dang)前國內AI大模型(xing),雖然很多,但能(neng)夠被用(yong)戶(hu)認可的(de)大模型(xing)還不(bu)多,很多大模型(xing)僅(jin)(jin)僅(jin)(jin)在(zai)測試中能(neng)夠對(dui)標ChatGPT等國外產品,且當(dang)前國內的(de)大模型(xing)發展也受(shou)制于算力。
“我認為現階段大(da)模型(xing)企業(ye)要脫穎而(er)出,應該在(zai)用戶口碑中拔得頭籌,這個(ge)(ge)用戶口碑的(de)關(guan)鍵(jian)還是C端用戶,對用戶來說,好玩和(he)有用的(de)東西才(cai)能廣泛傳播(bo),而(er)一旦(dan)某個(ge)(ge)大(da)模型(xing)用戶培養了使用習慣(guan),則此大(da)模型(xing)將(jiang)成為一種新的(de)互(hu)聯網生(sheng)態(tai)產品,繼而(er)獲得馬太效應,所以(yi),大(da)模型(xing)企業(ye)要搶占先機,推出應用要快,要早。”盤和(he)林表示。
封面(mian)圖片來源:每經記者 趙雯琪 攝
如需轉載請與《每日經濟新聞》報社聯系。
未(wei)經《每(mei)日經濟新(xin)聞(wen)》報社(she)授(shou)權,嚴禁轉載或鏡像,違者必究。
讀者熱線(xian):4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現(xian)在(zai)本站,可聯系(xi)我(wo)們要求(qiu)撤下(xia)您的作品。
歡迎(ying)關注(zhu)每日經(jing)濟新(xin)聞APP