要聞

親自下場8個月李開復收獲AI獨角獸，“進軍世界第一梯隊”還需多久？

每日經濟新聞 2023-11-06 21:01:46

◎下半年，國(guo)內大(da)模型創業公(gong)司也(ye)進入了產品(pin)的密(mi)集發布和融資關鍵期。不過，現(xian)階(jie)段大(da)模型企業要(yao)(yao)脫穎而出，應(ying)該在用戶口碑中(zhong)拔得頭(tou)籌，大(da)模型企業要(yao)(yao)搶(qiang)占先機(ji)，推(tui)出應(ying)用要(yao)(yao)快，要(yao)(yao)早。

每經(jing)記者｜趙雯琪每經(jing)編(bian)輯｜劉(liu)雪梅(mei)

距離宣(xuan)布親自(zi)下場(chang)大模型(xing)創業“不僅(jin)僅(jin)要做中文ChatGPT”僅(jin)僅(jin)8個(ge)月(yue)，李開(kai)復和他的AI公司迎來實質性進展。

11月6日，李開復帶隊創辦的(de)AI 2.0公司零一萬(wan)物(wu)正式(shi)開源(yuan)發布首(shou)款預(yu)訓練大模型Yi-34B，同時宣布啟動下一個千億參(can)數模型的(de)訓練。目前該AI大模型已開放(fang)商用(yong)申請，并在阿里云魔搭社區ModelScope首(shou)發。

《每日經(jing)濟新聞》記者同時獲悉，零一萬物已完成由(you)阿里(li)云領投的10億(yi)美元融資。目前，零一萬物估值已超10億(yi)美元，躋(ji)身獨角(jiao)獸行(xing)列。這也就意味著，創業8個月(yue)，李開復再收獲一家(jia)AI獨角(jiao)獸公(gong)司(si)。

今年以來，生(sheng)成式AI成為資(zi)(zi)本市場最大的熱點和風口。國內大模型創(chuang)業賽道中(zhong)涌現出上百(bai)家創(chuang)業公司(si)，多個(ge)科(ke)技大廠也(ye)親自(zi)下(xia)場。如今隨著越來越多頭部企業發(fa)布(bu)產品并陸續獲(huo)得融資(zi)(zi)，國內大模型激(ji)戰也(ye)進入(ru)新的階段。

浙(zhe)江大(da)學(xue)國(guo)際聯合商(shang)學(xue)院數字經濟(ji)與(yu)金融創新研(yan)究(jiu)中(zhong)心聯席主任、研(yan)究(jiu)員盤和(he)(he)林(lin)在接(jie)受(shou)《每(mei)日經濟(ji)新聞》記者(zhe)采訪時表(biao)示，大(da)模(mo)型如今正呈現百(bai)舸(ge)爭流、千帆競渡的景象，實質上(shang)大(da)模(mo)型的基礎算法并不難，難的是(shi)通過數據學(xue)習和(he)(he)參數積累形成一個通用(yong)(yong)人工智(zhi)能，并被(bei)用(yong)(yong)戶(hu)(hu)廣(guang)泛(fan)認可(ke)，現階(jie)段大(da)模(mo)型企(qi)業(ye)要脫穎而(er)出(chu)，應(ying)該在用(yong)(yong)戶(hu)(hu)口碑中(zhong)拔得頭籌，大(da)模(mo)型企(qi)業(ye)要搶占先機，推出(chu)應(ying)用(yong)(yong)要快，要早。

可處理40萬字文本

要進軍“世界第一梯隊”

據零一萬物介紹(shao)，此次開源(yuan)發布(bu)的Yi系(xi)列模(mo)(mo)(mo)型(xing)(xing)，包含34B和(he)6B兩個版本(ben)。在Hugging Face英(ying)文測(ce)試(shi)公開榜(bang)單Pretrained預訓(xun)練(lian)開源(yuan)模(mo)(mo)(mo)型(xing)(xing)排(pai)名中(zhong)，Yi-34B各項性能以(yi)70.72的分數位列全(quan)球第一，公開資料顯示，Hugging Face是(shi)全(quan)球最(zui)受歡迎的大模(mo)(mo)(mo)型(xing)(xing)、數據集開源(yuan)社(she)區，被認為是(shi)大模(mo)(mo)(mo)型(xing)(xing)領域的GitHub，在大模(mo)(mo)(mo)型(xing)(xing)英(ying)文能力測(ce)試(shi)中(zhong)具有(you)相當權威(wei)性。

值得(de)一提的是，作(zuo)為(wei)國產(chan)大模型，Yi-34B更“懂”中(zhong)文。對比大模型標(biao)桿(gan)GPT-4，在(zai)CMMLU、E-Eval、Gaokao三個(ge)主要(yao)的中(zhong)文指標(biao)上，Yi-34B也具有優(you)勢，能(neng)更好(hao)地滿足國內(nei)市場需求。

各評測(ce)集得分：Yi模(mo)型(xing)v.s.其他開(kai)源(yuan)模(mo)型(xing) 圖片來源(yuan)：零一萬物

《每日經濟(ji)新聞(wen)》記者(zhe)從零一(yi)萬(wan)物了解到，此次(ci)開源的Yi-34B模(mo)型，將發布(bu)全球最長、可支持200K超長上下文(wen)窗(chuang)口(kou)(kou)（context window）版本，可以(yi)處理約40萬(wan)漢(han)字(zi)超長文(wen)本輸入。相比之下，OpenAI的GPT-4上下文(wen)窗(chuang)口(kou)(kou)只有32K，文(wen)字(zi)處理量約2.5萬(wan)字(zi)。

據了解，在語(yu)言模(mo)型(xing)中，上下文(wen)(wen)窗口是大(da)模(mo)型(xing)綜合運算(suan)能(neng)力的金指標之(zhi)一(yi)，對于理(li)解和(he)生成(cheng)與特定上下文(wen)(wen)相關的文(wen)(wen)本至關重要，擁(yong)有更長(chang)窗口的語(yu)言模(mo)型(xing)可(ke)以處理(li)更豐富的知識庫信息，生成(cheng)更連貫(guan)、準確的文(wen)(wen)本。

此(ci)外，在(zai)(zai)文(wen)檔摘要、基于文(wen)檔的(de)(de)問答等下游任(ren)務(wu)中，長上下文(wen)的(de)(de)能力(li)發揮(hui)著關鍵作用，行業應用場(chang)景(jing)廣闊。在(zai)(zai)法律、財(cai)務(wu)、傳媒、檔案整(zheng)理(li)等諸多垂直場(chang)景(jing)里，更準確、更連貫(guan)、速度更快的(de)(de)長文(wen)本窗(chuang)口功能，可以成為人們(men)更可靠(kao)的(de)(de)AI助理(li)，讓生(sheng)產力(li)提升。

然而(er)，受(shou)限(xian)于計(ji)算(suan)復雜度(du)(du)、數據完(wan)備(bei)度(du)(du)等(deng)問題(ti)，上下(xia)文窗(chuang)口規(gui)模(mo)(mo)擴充從計(ji)算(suan)、內存和通(tong)信的(de)角度(du)(du)存在各種挑戰，因此大(da)多(duo)數發(fa)布(bu)的(de)大(da)型(xing)(xing)語言模(mo)(mo)型(xing)(xing)僅支持幾千tokens的(de)上下(xia)文長度(du)(du)。為了解決這個限(xian)制，零一(yi)萬物技術團隊實施(shi)了一(yi)系列(lie)(lie)優化，包括(kuo)：計(ji)算(suan)通(tong)信重疊、序(xu)列(lie)(lie)并(bing)行、通(tong)信壓縮等(deng)。通(tong)過這些能(neng)力增強，實現了在大(da)規(gui)模(mo)(mo)模(mo)(mo)型(xing)(xing)訓練中近100倍的(de)能(neng)力提升，也為Yi系列(lie)(lie)模(mo)(mo)型(xing)(xing)上下(xia)文規(gui)模(mo)(mo)下(xia)一(yi)次(ci)躍升儲備(bei)了充足“電力”。

李開(kai)復表(biao)示，零一(yi)萬物堅定進軍全球第(di)(di)一(yi)梯(ti)隊目(mu)標，從招的第(di)(di)一(yi)個(ge)人，寫的第(di)(di)一(yi)行(xing)代碼，設計(ji)的第(di)(di)一(yi)個(ge)模型開(kai)始，就(jiu)一(yi)直(zhi)抱(bao)著成(cheng)為‘World's No.1’（世(shi)界第(di)(di)一(yi)）的初衷和決(jue)心。

“我們組成了(le)一(yi)(yi)支有(you)潛力對標OpenAI、Google等一(yi)(yi)線大廠的(de)(de)團隊(dui)，經歷了(le)近半(ban)年的(de)(de)厚積(ji)薄發，以(yi)穩(wen)定的(de)(de)節奏和(he)全球(qiu)齊平(ping)的(de)(de)研(yan)究工程能力，交出了(le)第一(yi)(yi)張極具(ju)全球(qiu)競爭力的(de)(de)耀眼成績單。Yi-34B可以(yi)說不負眾望(wang)，一(yi)(yi)鳴驚人。”李開(kai)復表示。

10億級參數規模大模型已超80個

“百模大戰”競爭激烈

創業8個(ge)月，如今隨著(zhu)首(shou)款大模(mo)型(xing)的發布，大模(mo)型(xing)賽(sai)道再添新的競爭力。

《每日經濟新聞》記者(zhe)在零一(yi)萬(wan)物(wu)官網發現，零一(yi)萬(wan)物(wu)預測，AI 2.0時(shi)代(dai)將(jiang)誕生(sheng)比移(yi)動互(hu)聯網大十(shi)倍的(de)(de)(de)(de)平臺(tai)機會(hui)，將(jiang)把既有的(de)(de)(de)(de)軟件、使用界面和應用重寫一(yi)次，改寫用戶的(de)(de)(de)(de)交(jiao)互(hu)和入口。AI 2.0時(shi)代(dai)將(jiang)誕生(sheng)新一(yi)批AI-first（AI為先）的(de)(de)(de)(de)應用，催(cui)生(sheng)以AI為內核的(de)(de)(de)(de)應用生(sheng)態(tai)，催(cui)生(sheng)未來(lai)的(de)(de)(de)(de)超級App及嶄新的(de)(de)(de)(de)商業模式。

這(zhe)或許也(ye)是李開(kai)復(fu)親自下(xia)場加入AI大(da)模型創(chuang)業(ye)并(bing)以最快速(su)度推出首款產品的(de)主要原因。

今年以(yi)來(lai)，大(da)模(mo)型(xing)賽道吸引了包括阿里、百(bai)度、字節跳動等頭(tou)部大(da)廠和李開復、王(wang)慧文、王(wang)小川等科技大(da)佬(lao)的關注，圍繞(rao)大(da)模(mo)型(xing)的創業(ye)和競爭異常激烈(lie)。根(gen)據創業(ye)邦研究中心發布的《2023年H1 AIGC產業(ye)報(bao)告》，2023年上(shang)半年，國內AIGC領域的融(rong)資(zi)事件共(gong)57起，已披露融(rong)資(zi)總額63.13億元，涉及投資(zi)機構數66家。

到了(le)下(xia)半年，國內大模(mo)型創業公司(si)也進入了(le)產品的(de)密集(ji)發(fa)布(bu)(bu)和(he)融資關鍵期。公開數(shu)據顯示，截(jie)至2023年8月，我國已發(fa)布(bu)(bu)的(de)大模(mo)型已經達到156個，10億級參數(shu)規模(mo)以(yi)上大模(mo)型超80個，“百模(mo)大戰”蓄勢待發(fa)。

不(bu)(bu)過，在(zai)大模(mo)型(xing)(xing)創業(ye)浪潮下，很多業(ye)內(nei)人(ren)士不(bu)(bu)免擔心行業(ye)泡(pao)沫的(de)問題，大模(mo)型(xing)(xing)創業(ye)公司(si)瀾舟(zhou)科技創始人(ren)兼CEO周(zhou)明在(zai)接受媒體采訪時公開表示，中(zhong)國對新技術的(de)追求和自驅能力較強，但是行業(ye)需要注意泡(pao)沫問題。“花很大的(de)功夫訓(xun)練一個(ge)不(bu)(bu)好(hao)不(bu)(bu)賴的(de)模(mo)型(xing)(xing)，對廠商自己(ji)是一個(ge)學習鍛煉的(de)過程，但對社會可能不(bu)(bu)一定有用。哪怕創業(ye)，可能白白浪費(fei)了(le)很多創業(ye)資(zi)本(ben)和投入。”周(zhou)明說。

盤(pan)和林則認為(wei)，當(dang)前國內AI大模型(xing)，雖然很多，但能(neng)夠被用(yong)戶(hu)認可的(de)大模型(xing)還不(bu)多，很多大模型(xing)僅(jin)(jin)僅(jin)(jin)在(zai)測試中能(neng)夠對(dui)標ChatGPT等國外產品，且當(dang)前國內的(de)大模型(xing)發展也受(shou)制于算力。

“我認為現階段大(da)模型(xing)企業(ye)要脫穎而(er)出，應該在(zai)用戶口碑中拔得頭籌，這個(ge)(ge)用戶口碑的(de)關(guan)鍵(jian)還是C端用戶，對用戶來說，好玩和(he)有用的(de)東西才(cai)能廣泛傳播(bo)，而(er)一旦(dan)某個(ge)(ge)大(da)模型(xing)用戶培養了使用習慣(guan)，則此大(da)模型(xing)將(jiang)成為一種新的(de)互(hu)聯網生(sheng)態(tai)產品，繼而(er)獲得馬太效應，所以(yi)，大(da)模型(xing)企業(ye)要搶占先機，推出應用要快，要早。”盤和(he)林表示。

封面(mian)圖片來源：每經記者趙雯琪攝

如需轉載請與《每日經濟新聞》報社聯系。
未(wei)經《每(mei)日經濟新(xin)聞(wen)》報社(she)授(shou)權，嚴禁轉載或鏡像，違者必究。

讀者熱線(xian)：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿酬。如您不希望作品出現(xian)在(zai)本站，可聯系(xi)我(wo)們要求(qiu)撤下(xia)您的作品。

距離宣布親自下場大模型創業“不僅僅要做中文ChatGPT”僅僅8個月，李開復和他的AI公司迎來實質性進展。 11月6日，李開復帶隊創辦的AI2.0公司零一萬物正式開源發布首款預訓練大模型Yi-34B，同時宣布啟動下一個千億參數模型的訓練。目前該AI大模型已開放商用申請，并在阿里云魔搭社區ModelScope首發。《每日經濟新聞》記者同時獲悉，零一萬物已完成由阿里云領投的10億美元融資。目前，零一萬物估值已超10億美元，躋身獨角獸行列。這也就意味著，創業8個月，李開復再收獲一家AI獨角獸公司。今年以來，生成式AI成為資本市場最大的熱點和風口。國內大模型創業賽道中涌現出上百家創業公司，多個科技大廠也親自下場。如今隨著越來越多頭部企業發布產品并陸續獲得融資，國內大模型激戰也進入新的階段。浙江大學國際聯合商學院數字經濟與金融創新研究中心聯席主任、研究員盤和林在接受《每日經濟新聞》記者采訪時表示，大模型如今正呈現百舸爭流、千帆競渡的景象，實質上大模型的基礎算法并不難，難的是通過數據學習和參數積累形成一個通用人工智能，并被用戶廣泛認可，現階段大模型企業要脫穎而出，應該在用戶口碑中拔得頭籌，大模型企業要搶占先機，推出應用要快，要早。可處理40萬字文本要進軍“世界第一梯隊” 據零一萬物介紹，此次開源發布的Yi系列模型，包含34B和6B兩個版本。在HuggingFace英文測試公開榜單Pretrained預訓練開源模型排名中，Yi-34B各項性能以70.72的分數位列全球第一，公開資料顯示，HuggingFace是全球最受歡迎的大模型、數據集開源社區，被認為是大模型領域的GitHub，在大模型英文能力測試中具有相當權威性。值得一提的是，作為國產大模型，Yi-34B更“懂”中文。對比大模型標桿GPT-4，在CMMLU、E-Eval、Gaokao三個主要的中文指標上，Yi-34B也具有優勢，能更好地滿足國內市場需求。各評測集得分：Yi模型v.s.其他開源模型圖片來源：零一萬物《每日經濟新聞》記者從零一萬物了解到，此次開源的Yi-34B模型，將發布全球最長、可支持200K超長上下文窗口（contextwindow）版本，可以處理約40萬漢字超長文本輸入。相比之下，OpenAI的GPT-4上下文窗口只有32K，文字處理量約2.5萬字。據了解，在語言模型中，上下文窗口是大模型綜合運算能力的金指標之一，對于理解和生成與特定上下文相關的文本至關重要，擁有更長窗口的語言模型可以處理更豐富的知識庫信息，生成更連貫、準確的文本。此外，在文檔摘要、基于文檔的問答等下游任務中，長上下文的能力發揮著關鍵作用，行業應用場景廣闊。在法律、財務、傳媒、檔案整理等諸多垂直場景里，更準確、更連貫、速度更快的長文本窗口功能，可以成為人們更可靠的AI助理，讓生產力提升。然而，受限于計算復雜度、數據完備度等問題，上下文窗口規模擴充從計算、內存和通信的角度存在各種挑戰，因此大多數發布的大型語言模型僅支持幾千tokens的上下文長度。為了解決這個限制，零一萬物技術團隊實施了一系列優化，包括：計算通信重疊、序列并行、通信壓縮等。通過這些能力增強，實現了在大規模模型訓練中近100倍的能力提升，也為Yi系列模型上下文規模下一次躍升儲備了充足“電力”。李開復表示，零一萬物堅定進軍全球第一梯隊目標，從招的第一個人，寫的第一行代碼，設計的第一個模型開始，就一直抱著成為‘World'sNo.1’（世界第一）的初衷和決心。 “我們組成了一支有潛力對標OpenAI、Google等一線大廠的團隊，經歷了近半年的厚積薄發，以穩定的節奏和全球齊平的研究工程能力，交出了第一張極具全球競爭力的耀眼成績單。Yi-34B可以說不負眾望，一鳴驚人。”李開復表示。 10億級參數規模大模型已超80個 “百模大戰”競爭激烈創業8個月，如今隨著首款大模型的發布，大模型賽道再添新的競爭力。《每日經濟新聞》記者在零一萬物官網發現，零一萬物預測，AI2.0時代將誕生比移動互聯網大十倍的平臺機會，將把既有的軟件、使用界面和應用重寫一次，改寫用戶的交互和入口。AI2.0時代將誕生新一批AI-first（AI為先）的應用，催生以AI為內核的應用生態，催生未來的超級App及嶄新的商業模式。這或許也是李開復親自下場加入AI大模型創業并以最快速度推出首款產品的主要原因。今年以來，大模型賽道吸引了包括阿里、百度、字節跳動等頭部大廠和李開復、王慧文、王小川等科技大佬的關注，圍繞大模型的創業和競爭異常激烈。根據創業邦研究中心發布的《2023年H1AIGC產業報告》，2023年上半年，國內AIGC領域的融資事件共57起，已披露融資總額63.13億元，涉及投資機構數66家。到了下半年，國內大模型創業公司也進入了產品的密集發布和融資關鍵期。公開數據顯示，截至2023年8月，我國已發布的大模型已經達到156個，10億級參數規模以上大模型超80個，“百模大戰”蓄勢待發。不過，在大模型創業浪潮下，很多業內人士不免擔心行業泡沫的問題，大模型創業公司瀾舟科技創始人兼CEO周明在接受媒體采訪時公開表示，中國對新技術的追求和自驅能力較強，但是行業需要注意泡沫問題。“花很大的功夫訓練一個不好不賴的模型，對廠商自己是一個學習鍛煉的過程，但對社會可能不一定有用。哪怕創業，可能白白浪費了很多創業資本和投入。”周明說。盤和林則認為，當前國內AI大模型，雖然很多，但能夠被用戶認可的大模型還不多，很多大模型僅僅在測試中能夠對標ChatGPT等國外產品，且當前國內的大模型發展也受制于算力。 “我認為現階段大模型企業要脫穎而出，應該在用戶口碑中拔得頭籌，這個用戶口碑的關鍵還是C端用戶，對用戶來說，好玩和有用的東西才能廣泛傳播，而一旦某個大模型用戶培養了使用習慣，則此大模型將成為一種新的互聯網生態產品，繼而獲得馬太效應，所以，大模型企業要搶占先機，推出應用要快，要早。”盤和林表示。

模型(xing) 大模型獨角獸(shou) Ai 創新工(gong)廠

上一篇文章

國(guo)內(nei)期貨夜盤(pan)開盤(pan)漲跌不一

返回每經網首頁

下一篇文章

又被漲停包圍！多(duo)家機構再喊“牛市起點”