AIGC行業周報 | 斯坦福AI團隊被指抄襲中國大模型；英偉達發布Blackwell GPU；報告：生成式AI應用激增，亞太成增長最快區域

每日經濟新聞 2024-06-07 18:27:28

每(mei)經(jing)編(bian)輯｜張錦河

開欄語：《AIGC行業周報》梳理AIGC行業一周內發生的重要動態，產品發布和業內大咖的最新觀點。

圖片來源：每經制圖

一、企業動態

（一）OpenAI公開前沿大模型安全策略細節

6月6日(ri)凌晨，OpenAI首次系統性地公開了其(qi)前(qian)沿大(da)模型的(de)安(an)全策略，包括(kuo)基礎架構、保護措施、敏感(gan)數據存儲和開發人員訪問管理等(deng)高級細(xi)節。這些信息不僅展示了OpenAI模型的(de)開發流程，也為開發者研究前(qian)沿大(da)模型提供了技術參考。同時，OpenAI近期頻繁(fan)發布關于(yu)AI模型安(an)全的(de)介紹，反映出(chu)其(qi)面臨的(de)安(an)全壓力。此(ci)外，11名OpenAI的(de)現(xian)役(yi)和前(qian)員工發布了公開信，警告前(qian)沿AI模型可能帶來的(de)風(feng)險，并呼吁制定安(an)全、可持續的(de)監督(du)條例(li)和規則(ze)。

（二）斯坦福Llama3-V項目被指抄襲清華MiniCPM-Llama3-V 2.5，引發開源社區質疑

近日，斯(si)坦福(fu)大(da)學(xue)(xue)的(de)(de)(de)(de)研究團隊發布了(le)(le)Llama3-V項(xiang)目(mu)(mu)，宣稱僅需500美元就能訓(xun)練出(chu)一個(ge)與GPT4-V等(deng)性能相當的(de)(de)(de)(de)多(duo)模態(tai)模型。然而，項(xiang)目(mu)(mu)很快受到(dao)社區的(de)(de)(de)(de)質疑(yi)，被(bei)指控抄(chao)襲(xi)了(le)(le)清華大(da)學(xue)(xue)與面壁智能合作開發的(de)(de)(de)(de)MiniCPM-Llama3-V 2.5模型。面對(dui)(dui)抄(chao)襲(xi)指控，Llama3-V的(de)(de)(de)(de)GitHub倉庫和(he)HuggingFace頁面被(bei)刪除(chu)，作者(zhe)之一也對(dui)(dui)使(shi)(shi)用(yong)MiniCPM-Llama3-V 2.5的(de)(de)(de)(de)tokenizer進行(xing)了(le)(le)回(hui)應，但(dan)社區成員通(tong)(tong)過對(dui)(dui)比(bi)分析發現了(le)(le)更多(duo)代碼(ma)和(he)架構上的(de)(de)(de)(de)相似(si)之處，指出(chu)Llama3-V作者(zhe)可(ke)能并(bing)不完(wan)全理解(jie)自己所使(shi)(shi)用(yong)的(de)(de)(de)(de)代碼(ma)。盡管Llama3-V項(xiang)目(mu)(mu)試圖通(tong)(tong)過刪除(chu)項(xiang)目(mu)(mu)頁面來應對(dui)(dui)質疑(yi)，但(dan)社區成員已經(jing)保(bao)存了(le)(le)相關(guan)證據(ju)，并(bing)呼吁斯(si)坦福(fu)大(da)學(xue)(xue)介入調查這一可(ke)能的(de)(de)(de)(de)學(xue)(xue)術(shu)不端行(xing)為(wei)。

（三）OpenAI和Google員工聯名警告AI風險，獲“深度學習之父”支持

近日，來(lai)自OpenAI和(he)Google DeepMind的數名現任和(he)前任員工發(fa)表了一(yi)封公(gong)開信(xin)，警告人工智能發(fa)展可能帶來(lai)的風險，包(bao)括社(she)會不平等(deng)加劇(ju)、錯誤信(xin)息傳播(bo)和(he)自主AI系(xi)統(tong)失控等(deng)。公(gong)開信(xin)強調，盡管全球政府(fu)和(he)AI專家已意識到(dao)這些風險，但(dan)追求(qiu)財務利益的AI公(gong)司(si)往往抵(di)制(zhi)有(you)效(xiao)監督，現有(you)企業治理結(jie)構不足(zu)以應(ying)對(dui)挑(tiao)戰。信(xin)中呼(hu)吁AI企業遵循(xun)不簽訂禁(jin)止負面評(ping)價的協議、建(jian)立匿(ni)名反饋機(ji)制(zhi)等(deng)原(yuan)則。這封公(gong)開信(xin)得(de)到(dao)了“AI教父”Geoffrey Hinton、圖靈獎得(de)主Yoshua Bengio以及AI安全領域(yu)頂級(ji)學(xue)者Stuart Russell的支持(chi)。

二、產品動態

（一）英偉達發布Blackwell GPU，推進AI帝國建設并解決全球耗電難題

6月3日凌晨，英(ying)偉(wei)(wei)達CEO黃(huang)(huang)仁(ren)勛（老黃(huang)(huang)）宣布了(le)一系列技術創新和產品(pin)迭代，包括(kuo)已經量(liang)產的(de)Blackwell GPU，這款迄(qi)今為止最大的(de)芯(xin)片(pian)將(jiang)在未(wei)來8年內將(jiang)1.8萬億參數GPT-4的(de)訓練能(neng)(neng)耗降低(di)至原來的(de)1/350。Blackwell GPU的(de)推出，連同其后三代的(de)路線圖(tu)，標志著英(ying)偉(wei)(wei)達在AI領(ling)域的(de)雄心和實力(li)。黃(huang)(huang)仁(ren)勛還展(zhan)示(shi)了(le)英(ying)偉(wei)(wei)達在加速(su)計算、AI工廠、數字人、智能(neng)(neng)體(ti)等領(ling)域的(de)進展(zhan)，并(bing)預告了(le)下一代芯(xin)片(pian)Rubin。此外(wai)，英(ying)偉(wei)(wei)達還發(fa)布了(le)數字孿生地(di)球「Earth-2」項(xiang)目，旨(zhi)在通過(guo)高解(jie)析度的(de)模擬(ni)預測(ce)全(quan)球氣(qi)候變化，推動物理AI和具(ju)身AI的(de)發(fa)展(zhan)，為未(wei)來的(de)AI機器人時代鋪路。

（二）國產AI視頻生成模型「可靈」開放測試，展現高真實度和物理規律模擬能力

近(jin)日，快手推出(chu)了(le)名為「可(ke)靈」的(de)國產AI視(shi)頻生成(cheng)大模(mo)(mo)型(xing)，該(gai)模(mo)(mo)型(xing)基于Sora技術路線并結合(he)自研(yan)創新，能夠生成(cheng)長達2分鐘、1080p分辨率的(de)超長視(shi)頻。可(ke)靈不僅在運動(dong)模(mo)(mo)擬上表現出(chu)色，還能準確刻畫復雜運動(dong)并符合(he)物理規(gui)律(lv)，如重力和光學反(fan)射。此(ci)外，它還支持(chi)自由寬高(gao)比，與(yu)快手的(de)短視(shi)頻生態高(gao)度(du)匹配。目前，可(ke)靈已在快影APP中開放測試，標(biao)志著快手在短視(shi)頻領域的(de)AI應用邁出(chu)了(le)重要一步。

（三）Meta AI模型NLLB200在Nature發表，翻譯質量提升44%

6月6日(ri)，Meta公司(si)在(zai)《自(zi)然(ran)》雜志上發表了(le)關于(yu)其最新(xin)AI模型No Language Left Behind (NLLB)的(de)研究文章，該模型能夠支持200種語言(yan)之間(jian)的(de)高質(zhi)(zhi)量(liang)翻(fan)譯，特別強調了(le)對低資源(yuan)語言(yan)的(de)翻(fan)譯能力。NLLB-200模型通(tong)過采用稀疏門控專(zhuan)家混(hun)合架(jia)構，實現了(le)高效的(de)參數(shu)利用和計算資源(yuan)分配，顯著提(ti)升了(le)翻(fan)譯質(zhi)(zhi)量(liang)，平均翻(fan)譯質(zhi)(zhi)量(liang)提(ti)升了(le)44%。此外(wai)，NLLB項目還包括了(le)數(shu)據挖掘(jue)與預(yu)處(chu)理的(de)創(chuang)新(xin)方(fang)法，多語言(yan)訓練策略(lve)，以及綜合評估工具(ju)的(de)開發，確(que)保(bao)翻(fan)譯結果的(de)安(an)全性和可靠性。

（四）Stable Diffusion 3 Medium模型將于6月12日開源，優化多方面性能

6月3日(ri)晚，Stability AI的(de)聯(lian)合首席執行(xing)官(guan)Christian Laforte在AMD產品(pin)發布會上(shang)宣布，備受(shou)期待的(de)文(wen)(wen)(wen)本(ben)(ben)到圖(tu)(tu)像生成模(mo)型(xing)Stable Diffusion 3的(de)Medium版本(ben)(ben)，具有20億(yi)參(can)數(shu)，將(jiang)在6月12日(ri)通過Hugging Face平(ping)臺開源(yuan)。該(gai)模(mo)型(xing)在照片真(zhen)實(shi)感、樣式、圖(tu)(tu)片質量以及(ji)資(zi)源(yuan)消耗等方面進(jin)行(xing)了(le)(le)顯(xian)著優化(hua)(hua)，提供了(le)(le)與閉(bi)源(yuan)產品(pin)Midjourney、DALL·E 3相媲美的(de)性能(neng)。盡管之前Stability AI經歷了(le)(le)管理層變動和財務危機，但(dan)公(gong)司不僅(jin)穩定了(le)(le)局面，還可能(neng)獲得了(le)(le)AMD的(de)贊助。Stable Diffusion 3采用(yong)了(le)(le)Diffusion Transformer架構，有效提升了(le)(le)文(wen)(wen)(wen)本(ben)(ben)語義理解、文(wen)(wen)(wen)字嵌入和圖(tu)(tu)像樣式的(de)表現，目(mu)前該(gai)模(mo)型(xing)限(xian)于學術研究使用(yong)，商業化(hua)(hua)使用(yong)需聯(lian)系(xi)Stability AI。

（五）昆侖萬維開源2000億參數稀疏大模型Skywork-MoE，支持單GPU推理

6月3日(ri)，昆侖萬維公司(si)宣布開(kai)源(yuan)(yuan)其2000億(yi)參數的稀疏大(da)模型Skywork-MoE，該模型在保(bao)持高性(xing)能的同(tong)時(shi)大(da)幅(fu)降低了推(tui)(tui)理(li)(li)成本。Skywork-MoE是(shi)(shi)(shi)基于(yu)之前開(kai)源(yuan)(yuan)的Skywork-13B模型擴展而來，是(shi)(shi)(shi)首個完(wan)整(zheng)應用MoE Upcycling技(ji)術并(bing)落地的千(qian)億(yi)級(ji)MoE大(da)模型，也是(shi)(shi)(shi)首個支持使(shi)用單(dan)個4090 GPU進行(xing)推(tui)(tui)理(li)(li)的開(kai)源(yuan)(yuan)模型。模型權重、技(ji)術報告完(wan)全(quan)開(kai)源(yuan)(yuan)，免費商用，無需申(shen)請。Skywork-MoE在8x4090服務器上通過(guo)FP8量(liang)化和(he)非(fei)均勻Tensor Parallel并(bing)行(xing)推(tui)(tui)理(li)(li)方式，能夠(gou)達(da)到(dao)2200 tokens/s的吞吐量(liang)。該模型還引(yin)入了Gating Logits歸一(yi)化操作和(he)自適應的Aux Loss訓練(lian)(lian)優(you)化算法，提升了模型性(xing)能和(he)泛化水(shui)平。此外，Skywork-MoE展示了在不同(tong)訓練(lian)(lian)階(jie)段如(ru)何通過(guo)調整(zheng)auxiliary loss系(xi)數來控制(zhi)Drop Token Rate，以及如(ru)何通過(guo)Expert Data Parallel和(he)非(fei)均勻切分流水(shui)并(bing)行(xing)技(ji)術提高大(da)規模分布式訓練(lian)(lian)的效率。

（六）智譜AI發布開源GLM-4系列大模型，引領MaaS平臺升級與行業生態發展

6月5日(ri)，智譜(pu)(pu)AI在(zai)(zai)(zai)其開(kai)(kai)放日(ri)上宣布了GLM-4系列(lie)大模(mo)型的(de)最新開(kai)(kai)源(yuan)版本(ben)，包(bao)括性能超(chao)越Llama 3 8B的(de)GLM-4-9B和(he)多(duo)模(mo)態能力比肩GPT-4V的(de)GLM-4V-9B，同時大幅降(jiang)低(di)了大模(mo)型服務的(de)成本(ben)，以6分錢(qian)/100萬Token的(de)價格提(ti)供服務。智譜(pu)(pu)AI的(de)MaaS（Model as a Service）平臺(tai)升(sheng)級至2.0版本(ben)，提(ti)供更(geng)高效的(de)模(mo)型微調平臺(tai)和(he)簡(jian)化的(de)私有模(mo)型部署流程。公司CEO張鵬(peng)強調了通過技術創新實現(xian)應用成本(ben)降(jiang)低(di)和(he)客戶價值提(ti)升(sheng)的(de)商業(ye)策略，并(bing)展示了智譜(pu)(pu)AI在(zai)(zai)(zai)大模(mo)型技術、生態建設和(he)AI安全標準(zhun)制定方面的(de)領導(dao)地位(wei)。此外，智譜(pu)(pu)AI的(de)開(kai)(kai)源(yuan)模(mo)型累計下載(zai)量達到1600萬次，顯示了其在(zai)(zai)(zai)AI技術領域(yu)的(de)廣泛影響力。

三、前沿觀點

（一）英偉達Jim Fan認為具身智能的關鍵在于開發「Foundation Agent」

近日，英偉(wei)達(da)高級(ji)研(yan)究科學(xue)家Jim Fan在(zai)(zai)GenAI峰會上探討(tao)了(le)(le)具身智能的(de)(de)挑戰(zhan)與發展，認為(wei)難點不在(zai)(zai)于硬件，而(er)在(zai)(zai)于開發「Foundation Agent」——一種能夠實(shi)現(xian)具身性、現(xian)實(shi)交互和技(ji)(ji)能掌握的(de)(de)通用算法。他分享(xiang)了(le)(le)英偉(wei)達(da)在(zai)(zai)Minecraft AI研(yan)究、Metamorph多形態(tai)機器(qi)人控制(zhi)、Eureka自動獎(jiang)勵函數設(she)計等方面(mian)的(de)(de)最新進展，并(bing)強調了(le)(le)域(yu)隨機化技(ji)(ji)術在(zai)(zai)將(jiang)(jiang)模擬環境訓練的(de)(de)模型泛化到(dao)現(xian)實(shi)世界中的(de)(de)應(ying)用。Jim Fan預測，隨著(zhu)技(ji)(ji)術進步，仿(fang)人機器(qi)人的(de)(de)成本(ben)將(jiang)(jiang)大幅下降，而(er)人工智能的(de)(de)發展將(jiang)(jiang)是推動具身智能發展的(de)(de)關鍵因素。

（二）報告：生成式AI應用激增，亞太成增長最快區域

近日，全球咨(zi)詢公司麥肯(ken)錫發(fa)布(bu)的最新調查報(bao)告(gao)指出，生成式(shi)AI技術(shu)(shu)如ChatGPT和(he)Copilot等(deng)的應用(yong)(yong)在2024年(nian)顯著增(zeng)長，65%的受(shou)訪管理(li)者(zhe)已經在業務(wu)中(zhong)使用(yong)(yong)該技術(shu)(shu)，相比(bi)2023年(nian)的33%幾乎(hu)增(zeng)長了兩倍。報(bao)告(gao)特別(bie)強調，亞太地(di)區是應用(yong)(yong)生成式(shi)AI增(zeng)長最快的區域(yu)，這主(zhu)要得益(yi)于技術(shu)(shu)環境(jing)和(he)原生數字(zi)人口(kou)的優勢。應用(yong)(yong)場景主(zhu)要集中(zhong)在營(ying)銷(xiao)銷(xiao)售、產品服(fu)務(wu)開發(fa)以及IT領域(yu)。企業采用(yong)(yong)生成式(shi)AI的方(fang)式(shi)多樣，包括使用(yong)(yong)現(xian)成產品、合(he)作微(wei)調模型和(he)自(zi)主(zhu)開發(fa)。麥肯(ken)錫認為，2024年(nian)是生成式(shi)AI實現(xian)場景化(hua)落(luo)地(di)并產生商業價值的一年(nian)。

來源(yuan)：每經科(ke)技提供

如需轉載請與《每日經濟新聞》報社聯系。
未(wei)經(jing)《每日經(jing)濟新(xin)聞》報社授權，嚴禁轉載或(huo)鏡像，違者必究。

讀者熱線：4008890008

特別(bie)提醒：如果我們使用了您的圖片，請作者與本站聯系索取稿(gao)酬。如(ru)您不希望作品出(chu)現在(zai)本站，可聯系(xi)我們(men)要求撤下您的作品。

Ai 模型 GPU

上一篇文章

*ST易連：目前公司尚(shang)未收到就立案調查事項的結論性意見或決定

返回每經網首頁

下一篇文章

歐洲央行降息！五年來(lai)(lai)首次！最新解讀來(lai)(lai)了