每日經濟新聞 2024-06-07 18:27:28
每(mei)經(jing)編(bian)輯|張錦河
開欄語:《AIGC行業周報》梳理AIGC行業一周內發生的重要動態,產品發布和業內大咖的最新觀點。
圖片來源:每經制圖
(一)OpenAI公開前沿大模型安全策略細節
6月6日(ri)凌晨,OpenAI首次系統性地公開了其(qi)前(qian)沿大(da)模型的(de)安(an)全策略,包括(kuo)基礎架構、保護措施、敏感(gan)數據存儲和開發人員訪問管理等(deng)高級細(xi)節。這些信息不僅展示了OpenAI模型的(de)開發流程,也為開發者研究前(qian)沿大(da)模型提供了技術參考。同時,OpenAI近期頻繁(fan)發布關于(yu)AI模型安(an)全的(de)介紹,反映出(chu)其(qi)面臨的(de)安(an)全壓力。此(ci)外,11名OpenAI的(de)現(xian)役(yi)和前(qian)員工發布了公開信,警告前(qian)沿AI模型可能帶來的(de)風(feng)險,并呼吁制定安(an)全、可持續的(de)監督(du)條例(li)和規則(ze)。
(二)斯坦福Llama3-V項目被指抄襲清華MiniCPM-Llama3-V 2.5,引發開源社區質疑
近日,斯(si)坦福(fu)大(da)學(xue)(xue)的(de)(de)(de)(de)研究團隊發布了(le)(le)Llama3-V項(xiang)目(mu)(mu),宣稱僅需500美元就能訓(xun)練出(chu)一個(ge)與GPT4-V等(deng)性能相當的(de)(de)(de)(de)多(duo)模態(tai)模型。然而,項(xiang)目(mu)(mu)很快受到(dao)社區的(de)(de)(de)(de)質疑(yi),被(bei)指控抄(chao)襲(xi)了(le)(le)清華大(da)學(xue)(xue)與面壁智能合作開發的(de)(de)(de)(de)MiniCPM-Llama3-V 2.5模型。面對(dui)(dui)抄(chao)襲(xi)指控,Llama3-V的(de)(de)(de)(de)GitHub倉庫和(he)HuggingFace頁面被(bei)刪除(chu),作者(zhe)之一也對(dui)(dui)使(shi)(shi)用(yong)MiniCPM-Llama3-V 2.5的(de)(de)(de)(de)tokenizer進行(xing)了(le)(le)回(hui)應,但(dan)社區成員通(tong)(tong)過對(dui)(dui)比(bi)分析發現了(le)(le)更多(duo)代碼(ma)和(he)架構上的(de)(de)(de)(de)相似(si)之處,指出(chu)Llama3-V作者(zhe)可(ke)能并(bing)不完(wan)全理解(jie)自己所使(shi)(shi)用(yong)的(de)(de)(de)(de)代碼(ma)。盡管Llama3-V項(xiang)目(mu)(mu)試圖通(tong)(tong)過刪除(chu)項(xiang)目(mu)(mu)頁面來應對(dui)(dui)質疑(yi),但(dan)社區成員已經(jing)保(bao)存了(le)(le)相關(guan)證據(ju),并(bing)呼吁斯(si)坦福(fu)大(da)學(xue)(xue)介入調查這一可(ke)能的(de)(de)(de)(de)學(xue)(xue)術(shu)不端行(xing)為(wei)。
(三)OpenAI和Google員工聯名警告AI風險,獲“深度學習之父”支持
近日,來(lai)自OpenAI和(he)Google DeepMind的數名現任和(he)前任員工發(fa)表了一(yi)封公(gong)開信(xin),警告人工智能發(fa)展可能帶來(lai)的風險,包(bao)括社(she)會不平等(deng)加劇(ju)、錯誤信(xin)息傳播(bo)和(he)自主AI系(xi)統(tong)失控等(deng)。公(gong)開信(xin)強調,盡管全球政府(fu)和(he)AI專家已意識到(dao)這些風險,但(dan)追求(qiu)財務利益的AI公(gong)司(si)往往抵(di)制(zhi)有(you)效(xiao)監督,現有(you)企業治理結(jie)構不足(zu)以應(ying)對(dui)挑(tiao)戰。信(xin)中呼(hu)吁AI企業遵循(xun)不簽訂禁(jin)止負面評(ping)價的協議、建(jian)立匿(ni)名反饋機(ji)制(zhi)等(deng)原(yuan)則。這封公(gong)開信(xin)得(de)到(dao)了“AI教父”Geoffrey Hinton、圖靈獎得(de)主Yoshua Bengio以及AI安全領域(yu)頂級(ji)學(xue)者Stuart Russell的支持(chi)。
(一)英偉達發布Blackwell GPU,推進AI帝國建設并解決全球耗電難題
6月3日凌晨,英(ying)偉(wei)(wei)達CEO黃(huang)(huang)仁(ren)勛(老黃(huang)(huang))宣布了(le)一系列技術創新和產品(pin)迭代,包括(kuo)已經量(liang)產的(de)Blackwell GPU,這款迄(qi)今為止最大的(de)芯(xin)片(pian)將(jiang)在未(wei)來8年內將(jiang)1.8萬億參數GPT-4的(de)訓練能(neng)(neng)耗降低(di)至原來的(de)1/350。Blackwell GPU的(de)推出,連同其后三代的(de)路線圖(tu),標志著英(ying)偉(wei)(wei)達在AI領(ling)域的(de)雄心和實力(li)。黃(huang)(huang)仁(ren)勛還展(zhan)示(shi)了(le)英(ying)偉(wei)(wei)達在加速(su)計算、AI工廠、數字人、智能(neng)(neng)體(ti)等領(ling)域的(de)進展(zhan),并(bing)預告了(le)下一代芯(xin)片(pian)Rubin。此外(wai),英(ying)偉(wei)(wei)達還發(fa)布了(le)數字孿生地(di)球「Earth-2」項(xiang)目,旨(zhi)在通過(guo)高解(jie)析度的(de)模擬(ni)預測(ce)全(quan)球氣(qi)候變化,推動物理AI和具(ju)身AI的(de)發(fa)展(zhan),為未(wei)來的(de)AI機器人時代鋪路。
(二)國產AI視頻生成模型「可靈」開放測試,展現高真實度和物理規律模擬能力
近(jin)日,快手推出(chu)了(le)名為「可(ke)靈」的(de)國產AI視(shi)頻生成(cheng)大模(mo)(mo)型(xing),該(gai)模(mo)(mo)型(xing)基于Sora技術路線并結合(he)自研(yan)創新,能夠生成(cheng)長達2分鐘、1080p分辨率的(de)超長視(shi)頻。可(ke)靈不僅在運動(dong)模(mo)(mo)擬上表現出(chu)色,還能準確刻畫復雜運動(dong)并符合(he)物理規(gui)律(lv),如重力和光學反(fan)射。此(ci)外,它還支持(chi)自由寬高(gao)比,與(yu)快手的(de)短視(shi)頻生態高(gao)度(du)匹配。目前,可(ke)靈已在快影APP中開放測試,標(biao)志著快手在短視(shi)頻領域的(de)AI應用邁出(chu)了(le)重要一步。
(三)Meta AI模型NLLB200在Nature發表,翻譯質量提升44%
6月6日(ri),Meta公司(si)在(zai)《自(zi)然(ran)》雜志上發表了(le)關于(yu)其最新(xin)AI模型No Language Left Behind (NLLB)的(de)研究文章,該模型能夠支持200種語言(yan)之間(jian)的(de)高質(zhi)(zhi)量(liang)翻(fan)譯,特別強調了(le)對低資源(yuan)語言(yan)的(de)翻(fan)譯能力。NLLB-200模型通(tong)過采用稀疏門控專(zhuan)家混(hun)合架(jia)構,實現了(le)高效的(de)參數(shu)利用和計算資源(yuan)分配,顯著提(ti)升了(le)翻(fan)譯質(zhi)(zhi)量(liang),平均翻(fan)譯質(zhi)(zhi)量(liang)提(ti)升了(le)44%。此外(wai),NLLB項目還包括了(le)數(shu)據挖掘(jue)與預(yu)處(chu)理的(de)創(chuang)新(xin)方(fang)法,多語言(yan)訓練策略(lve),以及綜合評估工具(ju)的(de)開發,確(que)保(bao)翻(fan)譯結果的(de)安(an)全性和可靠性。
(四)Stable Diffusion 3 Medium模型將于6月12日開源,優化多方面性能
6月3日(ri)晚,Stability AI的(de)聯(lian)合首席執行(xing)官(guan)Christian Laforte在AMD產品(pin)發布會上(shang)宣布,備受(shou)期待的(de)文(wen)(wen)(wen)本(ben)(ben)到圖(tu)(tu)像生成模(mo)型(xing)Stable Diffusion 3的(de)Medium版本(ben)(ben),具有20億(yi)參(can)數(shu),將(jiang)在6月12日(ri)通過Hugging Face平(ping)臺開源(yuan)。該(gai)模(mo)型(xing)在照片真(zhen)實(shi)感、樣式、圖(tu)(tu)片質量以及(ji)資(zi)源(yuan)消耗等方面進(jin)行(xing)了(le)(le)顯(xian)著優化(hua)(hua),提供了(le)(le)與閉(bi)源(yuan)產品(pin)Midjourney、DALL·E 3相媲美的(de)性能(neng)。盡管之前Stability AI經歷了(le)(le)管理層變動和財務危機,但(dan)公(gong)司不僅(jin)穩定了(le)(le)局面,還可能(neng)獲得了(le)(le)AMD的(de)贊助。Stable Diffusion 3采用(yong)了(le)(le)Diffusion Transformer架構,有效提升了(le)(le)文(wen)(wen)(wen)本(ben)(ben)語義理解、文(wen)(wen)(wen)字嵌入和圖(tu)(tu)像樣式的(de)表現,目(mu)前該(gai)模(mo)型(xing)限(xian)于學術研究使用(yong),商業化(hua)(hua)使用(yong)需聯(lian)系(xi)Stability AI。
(五)昆侖萬維開源2000億參數稀疏大模型Skywork-MoE,支持單GPU推理
6月3日(ri),昆侖萬維公司(si)宣布開(kai)源(yuan)(yuan)其2000億(yi)參數的稀疏大(da)模型Skywork-MoE,該模型在保(bao)持高性(xing)能的同(tong)時(shi)大(da)幅(fu)降低了推(tui)(tui)理(li)(li)成本。Skywork-MoE是(shi)(shi)(shi)基于(yu)之前開(kai)源(yuan)(yuan)的Skywork-13B模型擴展而來,是(shi)(shi)(shi)首個完(wan)整(zheng)應用MoE Upcycling技(ji)術并(bing)落地的千(qian)億(yi)級(ji)MoE大(da)模型,也是(shi)(shi)(shi)首個支持使(shi)用單(dan)個4090 GPU進行(xing)推(tui)(tui)理(li)(li)的開(kai)源(yuan)(yuan)模型。模型權重、技(ji)術報告完(wan)全(quan)開(kai)源(yuan)(yuan),免費商用,無需申(shen)請。Skywork-MoE在8x4090服務器上通過(guo)FP8量(liang)化和(he)非(fei)均勻Tensor Parallel并(bing)行(xing)推(tui)(tui)理(li)(li)方式,能夠(gou)達(da)到(dao)2200 tokens/s的吞吐量(liang)。該模型還引(yin)入了Gating Logits歸一(yi)化操作和(he)自適應的Aux Loss訓練(lian)(lian)優(you)化算法,提升了模型性(xing)能和(he)泛化水(shui)平。此外,Skywork-MoE展示了在不同(tong)訓練(lian)(lian)階(jie)段如(ru)何通過(guo)調整(zheng)auxiliary loss系(xi)數來控制(zhi)Drop Token Rate,以及如(ru)何通過(guo)Expert Data Parallel和(he)非(fei)均勻切分流水(shui)并(bing)行(xing)技(ji)術提高大(da)規模分布式訓練(lian)(lian)的效率。
(六)智譜AI發布開源GLM-4系列大模型,引領MaaS平臺升級與行業生態發展
6月5日(ri),智譜(pu)(pu)AI在(zai)(zai)(zai)其開(kai)(kai)放日(ri)上宣布了GLM-4系列(lie)大模(mo)型的(de)最新開(kai)(kai)源(yuan)版本(ben),包(bao)括性能超(chao)越Llama 3 8B的(de)GLM-4-9B和(he)多(duo)模(mo)態能力比肩GPT-4V的(de)GLM-4V-9B,同時大幅降(jiang)低(di)了大模(mo)型服務的(de)成本(ben),以6分錢(qian)/100萬Token的(de)價格提(ti)供服務。智譜(pu)(pu)AI的(de)MaaS(Model as a Service)平臺(tai)升(sheng)級至2.0版本(ben),提(ti)供更(geng)高效的(de)模(mo)型微調平臺(tai)和(he)簡(jian)化的(de)私有模(mo)型部署流程。公司CEO張鵬(peng)強調了通過技術創新實現(xian)應用成本(ben)降(jiang)低(di)和(he)客戶價值提(ti)升(sheng)的(de)商業(ye)策略,并(bing)展示了智譜(pu)(pu)AI在(zai)(zai)(zai)大模(mo)型技術、生態建設和(he)AI安全標準(zhun)制定方面的(de)領導(dao)地位(wei)。此外,智譜(pu)(pu)AI的(de)開(kai)(kai)源(yuan)模(mo)型累計下載(zai)量達到1600萬次,顯示了其在(zai)(zai)(zai)AI技術領域(yu)的(de)廣泛影響力。
(一)英偉達Jim Fan認為具身智能的關鍵在于開發「Foundation Agent」
近日,英偉(wei)達(da)高級(ji)研(yan)究科學(xue)家Jim Fan在(zai)(zai)GenAI峰會上探討(tao)了(le)(le)具身智能的(de)(de)挑戰(zhan)與發展,認為(wei)難點不在(zai)(zai)于硬件,而(er)在(zai)(zai)于開發「Foundation Agent」——一種能夠實(shi)現(xian)具身性、現(xian)實(shi)交互和技(ji)(ji)能掌握的(de)(de)通用算法。他分享(xiang)了(le)(le)英偉(wei)達(da)在(zai)(zai)Minecraft AI研(yan)究、Metamorph多形態(tai)機器(qi)人控制(zhi)、Eureka自動獎(jiang)勵函數設(she)計等方面(mian)的(de)(de)最新進展,并(bing)強調了(le)(le)域(yu)隨機化技(ji)(ji)術在(zai)(zai)將(jiang)(jiang)模擬環境訓練的(de)(de)模型泛化到(dao)現(xian)實(shi)世界中的(de)(de)應(ying)用。Jim Fan預測,隨著(zhu)技(ji)(ji)術進步,仿(fang)人機器(qi)人的(de)(de)成本(ben)將(jiang)(jiang)大幅下降,而(er)人工智能的(de)(de)發展將(jiang)(jiang)是推動具身智能發展的(de)(de)關鍵因素。
(二)報告:生成式AI應用激增,亞太成增長最快區域
近日,全球咨(zi)詢公司麥肯(ken)錫發(fa)布(bu)的最新調查報(bao)告(gao)指出,生成式(shi)AI技術(shu)(shu)如ChatGPT和(he)Copilot等(deng)的應用(yong)(yong)在2024年(nian)顯著增(zeng)長,65%的受(shou)訪管理(li)者(zhe)已經在業務(wu)中(zhong)使用(yong)(yong)該技術(shu)(shu),相比(bi)2023年(nian)的33%幾乎(hu)增(zeng)長了兩倍。報(bao)告(gao)特別(bie)強調,亞太地(di)區是應用(yong)(yong)生成式(shi)AI增(zeng)長最快的區域(yu),這主(zhu)要得益(yi)于技術(shu)(shu)環境(jing)和(he)原生數字(zi)人口(kou)的優勢。應用(yong)(yong)場景主(zhu)要集中(zhong)在營(ying)銷(xiao)銷(xiao)售、產品服(fu)務(wu)開發(fa)以及IT領域(yu)。企業采用(yong)(yong)生成式(shi)AI的方(fang)式(shi)多樣,包括使用(yong)(yong)現(xian)成產品、合(he)作微(wei)調模型和(he)自(zi)主(zhu)開發(fa)。麥肯(ken)錫認為,2024年(nian)是生成式(shi)AI實現(xian)場景化(hua)落(luo)地(di)并產生商業價值的一年(nian)。
來源(yuan):每經科(ke)技提供
如需轉載請與《每日經濟新聞》報社聯系。
未(wei)經(jing)《每日經(jing)濟新(xin)聞》報社授權,嚴禁轉載或(huo)鏡像,違者必究。
讀者熱線:4008890008
特別(bie)提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿(gao)酬。如(ru)您不希望作品出(chu)現在(zai)本站,可聯系(xi)我們(men)要求撤下您的作品。
歡迎關注每日經濟新聞APP