每日經濟新聞 2025-01-28 09:24:13
DeepSeek發布(bu)了開(kai)源多模態AI模型Janus-Pro,在部(bu)分文生圖基準(zhun)測試(shi)中表現(xian)好(hao)于OpenAI的競品(pin)。此外,DeepSeek線(xian)上服務近期遭大規(gui)模惡意(yi)攻擊,已注冊用戶可正常登錄(lu)。1月28日,美(mei)股三大指數漲跌不一,芯片股全(quan)線(xian)暴跌。英偉達(da)重挫,市值蒸發約4.27萬(wan)億(yi)元人民幣。消息(xi)面上,DeepSeek推出(chu)新(xin)模型,性能與OpenAI o1相當(dang),但成本極(ji)低,引發市場對(dui)科技AI巨頭(tou)估值的擔憂。
每經編輯|張錦河
近日,國(guo)產(chan)大模型DeepSeek引發廣泛關(guan)注。
據人工智能社區Hugging Face1月28日信息顯示,DeepSeek發布了開源多模態人工智能(AI)模型Janus-Pro。其中Janus-Pro-7B在GenEval和DPG-Bench基準測試中擊敗了OpenAI的DALL-E 3和Stable Diffusion。
此外,昨晚至今日凌晨,DeepSeek 通過官方服務狀態發布聲明稱:近期 DeepSeek 線上服務受到大規模惡意攻擊,注冊可能繁忙,請稍等重試。已注冊用戶可以正常登錄,感謝理解和支持。
DeepSeek的展示圖顯示,在文生圖GenEval和DPG-Bench基準測試中,Janus-Pro-7B的準確率較前代Janus大幅提高,準確率測試結果分別為80%和84.2%,高于包括OpenAI DALL-E 3在內的其他對比模型,Janus的準確率分別為61%和79.7%。
從報告給出的(de)“跑分”數據(ju)來看,在部分文生圖基準測試中,Janus-Pro 70億參數模型表現好于OpenAI的DALL-E 3、Stability AI的Stable Diffusion 3-Meduim等。
據DeepSeek介紹,Janus-Pro是一個(ge)新穎(ying)的(de)(de)自(zi)回歸框(kuang)架(jia),統(tong)一了(le)多模態理(li)解(jie)和(he)生成。通過將視覺(jue)編碼(ma)分(fen)(fen)離為“理(li)解(jie)”和(he)“生成”兩條路徑,同時仍采用單(dan)一的(de)(de)Transformer架(jia)構進行處(chu)理(li),解(jie)決了(le)以往方法的(de)(de)局限(xian)性(xing)。這種分(fen)(fen)離不僅緩解(jie)了(le)視覺(jue)編碼(ma)器在理(li)解(jie)和(he)生成中的(de)(de)角色(se)沖(chong)突(tu),還提(ti)升了(le)框(kuang)架(jia)的(de)(de)靈活(huo)性(xing)。
Janus-Pro是一款統一理解(jie)與生成的多模態大語(yu)言模型(MLLM),通過對多模態理解(jie)與生成的視覺編碼進(jin)行解(jie)耦來(lai)實(shi)現(xian)功能。Janus-Pro構建于(yu) DeepSeek-LLM-1.5b-base和DeepSeek-LLM-7b-base的基礎之上。
在多模態(tai)理解(jie)方(fang)面(mian)(mian),它使用(yong)SigLIP-L作為(wei)視覺編碼器,支(zhi)持384x384的圖像輸入(ru)。在圖像生成方(fang)面(mian)(mian),Janus-Pro使用(yong)了來源于(yu)此的分詞器(tokenizer),其(qi)下采(cai)樣率為(wei)16。
北京時(shi)間1月28日,美股三大指(zhi)(zhi)數收盤漲跌不一,道指(zhi)(zhi)漲0.65%,標普(pu)500指(zhi)(zhi)數跌1.46%,納指(zhi)(zhi)重(zhong)挫超600點,跌幅3.07%。
大型科技股漲跌不一,英偉達下跌16.86%,創歷史上最大單日個股蒸發規模,市值蒸發5888.62億美元(約合人民幣4.27萬億元);谷歌下跌4.03%;特斯拉下跌2.32%;微軟下跌2,14%;亞馬遜上漲0.30%;Meta上漲1.91%;蘋果上漲3.25%,截至收盤市值為3.5萬億美元,再度成為全球市值最高上市公司。
美股半導體(ti)芯(xin)片板塊全線暴跌(die)(die),博通跌(die)(die)超(chao)(chao)(chao)17%,臺積電(dian)跌(die)(die)超(chao)(chao)(chao)13%,美國科技跌(die)(die)超(chao)(chao)(chao)11%,Arm Holdings跌(die)(die)超(chao)(chao)(chao)10%,AMD跌(die)(die)超(chao)(chao)(chao)6%,阿斯麥跌(die)(die)超(chao)(chao)(chao)5%。
消(xiao)息(xi)面上,近期(qi)火遍全(quan)球(qiu)的(de)DeepSeek推(tui)出(chu)新模型(xing),該模型(xing)以極低的(de)成本(ben)實現了與OpenAI o1相當的(de)性能,引發市場對科技AI巨頭估值的擔憂。簡而(er)言之(zhi),DeepSeek新模(mo)(mo)型性(xing)能與OpenAI o1旗鼓相當,但成(cheng)本(ben)(ben)連后(hou)者(zhe)的零頭都不到(dao)。有分析(xi)人士認為,DeepSeek在有限的硬件資源下實現頂尖的模(mo)(mo)型性(xing)能,減少了對高端GPU的依(yi)賴,低廉的訓練成(cheng)本(ben)(ben)預示著AI大模(mo)(mo)型對算力投(tou)入的需求(qiu)將大幅下降。正因為此,美(mei)股(gu)芯片股(gu)首當其沖。1月27日(ri),DeepSeek在蘋果App Store美(mei)國(guo)區免費應用下載榜上超越ChatGPT,排(pai)名第一,在中國(guo)區排(pai)行榜上同(tong)樣登頂。
每日經(jing)濟新聞綜合(he)自界面新聞、公開信息
免責聲明:本文(wen)內容與數據僅(jin)供參考(kao),不構成投資建議,使(shi)用前請(qing)核實(shi)。據此操作,風險自(zi)擔。
如需轉載請與《每日經濟新聞》報社聯系。
未(wei)經《每(mei)日(ri)經濟新聞》報社授權,嚴禁轉載或鏡(jing)像,違者(zhe)必究。
讀(du)者熱線:4008890008
特(te)別提醒:如果我們使用了您的圖片,請作者與本站聯系索(suo)取稿酬。如您不(bu)希望(wang)作(zuo)品出現在本站,可聯系我們要(yao)求撤下您的(de)作(zuo)品。
歡迎關注每日經濟新聞(wen)APP