男欢女爱销魂蚀骨免费阅读,性欧美丰满熟妇XXXX性久久久,适合单身男人看的影片,www天堂无人区在线观看,悟空影视免费高清

每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文(wen)

DeepSeek“卡爆了”如何解決?多家國產算力廠商已適配,主要面向推理

每日經濟新(xin)聞 2025-02-05 22:16:46

龐大的訪問量令DeepSeek用戶(hu)在使(shi)用其(qi)“深度(du)思考(kao)”和“聯網搜索”時常遭遇“服務器繁忙”。不(bu)過好(hao)消息是,目(mu)前已(yi)有多家(jia)國產AI算力廠商宣(xuan)布適配DeepSeek,比如華為昇騰、壁仞科技、天(tian)數(shu)智芯、摩爾線程(cheng)、沐曦等。

每(mei)經(jing)記者|朱(zhu)成祥    每(mei)經(jing)編輯|楊夏(xia)    

近期,資本市場最(zui)熱的話題當(dang)屬DeepSeek(深度(du)求索)。從(cong)美國硅谷到中國街頭巷尾(wei),人們(men)紛紛討(tao)論著DeepSeek對(dui)AI大模(mo)型(xing)行業帶來的巨大影響。

DeepSeek話題的火(huo)熱,也帶動其官方(fang)網頁和App訪問量(liang)的上升。新用戶的大量(liang)涌入令(ling)DeepSeek用戶在使用其“深度思考(kao)”和“聯網搜索”功能時常(chang)常(chang)遭遇“服(fu)務(wu)器繁忙”。不(bu)過(guo)好(hao)消息是,目(mu)前已有多家國(guo)產(chan)AI(人工智能)算(suan)力廠商宣布適配DeepSeek,比如(ru)華為昇騰、壁仞科技、天數智芯、摩爾(er)線程、沐(mu)曦(xi)等。在不(bu)久(jiu)的將來,流暢地使用DeepSeek的各種功能或許并不(bu)是一件難(nan)事(shi)。

壁仞科技工作(zuo)人員對《每日經濟新聞》記者表示:“DeepSeek有(you)結構上(shang)的微創新,但是(shi)還是(shi)LLM(大(da)語言模型),所以推理適配起(qi)來并不難。”

DeepSeek火熱帶來龐大推理算力需求

根據(ju)中信建(jian)投研報,DeepSeek的網頁端訪問量,從(cong)2024年(nian)10月(yue)至2024年(nian)12月(yue),分別為(wei)245萬(wan)、422萬(wan)和1101萬(wan)。DeepSeek于2025年(nian)1月(yue)10日上(shang)線官方App,自該App發布以(yi)來,第(di)18天已達到1500萬(wan)日活。

2月4日,天(tian)數智芯官方微信號披露,在AI技術(shu)蓬勃發展(zhan)的(de)當下,芯片技術(shu)成(cheng)為關(guan)鍵(jian)。DeepSeek R1的(de)橫空出世宛如一道閃電,強勢沖破長期以來的(de)技術(shu)壁壘,為中(zhong)國(guo)AI行業注入(ru)全新活力。今(jin)日(2月4日),天(tian)數智芯與Gitee AI聯(lian)合發布消息(xi),在雙方的(de)高效協作(zuo)(zuo)下,僅用時一天(tian),便成(cheng)功完成(cheng)了與DeepSeek R1的(de)適配工(gong)作(zuo)(zuo),并且已正式上線(xian)多款大模型服務(wu),其中(zhong)包括DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B等。

天數(shu)智芯副(fu)總裁宋煜2月5日(ri)對《每日(ri)經濟(ji)新聞(wen)》記者表示:“天數(shu)智芯的產品是通(tong)用GPU,在(zai)(zai)芯片(pian)設計(ji)的技術路線上和國際主流(liu)(liu)路線相(xiang)近(jin),在(zai)(zai)軟(ruan)件(jian)生態層面(mian),天數(shu)的IXUCA軟(ruan)件(jian)棧兼容國際主流(liu)(liu)生態,所以適配DeepSeek的V2、V3、R1、Janus等模(mo)型版本非常(chang)順利。”

據其介紹:“目(mu)前天數已經(jing)完(wan)成(cheng)了V3、R1、Janus等(deng)模型(xing)的(de)推理(li)適配工作,在公開數據的(de)精度測試上也和論文相當。適配成(cheng)功后,天數也和Gitee AI、并行計算、算力互(hu)聯等(deng)合作伙伴一起上線了多款大(da)模型(xing)服(fu)務(wu)。”

無獨有(you)偶,華(hua)(hua)為(wei)計(ji)算(suan)于(yu)2月4日(ri)表示,潞晨科技攜手昇(sheng)(sheng)騰(teng)(teng),聯合發布基于(yu)昇(sheng)(sheng)騰(teng)(teng)算(suan)力的(de)(de)DeepSeek R1系列推(tui)理(li)API及云鏡像服務(wu)。2月5日(ri),華(hua)(hua)為(wei)官方微信號披露,2025年2月4日(ri),DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上(shang)線昇(sheng)(sheng)騰(teng)(teng)社區,支持一鍵獲(huo)取(qu)DeepSeek系列模(mo)型,支持昇(sheng)(sheng)騰(teng)(teng)硬(ying)件平臺(tai)上(shang)開箱即用,推(tui)理(li)快(kuai)速部署,帶來更(geng)快(kuai)、更(geng)高效、更(geng)便(bian)捷的(de)(de)AI開發和應用體(ti)驗。

摩(mo)爾(er)(er)線(xian)程(cheng)也于(yu)2月4日表(biao)示,作為國產(chan)全功能GPU創新企業,摩(mo)爾(er)(er)線(xian)程(cheng)快速實現對DeepSeek蒸(zheng)餾模型推理服(fu)務的高效部署,旨在(zai)賦能更多開(kai)發(fa)者基于(yu)摩(mo)爾(er)(er)線(xian)程(cheng)全功能GPU(圖形處理器)進(jin)行AI應用創新。

各家算力主要面向推理

可以(yi)看出,無論華為昇(sheng)騰、天數智芯還(huan)是摩(mo)爾(er)線(xian)程,均針對DeepSeek推理服(fu)務進行適配。

隨著DeepSeek帶(dai)來(lai)大模型(xing)訪(fang)問(wen)量的(de)(de)(de)暴增,推(tui)理(li)芯片或將爆發(fa)(fa)。浙商證券認為,DeepSeek訓練和推(tui)理(li)成本大幅降(jiang)低將帶(dai)來(lai)大模型(xing)和用戶側準入門檻的(de)(de)(de)同(tong)步降(jiang)低,不僅(jin)帶(dai)來(lai)同(tong)等預算下(xia)模型(xing)側的(de)(de)(de)迭代加(jia)速,“低成本+高(gao)性能(neng)”的(de)(de)(de)模型(xing)也會加(jia)速推(tui)動企業和個人用戶對AI Agent(人工智能(neng)智能(neng)體)、AI應用等的(de)(de)(de)使(shi)用,從(cong)而推(tui)動AI商業化(hua)落(luo)地(di)進程的(de)(de)(de)顯(xian)著提(ti)速,在此背景下(xia),推(tui)理(li)環節(jie)的(de)(de)(de)算力需求將得到激發(fa)(fa)。

而算力(li)廠(chang)商壁(bi)(bi)仞(ren)科技、云(yun)服務廠(chang)商優刻得也強調推理效率(lv)的(de)重要性。壁(bi)(bi)仞(ren)科技認為,推理效率(lv)已(yi)成為目前行業各公(gong)司發展的(de)核(he)心(xin)競爭力(li)。憑(ping)借壁(bi)(bi)仞(ren)科技自主研發的(de)壁(bi)(bi)礪TM系列(lie)(lie)產品出(chu)色的(de)兼容(rong)性能,僅(jin)用數小(xiao)時即(ji)完成對DeepSeek-R1全系列(lie)(lie)蒸(zheng)餾(liu)模(mo)(mo)型的(de)支(zhi)持,涵蓋了從1.5B到70B各等級參(can)數版本,包括LLaMA蒸(zheng)餾(liu)模(mo)(mo)型和千(qian)問蒸(zheng)餾(liu)模(mo)(mo)型。為開(kai)發者提(ti)供高性能、低成本的(de)大模(mo)(mo)型部署與開(kai)發解(jie)決方案。

關于國(guo)(guo)產(chan)(chan)算(suan)(suan)力芯片(pian)適配(pei)DeepSeek的重要性,天(tian)數智芯副總裁宋煜表示:“目前,大(da)模型生態(tai)上(shang),訓練(lian)(lian)部分(fen)主要依(yi)賴(lai)CUDA+NVIDIA GPU,國(guo)(guo)產(chan)(chan)GPU的適配(pei)仍需突破。與DeepSeek合作,能加速國(guo)(guo)產(chan)(chan)GPU芯片(pian)的深度學習框架優化(hua)、算(suan)(suan)子優化(hua)、分(fen)布式訓練(lian)(lian)適配(pei),降低(di)國(guo)(guo)產(chan)(chan)AI企業(ye)的遷移成本(ben),打造‘國(guo)(guo)產(chan)(chan)算(suan)(suan)力+國(guo)(guo)產(chan)(chan)大(da)模型’的閉環生態(tai)。”

宋煜認為:“DeepSeek等(deng)國產大模(mo)型廠(chang)商的(de)(de)(de)(de)成功,離不開(kai)強大的(de)(de)(de)(de)算力(li)支(zhi)持(chi)。我們(men)的(de)(de)(de)(de)目(mu)標是提供(gong)穩(wen)定、可(ke)擴展(zhan)、性價比(bi)高(gao)的(de)(de)(de)(de)GPU解決方案(an),推(tui)動國產大模(mo)型更快迭代(dai)、更高(gao)效部署(shu)。未來,我們(men)可(ke)以進(jin)一步(bu)深化(hua)合作,包括(kuo)聯合優化(hua)AI訓練框架、開(kai)發(fa)定制化(hua)AI加速方案(an),更高(gao)效的(de)(de)(de)(de)分布(bu)式推(tui)理引擎等(deng)。”

封(feng)面(mian)圖片來源(yuan):視覺中國-VCG21a06e33023

如需轉載請與《每日經濟新聞》報社聯系。
未(wei)經《每日經濟(ji)新聞》報(bao)社(she)授權(quan),嚴禁轉載或鏡(jing)像,違者必究(jiu)。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品(pin)(pin)出(chu)現在本站(zhan),可聯系我們要求撤下(xia)您的(de)作品(pin)(pin)。

DeepSeek 模型(xing) 算力(li) GPU 摩爾線程

歡迎(ying)關注每日經濟新(xin)聞APP

每經經濟新聞官方APP

0

0