每日經濟新(xin)聞 2025-02-21 21:21:32
每經編輯|胡玲
在(zai)當今全球(qiu)追求高質量(liang)發展(zhan)(zhan)的(de)(de)(de)背景下(xia),雙(shuang)軌(gui)轉型(Twin Transition)——即將可持續發展(zhan)(zhan)與數智化轉型有機(ji)融合,追求經(jing)濟(ji)、社會和(he)(he)環(huan)境多(duo)元價值(zhi)的(de)(de)(de)實(shi)現(xian)——已成為核(he)心(xin)議題之一。這不僅(jin)僅(jin)是(shi)尋求兩者之間的(de)(de)(de)簡單協(xie)同(tong)效應,而是(shi)一場深層次(ci)的(de)(de)(de)系(xi)統(tong)性變革,通過(guo)數字技術的(de)(de)(de)力量(liang)重新定義經(jing)濟(ji)運作模式(shi)、社會互動(dong)方式(shi)以及(ji)環(huan)境保(bao)(bao)護機(ji)制(zhi)。面(mian)對資源(yuan)約束和(he)(he)環(huan)境挑戰日益(yi)嚴(yan)峻的(de)(de)(de)現(xian)實(shi),如何利用先進數智技術推(tui)動(dong)綠色低碳發展(zhan)(zhan),同(tong)時確保(bao)(bao)經(jing)濟(ji)效益(yi)和(he)(he)社會福祉的(de)(de)(de)最大化,是(shi)擺在(zai)所有利益(yi)相關者面(mian)前的(de)(de)(de)重大課題。
人(ren)工(gong)(gong)智能(neng)(neng)初創公(gong)司(si)深(shen)度求索(DeepSeek)近(jin)期發(fa)布了(le)(le)其(qi)最新(xin)人(ren)工(gong)(gong)智能(neng)(neng)模型(xing)(xing)R1,再次引(yin)發(fa)了(le)(le)關于(yu)人(ren)工(gong)(gong)智能(neng)(neng)發(fa)展與算力(li)(li)、能(neng)(neng)源(yuan)之間關系的(de)深(shen)刻討論。R1模型(xing)(xing)憑借其(qi)卓越(yue)的(de)邏輯(ji)推理能(neng)(neng)力(li)(li),不僅在性能(neng)(neng)上逼近(jin)甚(shen)至超越(yue)了(le)(le)OpenAI的(de)o1系列(lie)產(chan)品,而且在成(cheng)本(ben)效(xiao)益方面展現了(le)(le)顯著的(de)優勢。這(zhe)一(yi)里程(cheng)碑式的(de)進展被硅谷科技媒體(ti)譽為(wei)新(xin)時代的(de)“斯普特尼(ni)克時刻”,象征著一(yi)個可能(neng)(neng)顛(dian)覆現有科技格局的(de)新(xin)時代的(de)開端。DeepSeek的(de)R1模型(xing)(xing)訓(xun)練成(cheng)本(ben)僅為(wei)數百(bai)萬(wan)美(mei)元(yuan),遠低于(yu)OpenAI的(de)GPT和谷歌的(de)Gemini系列(lie)大模型(xing)(xing)所(suo)需的(de)數十億美(mei)元(yuan)投資,這(zhe)無疑給(gei)數據中心運營商們提供了(le)(le)一(yi)個極具吸(xi)引(yin)力(li)(li)的(de)“滑門時刻”——即通過更高效(xiao)的(de)計算資源(yuan)利用(yong)來大幅削減運營成(cheng)本(ben)。
Deepseek也(ye)引(yin)起了對(dui)(dui)美(mei)國科技股(gu)(gu)和能(neng)(neng)源(yuan)股(gu)(gu)短期劇烈震(zhen)蕩。英偉達(da)單日跌(die)幅(fu)最高達(da)17%,創美(mei)股(gu)(gu)歷(li)史最大(da)單日市值(zhi)蒸發紀錄(約6000億美(mei)元),博(bo)通、AMD、臺積電等芯片股(gu)(gu)同步重挫(cuo)。納(na)斯達(da)克指數(shu)下(xia)跌(die)3.1%,標普500指數(shu)下(xia)跌(die)1.5%,市場(chang)對(dui)(dui)美(mei)國科技巨(ju)頭(tou)的(de)高估值(zhi)(如美(mei)股(gu)(gu)七(qi)巨(ju)頭(tou)中,英偉達(da)的(de)市盈(ying)率在46倍(bei)左右,蘋(pin)果(guo)的(de)市盈(ying)率在36倍(bei)左右,特斯拉183倍(bei)市盈(ying)率。如今,七(qi)巨(ju)頭(tou)的(de)平均市盈(ying)率接近50倍(bei),市值(zhi)占美(mei)股(gu)(gu)總市值(zhi)28%左右。)產生質疑(yi)。此外,由于R1通過算法優(you)化顯著降低模型能(neng)(neng)耗(內存使用減(jian)少50%以上),市場(chang)擔憂(you)AI對(dui)(dui)電力需求的(de)增長預期被(bei)打破,導致美(mei)國聯合能(neng)(neng)源(yuan)、Vistra等能(neng)(neng)源(yuan)公司股(gu)(gu)價下(xia)跌(die)21%-29%。
盡管DeepSeek在(zai)技術(shu)上(shang)取得了巨大進步(bu),但其在(zai)中國(guo)(guo)境外的未來發展仍面(mian)臨不(bu)確定性,部(bu)分西方機(ji)構(gou)和(he)政府已開始限制(zhi)使用其服務(wu)。然而(er),全球人工智能(neng)領域都(dou)在(zai)密切(qie)關(guan)注DeepSeek如(ru)何以如(ru)此低的成本實現領先性能(neng)。如(ru)果(guo)DeepSeek的方法能(neng)夠(gou)被廣泛復制(zhi),那么對于(yu)東南亞(ya)地(di)區、澳大利亞(ya)、新西蘭等中小型國(guo)(guo)家而(er)言,或許將有機(ji)會以更低的成本進入基礎模(mo)型領域,這在(zai)過(guo)去(qu)是(shi)難以想象的。
對于澳新(xin)地區的(de)(de)(de)(de)(de)數據中心運(yun)營(ying)商(shang)而(er)言,人(ren)(ren)(ren)(ren)(ren)工(gong)智(zhi)(zhi)(zhi)能(neng)(neng)技(ji)術成(cheng)本的(de)(de)(de)(de)(de)潛在降低,無疑緩解了(le)(le)對外(wai)國模(mo)(mo)型(xing)(xing)(xing)安全(quan)性和(he)可靠性風險的(de)(de)(de)(de)(de)擔憂(you)。Macquarie Data Centres的(de)(de)(de)(de)(de)高管David Hirst指出(chu)(chu),人(ren)(ren)(ren)(ren)(ren)工(gong)智(zhi)(zhi)(zhi)能(neng)(neng)行(xing)業(ye)的(de)(de)(de)(de)(de)發展(zhan)速(su)度(du)遠超以往(wang)任何技(ji)術趨(qu)勢,且仍處于早期階段。他認為,人(ren)(ren)(ren)(ren)(ren)工(gong)智(zhi)(zhi)(zhi)能(neng)(neng)正在并(bing)(bing)將繼續(xu)證明,它(ta)是世界上(shang)發展(zhan)最(zui)快的(de)(de)(de)(de)(de)技(ji)術之(zhi)一(yi),而(er)我們才剛剛觸及人(ren)(ren)(ren)(ren)(ren)工(gong)智(zhi)(zhi)(zhi)能(neng)(neng)所能(neng)(neng)實現的(de)(de)(de)(de)(de)冰(bing)山(shan)一(yi)角。人(ren)(ren)(ren)(ren)(ren)工(gong)智(zhi)(zhi)(zhi)能(neng)(neng)將從(cong)根本上(shang)改變所有(you)行(xing)業(ye)的(de)(de)(de)(de)(de)運(yun)作(zuo)方式以及人(ren)(ren)(ren)(ren)(ren)類的(de)(de)(de)(de)(de)潛力。以Deepseek為例(li),從(cong)2024年1月5日(ri),DeepSeek發布(bu)(bu)了(le)(le)首(shou)個大模(mo)(mo)型(xing)(xing)(xing)DeepSeek LLM到2024年12月26日(ri),正式上(shang)線DeepSeek-V3模(mo)(mo)型(xing)(xing)(xing),并(bing)(bing)同(tong)步開(kai)源,標(biao)準著全(quan)球首(shou)個全(quan)開(kai)源的(de)(de)(de)(de)(de)混(hun)合(he)專家(MoE)模(mo)(mo)型(xing)(xing)(xing)出(chu)(chu)現,再到2025年1月20日(ri)發布(bu)(bu)的(de)(de)(de)(de)(de)DeekSeek-R1推理(li)大模(mo)(mo)型(xing)(xing)(xing)。從(cong)在極短的(de)(de)(de)(de)(de)時間內,人(ren)(ren)(ren)(ren)(ren)工(gong)智(zhi)(zhi)(zhi)能(neng)(neng)已取得顯(xian)著進展(zhan)。大型(xing)(xing)(xing)語(yu)言模(mo)(mo)型(xing)(xing)(xing)的(de)(de)(de)(de)(de)快速(su)發展(zhan),從(cong)模(mo)(mo)型(xing)(xing)(xing)的(de)(de)(de)(de)(de)迭代、算力的(de)(de)(de)(de)(de)更新(xin),到訓練(lian)和(he)推理(li)成(cheng)本的(de)(de)(de)(de)(de)下降,再到智(zhi)(zhi)(zhi)能(neng)(neng)體的(de)(de)(de)(de)(de)產品形態出(chu)(chu)現,人(ren)(ren)(ren)(ren)(ren)工(gong)智(zhi)(zhi)(zhi)能(neng)(neng)正在不斷提高行(xing)業(ye)效率,并(bing)(bing)最(zui)終降低成(cheng)本。DeepSeek模(mo)(mo)型(xing)(xing)(xing)的(de)(de)(de)(de)(de)創新(xin),通過簡(jian)化訓練(lian)過程和(he)更有(you)效地利用(yong)硬件(jian),標(biao)志(zhi)著在降低人(ren)(ren)(ren)(ren)(ren)工(gong)智(zhi)(zhi)(zhi)能(neng)(neng)訓練(lian)和(he)推理(li)門檻方面邁(mai)出(chu)(chu)了(le)(le)重(zhong)要一(yi)步,為更多企業(ye)應(ying)用(yong)這項(xiang)技(ji)術打開(kai)了(le)(le)大門。
DeepSeek R1的技術特點:效率與成本優勢
DeepSeek R1模(mo)型(xing)的出現之(zhi)所以能(neng)引發(fa)行(xing)業震(zhen)動(dong),核心在于(yu)其在效率(lv)和(he)成本控制上的突(tu)破。DeepSeek通(tong)過一系(xi)列技術(shu)創(chuang)新(xin),實(shi)現了(le)在相對較低的算力投入下,獲得可(ke)媲(pi)美甚(shen)至(zhi)超越頭(tou)部(bu)模(mo)型(xing)的性能(neng)表(biao)現。這些技術(shu)特點(dian)主要包(bao)括:
•混合專家模型(Mixture-of-Experts,MoE):MoE架構(gou)是DeepSeek R1降低算力需求(qiu)的(de)關鍵。與傳(chuan)統(tong)的(de)稠密模型不同,MoE模型包(bao)含多個“專(zhuan)家”子網(wang)絡(luo),每個子網(wang)絡(luo)專(zhuan)門處理特定類(lei)型的(de)輸入(ru)。在推(tui)理過(guo)程中(zhong),模型會根據輸入(ru)內容動態選擇激活部(bu)分專(zhuan)家網(wang)絡(luo),而非(fei)所有網(wang)絡(luo),從而大幅減少計(ji)算量,提高推(tui)理效率(lv)(lv)。DeepSeek將MoE技術與模型架構(gou)深度融合,實(shi)現了性能(neng)與效率(lv)(lv)的(de)平(ping)衡。
•多頭潛注意力機制(MLA):該技(ji)術為DeepSeek團隊獨(du)創,針對(dui)傳統Transformer模(mo)型的“多頭注意力機(ji)制”在處理(li)長文本(ben)時容(rong)易“分心”的問(wen)題,MLA通過壓縮(suo)關鍵信息,讓模(mo)型更(geng)聚焦(jiao)核心內容(rong)這種協同優化(hua)方法,能夠最大化(hua)硬件資源的利用(yong)效率,降低(di)整體算力需求。
•PTX匯編語言優化:為了更充分(fen)地挖(wa)掘硬件潛(qian)力,DeepSeek甚至深入到(dao)硬件底層(ceng),采用(yong)PTX匯編(bian)語(yu)言對核心(xin)計(ji)算模(mo)塊進行優化(hua)(hua)。PTX匯編(bian)語(yu)言是一種針對NVIDIAGPU的(de)底層(ceng)編(bian)程語(yu)言,通過(guo)精細的(de)匯編(bian)級(ji)優化(hua)(hua),可以最(zui)大限度地提升代碼執行效率(lv),減少不必要的(de)計(ji)算開銷(xiao)。這種極(ji)致的(de)優化(hua)(hua)精神(shen),體現了DeepSeek在算力效率(lv)上的(de)極(ji)致追求(qiu)。
•蒸餾技術與分布式/邊緣計算架構:DeepSeek推出了(le)(le)(le)(le)一(yi)項卓越(yue)的(de)(de)(de)(de)(de)(de)模型蒸餾技(ji)術(shu),該技(ji)術(shu)實(shi)現(xian)了(le)(le)(le)(le)將高(gao)性能(neng)AI模型的(de)(de)(de)(de)(de)(de)核(he)心推理能(neng)力(li)(li)(li)(li)高(gao)效(xiao)移植至輕量化(hua)版本(ben)中(zhong)的(de)(de)(de)(de)(de)(de)目標。這(zhe)一(yi)突破不(bu)僅結(jie)合了(le)(le)(le)(le)開源(yuan)與輕量化(hua)的(de)(de)(de)(de)(de)(de)雙重(zhong)優(you)勢,進(jin)(jin)一(yi)步降低(di)了(le)(le)(le)(le)人工智(zhi)能(neng)技(ji)術(shu)的(de)(de)(de)(de)(de)(de)應用(yong)門檻,同時也為邊(bian)緣計(ji)算領域帶來(lai)了(le)(le)(le)(le)前所(suo)未(wei)有(you)的(de)(de)(de)(de)(de)(de)發(fa)(fa)展機遇(yu)。企業能(neng)夠依據(ju)自身(shen)行業特(te)點,在本(ben)地進(jin)(jin)行模型訓練(lian),使得(de)(de)原本(ben)依賴(lai)于高(gao)性能(neng)服務器(qi)和穩定網(wang)絡環境的(de)(de)(de)(de)(de)(de)邊(bian)緣設備(bei)得(de)(de)以煥(huan)發(fa)(fa)新生。此外,DeepSeek積(ji)極探索分布式計(ji)算與邊(bian)緣計(ji)算架構的(de)(de)(de)(de)(de)(de)新路(lu)徑(jing),通(tong)過(guo)將計(ji)算任務分布至更靠近數(shu)(shu)據(ju)源(yuan)的(de)(de)(de)(de)(de)(de)邊(bian)緣節點,從(cong)而大幅減少對中(zhong)央數(shu)(shu)據(ju)中(zhong)心的(de)(de)(de)(de)(de)(de)依賴(lai)。這(zhe)不(bu)僅有(you)效(xiao)緩解了(le)(le)(le)(le)數(shu)(shu)據(ju)傳輸過(guo)程中(zhong)的(de)(de)(de)(de)(de)(de)延遲問(wen)題和帶寬壓(ya)力(li)(li)(li)(li),同時優(you)化(hua)了(le)(le)(le)(le)邊(bian)緣設備(bei)算力(li)(li)(li)(li)資源(yuan)的(de)(de)(de)(de)(de)(de)利(li)用(yong)效(xiao)率,構建了(le)(le)(le)(le)一(yi)個(ge)更加靈活(huo)高(gao)效(xiao)的(de)(de)(de)(de)(de)(de)算力(li)(li)(li)(li)部署方案。
通(tong)過(guo)上(shang)述技(ji)術(shu)組合拳,DeepSeek R1實(shi)現了(le)在保證模型性能的(de)同時,大幅降低訓練和推理(li)的(de)算力需求和成本。這使(shi)得人工智能技(ji)術(shu)的(de)應(ying)用(yong)門(men)檻顯(xian)著降低,為更廣泛的(de)應(ying)用(yong)場景(jing)打開(kai)了(le)大門(men)。
算力生態的重構與資源再分配
DeepSeek R1的(de)出現,不僅可能(neng)引(yin)發算(suan)力(li)需求的(de)增長,還(huan)將深刻地重塑(su)全球算(suan)力(li)生態,并導(dao)致(zhi)算(suan)力(li)資源的(de)重新分配。
首先,分布式革命與集中霸權競爭。傳統人(ren)工智(zhi)能(neng)(neng)發展模(mo)(mo)式(shi)往(wang)往(wang)依(yi)賴(lai)于“規(gui)模(mo)(mo)至上”的(de)(de)(de)邏(luo)輯,追求超大規(gui)模(mo)(mo)模(mo)(mo)型和超大規(gui)模(mo)(mo)算(suan)力集群(qun)。DeepSeek R1的(de)(de)(de)輕量化模(mo)(mo)型和開(kai)源策略(lve),降(jiang)低了人(ren)工智(zhi)能(neng)(neng)應用的(de)(de)(de)門(men)檻,促進了中端算(suan)力設(she)施和分(fen)布式(shi)數據中心(xin)的(de)(de)(de)普(pu)及。此前,美國科(ke)技公司曾計劃建設(she)耗(hao)電量堪比紐(niu)約(yue)市(shi)的(de)(de)(de)巨型數據中心(xin),但在DeepSeek高效模(mo)(mo)型的(de)(de)(de)影響下,此類超大規(gui)模(mo)(mo)基(ji)礎設(she)施的(de)(de)(de)必要性顯著下降(jiang)。算(suan)力生態正(zheng)在從(cong)單一“超大規(gui)模(mo)(mo)中心(xin)壟斷”模(mo)(mo)式(shi)轉向與“分(fen)布式(shi)蜂群(qun)網(wang)絡”競爭的(de)(de)(de)模(mo)(mo)式(shi)。
其次,產業鏈價值重新分配。在算(suan)(suan)(suan)力產業鏈上游,DeepSeek的(de)(de)(de)(de)出現使英偉達等(deng)(deng)GPU巨頭面臨(lin)需(xu)求(qiu)結構調(diao)整(zheng)的(de)(de)(de)(de)挑戰。由于DeepSeek模型對(dui)(dui)算(suan)(suan)(suan)力效(xiao)率的(de)(de)(de)(de)提(ti)升,以及(ji)分布式計算(suan)(suan)(suan)的(de)(de)(de)(de)興起,市場對(dui)(dui)高(gao)性(xing)能(neng)(neng)GPU的(de)(de)(de)(de)需(xu)求(qiu)可能(neng)(neng)不(bu)再是無(wu)止境的(de)(de)(de)(de)擴張,而(er)是更(geng)(geng)加(jia)(jia)注(zhu)重能(neng)(neng)效(xiao)比和定制(zhi)化。與此同時(shi),寒(han)武(wu)紀等(deng)(deng)ASIC芯(xin)片(pian)廠(chang)商(shang)或(huo)將迎(ying)來(lai)發(fa)展機遇。ASIC芯(xin)片(pian)可以針對(dui)(dui)特定的(de)(de)(de)(de)人(ren)工(gong)智能(neng)(neng)應用(yong)進行硬件加(jia)(jia)速(su),在能(neng)(neng)效(xiao)比和成(cheng)本(ben)控制(zhi)上更(geng)(geng)具優(you)勢(shi),更(geng)(geng)符合分布式算(suan)(suan)(suan)力發(fa)展的(de)(de)(de)(de)趨勢(shi)。在中游算(suan)(suan)(suan)力服(fu)務端,區域性(xing)數(shu)據中心(xin)憑借(jie)低時(shi)延和貼近應用(yong)場景的(de)(de)(de)(de)優(you)勢(shi),開始(shi)承(cheng)接制(zhi)造(zao)業智能(neng)(neng)質檢、金融風控等(deng)(deng)對(dui)(dui)延遲敏(min)感(gan)的(de)(de)(de)(de)應用(yong)需(xu)求(qiu),迫使AWS、阿里云(yun)等(deng)(deng)云(yun)計算(suan)(suan)(suan)巨頭調(diao)整(zheng)部分大型數(shu)據中心(xin)的(de)(de)(de)(de)建設投入,轉而(er)加(jia)(jia)強邊緣計算(suan)(suan)(suan)和分布式算(suan)(suan)(suan)力布局。
在(zai)下游(you)應用端,國(guo)(guo)產算力(li)成(cheng)(cheng)本(ben)(ben)的(de)(de)(de)下降,將驅動人(ren)工智(zhi)能在(zai)制造業、金融、醫療(liao)等領域的(de)(de)(de)滲透(tou)率倍增。例如,在(zai)代碼托管平臺GitHub上(shang),已(yi)涌現出大量基于DeepSeek模型的(de)(de)(de)集(ji)成(cheng)(cheng)應用案例(awesome deepseek integration)。同時(shi),中國(guo)(guo)各(ge)地(di)省市紛紛上(shang)線R1模型,加速人(ren)工智(zhi)能的(de)(de)(de)區(qu)域化、本(ben)(ben)地(di)化部(bu)署。越來越形(xing)成(cheng)(cheng)形(xing)成(cheng)(cheng)“需求牽(qian)引(yin)供給”的(de)(de)(de)正向循環,實現“算力(li)+行業”的(de)(de)(de)雙(shuang)(shuang)向賦(fu)能。這種(zhong)趨勢正在(zai)形(xing)成(cheng)(cheng)“需求牽(qian)引(yin)供給”的(de)(de)(de)正向循環,實現“算力(li)+行業”的(de)(de)(de)雙(shuang)(shuang)向賦(fu)能。人(ren)工智(zhi)能技術將加速滲透(tou)到各(ge)行各(ge)業,成(cheng)(cheng)為推動產業升(sheng)級和經濟發展(zhan)的(de)(de)(de)重要引(yin)擎(qing)。
最后,探索低碳AI發展路徑,在效率提升和能源可持續性之間尋求平衡。DeepSeek通過算法架構(gou)優(you)化和硬件(jian)能效(xiao)協同(tong),在單次(ci)(ci)運算能耗(hao)控制方面取得(de)了(le)突(tu)破性(xing)進展。通過MLA與MoE技術融合、強化學習(xi)(RL)的(de)深(shen)度(du)應用、稀疏化訓練等核心技術,DeepSeek大幅壓縮了(le)單次(ci)(ci)計(ji)(ji)算的(de)經濟成(cheng)本和能源消(xiao)耗(hao)。據(ju)(ju)測算,DeepSeek模型(xing)單位計(ji)(ji)算任務的(de)能耗(hao)較傳統稠密模型(xing)下降超過50%,單位計(ji)(ji)算碳排(pai)放強度(du)降至行業平均(jun)水平的(de)1/3。這為推(tui)進綠(lv)色數據(ju)(ju)中心建(jian)設和實現碳中和目標提供(gong)了(le)關(guan)鍵的(de)技術支撐。
更重要(yao)的(de)是,DeepSeek通(tong)過(guo)“低(di)(di)能耗+分布(bu)式”模式,顯著降低(di)(di)了高(gao)性(xing)能AI對傳(chuan)統(tong)能源(yuan)的(de)依賴。分布(bu)式與(yu)邊緣計算(suan)架(jia)構,將計算(suan)任務分散(san)到(dao)靠(kao)近數(shu)據源(yuan)的(de)邊緣設備(bei)處理,有效(xiao)減(jian)少了對集中式數(shu)據中心的(de)電力依賴。同時,DeepSeek的(de)高(gao)性(xing)能模型在實現同等(deng)效(xiao)果時,與(yu)清(qing)潔(jie)能源(yuan)耦合的(de)能效(xiao)顯著優于傳(chuan)統(tong)AI架(jia)構。
分(fen)布式計算(suan)與(yu)邊緣節點的高效(xiao)協(xie)(xie)同,不僅(jin)大幅降低了集中式數(shu)據中心對傳統(tong)能源(yuan)(yuan)的依(yi)賴,也使(shi)AI系統(tong)能夠更(geng)靈活地(di)協(xie)(xie)調(diao)計算(suan)任(ren)務(wu)和(he)清潔(jie)能源(yuan)(yuan)供(gong)給,更(geng)加適配可再生能源(yuan)(yuan)的波動(dong)(dong)性特點。例(li)如,在太陽能充(chong)足(zu)的時(shi)段優先(xian)調(diao)度計算(suan)任(ren)務(wu),并借助優化算(suan)法動(dong)(dong)態匹配能源(yuan)(yuan)供(gong)給波動(dong)(dong),在棄(qi)風棄(qi)光時(shi)段提升消(xiao)納率20%以(yi)上,從而有效(xiao)破解新能源(yuan)(yuan)消(xiao)納難題。
杰文斯悖論:效率提升與需求擴張
然而(er),DeepSeek R1的(de)(de)(de)(de)技術突破,在降低人工(gong)智能(neng)應用門檻的(de)(de)(de)(de)同(tong)時,也可能(neng)引發(fa)“杰(jie)文斯悖論”。杰(jie)文斯悖論由19世(shi)紀經(jing)濟(ji)學家William Stanley Jevons提(ti)(ti)出,他發(fa)現,隨(sui)著煤(mei)炭(tan)使用效率(lv)的(de)(de)(de)(de)提(ti)(ti)高,煤(mei)炭(tan)的(de)(de)(de)(de)消(xiao)耗總(zong)量反而(er)增(zeng)加。這一(yi)悖論揭示了一(yi)個(ge)深刻的(de)(de)(de)(de)經(jing)濟(ji)規律:效率(lv)的(de)(de)(de)(de)提(ti)(ti)升并(bing)不必然導致資源(yuan)消(xiao)耗的(de)(de)(de)(de)減少,反而(er)可能(neng)因為成本(ben)降低和應用范圍(wei)擴大,刺(ci)激需求增(zeng)長(chang),最(zui)終導致資源(yuan)消(xiao)耗總(zong)量增(zeng)加。
微軟(ruan)CEO Satya Nadella引用杰文斯(si)悖(bei)論來解(jie)釋DeepSeek R1可能(neng)帶來的(de)(de)(de)影響,可謂一針見血。他認為(wei),更實惠、更易(yi)于訪(fang)問的(de)(de)(de)人(ren)工(gong)(gong)智能(neng)技(ji)術,將(jiang)通過更快的(de)(de)(de)普及(ji)和(he)更廣泛的(de)(de)(de)應(ying)用,導致(zhi)需(xu)求的(de)(de)(de)激增。隨著人(ren)工(gong)(gong)智能(neng)技(ji)術的(de)(de)(de)門(men)檻降低,過去由于成本限(xian)制而(er)(er)無法應(ying)用人(ren)工(gong)(gong)智能(neng)的(de)(de)(de)領域(yu),例(li)如中小企業、邊緣計算場景等,將(jiang)涌現出大(da)量新的(de)(de)(de)應(ying)用需(xu)求,從而(er)(er)導致(zhi)算力調用密度指數(shu)級上升。
此(ci)外,新(xin)興應用場景的爆發(fa)(fa),也將加速(su)算(suan)力需求(qiu)的裂變。智能駕駛、具身(shen)機器人(ren)等前(qian)沿領域(yu)對(dui)實(shi)時算(suan)力的需求(qiu)極為龐(pang)大,遠超(chao)DeepSeek技(ji)術(shu)優(you)化的速(su)度。即使單(dan)任務效率提(ti)升數(shu)倍,百萬級智能終端的并(bing)發(fa)(fa)需求(qiu),仍(reng)將形成巨大的算(suan)力吞噬黑洞。
更進一步(bu),模(mo)(mo)型(xing)復雜性的提(ti)升(sheng)(sheng),也可(ke)能(neng)(neng)在一定程(cheng)度(du)上(shang)抵(di)消效(xiao)率提(ti)升(sheng)(sheng)帶(dai)來的節能(neng)(neng)效(xiao)果。為了探索通用(yong)人(ren)工智(zhi)能(neng)(neng)(AGI)等前沿方向,模(mo)(mo)型(xing)參數(shu)規模(mo)(mo)不斷向萬億級(ji)躍升(sheng)(sheng),數(shu)據量也以(yi)年均30%的速度(du)增(zeng)長(chang)。即使訓練效(xiao)率提(ti)升(sheng)(sheng)10倍(bei)(bei),模(mo)(mo)型(xing)規模(mo)(mo)擴大(da)100倍(bei)(bei),仍然會導致算(suan)力總需求凈增(zeng)10倍(bei)(bei)。DeepSeek的高效(xiao)算(suan)法或許能(neng)(neng)夠“追趕”數(shu)據增(zeng)長(chang)的速度(du),但難以(yi)從根本上(shang)逆轉算(suan)力需求的增(zeng)長(chang)曲線(xian)。
因此,DeepSeek R1的技術突破(po),雖(sui)然在單位算力(li)能(neng)耗上取(qu)得了顯著降(jiang)低,但(dan)從宏觀層面來看,很可(ke)能(neng)無法有(you)效緩解人工智能(neng)發展對算力(li)和能(neng)源的巨(ju)大需(xu)求(qiu)。相反,技術普惠性引發的應用爆發,以(yi)及模型復雜(za)性的持續提升,可(ke)能(neng)會共同(tong)推(tui)動(dong)算力(li)需(xu)求(qiu)的加(jia)速(su)增長(chang),最終導致電力(li)系統在需(xu)求(qiu)激增的壓力(li)下加(jia)速(su)重構。
算力的盡頭,依然是電力
盡管(guan)DeepSeek R1在(zai)算(suan)(suan)(suan)力(li)效率上取得了(le)突(tu)破,并可能推動(dong)算(suan)(suan)(suan)力(li)生態向(xiang)(xiang)分布(bu)式方向(xiang)(xiang)發展,但(dan)其(qi)技術進步并不能改變人工智能發展對(dui)能源的(de)巨(ju)大需(xu)求。算(suan)(suan)(suan)力(li)的(de)盡頭(tou),依然是電力(li)。
DeepSeek等人(ren)工智(zhi)能(neng)技(ji)術(shu)的突破,將(jiang)(jiang)不可(ke)避免地推高(gao)全球電(dian)(dian)力需(xu)求。“杰文斯悖論”的加速效(xiao)應,可(ke)能(neng)使全球電(dian)(dian)力需(xu)求曲線(xian)更加陡峭。盡管DeepSeek通(tong)過(guo)優化算(suan)法、硬(ying)件適配等技(ji)術(shu),顯著提升(sheng)了(le)人(ren)工智(zhi)能(neng)算(suan)力效(xiao)率,降低了(le)單次任務(wu)的能(neng)耗,打破了(le)人(ren)工智(zhi)能(neng)應用的經濟門檻,但這種技(ji)術(shu)躍遷預計(ji)將(jiang)(jiang)同步觸發(fa)“杰文斯悖論”,能(neng)源消耗總量或將(jiang)(jiang)突破線(xian)性增長模式,形成“效(xiao)率提升(sheng)-應用擴張-能(neng)耗躍升(sheng)”的閉環。
國際(ji)能源署(IEA)的數據(ju)顯示,2022年全(quan)球(qiu)數據(ju)中心(xin)耗電(dian)量已達(da)460TWh,占全(quan)球(qiu)總用電(dian)量的2%。預計(ji)到2026年,全(quan)球(qiu)數據(ju)中心(xin)耗電(dian)量將(jiang)擴張至(zhi)620-1050TWh。這意味著,未來幾年內,數據(ju)中心(xin)的能源消(xiao)耗將(jiang)呈(cheng)現指數級增(zeng)長趨(qu)勢。
面對如此巨(ju)(ju)大的能源需(xu)(xu)求(qiu),全球科(ke)技巨(ju)(ju)頭(tou)們已(yi)經掀起了(le)一場(chang)圍繞電(dian)力(li)資(zi)源的爭奪(duo)戰。美國(guo)微軟與(yu)OpenAI等科(ke)技巨(ju)(ju)頭(tou)聯合發起了(le)“星際之門(men)計劃”,計劃耗資(zi)千億美元,在2030年前建(jian)成全球最大的AI超(chao)算(suan)集群。“星際之門(men)”的目標是建(jian)設5-10個(ge)數據中心園區,每(mei)個(ge)園區設計功率約為100兆瓦,總電(dian)力(li)需(xu)(xu)求(qiu)將達到5GW-10GW級別。這相當于數個(ge)大型城市的用電(dian)量。
“電力(li)缺口可能成為AI時代(dai)的(de)卡脖子(zi)問題”,這(zhe)正在(zai)成為行業共識。科技巨頭對(dui)清潔能源的(de)大(da)規模(mo)投資(zi)和搶(qiang)占(zhan),本(ben)質上是對(dui)新一輪工(gong)業革命核(he)心資(zi)源的(de)爭(zheng)(zheng)奪(duo)。誰掌握了充(chong)足、廉(lian)價、綠色的(de)電力(li)資(zi)源,誰就將在(zai)人工(gong)智能時代(dai)的(de)競爭(zheng)(zheng)中占(zhan)據更有利的(de)位(wei)置。需(xu)要舉具體的(de)案例(li)。
四家擁有大模(mo)型業務的美國科技公司——微軟、亞馬遜、谷歌、Meta仍然堅持“大力出(chu)(chu)奇跡”的策略,即大規模(mo)算(suan)力投資。2024年,美國科技四巨頭的資本支出(chu)(chu)均達到(dao)歷(li)史最高點,總(zong)額高達2431億(yi)美元,同比(bi)增(zeng)(zeng)長63%。預計(ji)2025年,它(ta)們的資本支出(chu)(chu)總(zong)額將超過3200億(yi)美元,總(zong)增(zeng)(zeng)速約為30%。
巨額的(de)(de)(de)資本支出,主要用于購買算(suan)(suan)(suan)力(li)(li)(li)(li)設備(bei),建設數據中心,以(yi)支撐人工智能業務的(de)(de)(de)快速發(fa)展。這些(xie)科技巨頭們相信(xin),更(geng)高的(de)(de)(de)算(suan)(suan)(suan)力(li)(li)(li)(li)投(tou)入(ru),能夠(gou)帶(dai)來(lai)更(geng)好(hao)的(de)(de)(de)模(mo)型性能和(he)更(geng)快的(de)(de)(de)技術(shu)迭代速度。在商業競爭中,算(suan)(suan)(suan)力(li)(li)(li)(li)的(de)(de)(de)質(zhi)量代表的(de)(de)(de)是速度問題,更(geng)高算(suan)(suan)(suan)力(li)(li)(li)(li)通常帶(dai)來(lai)更(geng)好(hao)的(de)(de)(de)效(xiao)果。短期內節省算(suan)(suan)(suan)力(li)(li)(li)(li)固然重要,但(dan)從長遠(yuan)來(lai)看,算(suan)(suan)(suan)力(li)(li)(li)(li)需求(qiu)只會(hui)螺旋上升(sheng),面(mian)向(xiang)未(wei)來(lai)投(tou)資算(suan)(suan)(suan)力(li)(li)(li)(li)才是更(geng)重要的(de)(de)(de)戰略選擇(ze)。英偉達2025年2月6日其(qi)股(gu)價(jia)單日漲幅超5%,市值重回(hui)3萬億(yi)美元,也回(hui)應了這個趨(qu)勢(shi),反映了市場(chang)對算(suan)(suan)(suan)力(li)(li)(li)(li)芯(xin)片(如GB200芯(xin)片)放量的(de)(de)(de)預期。
這些科技巨(ju)頭們之所以敢(gan)于(yu)如此大手筆地投(tou)入算力(li),一(yi)方(fang)面是因為它們“錢袋子”依然富(fu)余(yu),凈利潤和現金流能(neng)夠支(zhi)撐高強度的(de)算力(li)投(tou)資(zi);另一(yi)方(fang)面,巨(ju)額的(de)算力(li)投(tou)資(zi)也已經(jing)產生了實際(ji)回報(bao),“云+AI”業務的(de)收(shou)入和利潤正在(zai)快速(su)增(zeng)長,這進(jin)一(yi)步刺激(ji)了它們加大算力(li)投(tou)資(zi)的(de)力(li)度。谷(gu)歌、微(wei)軟(ruan)等巨(ju)頭在(zai)2025年Q1財報(bao)中披露,AI業務資(zi)本開支(zhi)同(tong)比(bi)增(zeng)35%,表明算力(li)擴張仍在(zai)持(chi)續,電(dian)力(li)需求韌性顯(xian)現。
除去(qu)科技公(gong)司,主權國家和地區也同步(bu)進入到算力(li)的(de)競賽當中。歐(ou)(ou)盟委員會于2025年(nian)2月宣布的(de)“Invest AI”計劃(hua),擬通過(guo)公(gong)共和私人資金(jin)調動總額2000億歐(ou)(ou)元,核心目標(biao)是建設4座AI超級工(gong)(gong)廠(chang),配備約10萬顆最(zui)先(xian)進AI芯片(pian)(是目前(qian)歐(ou)(ou)洲在(zai)建工(gong)(gong)廠(chang)的(de)4倍),專注于訓練復雜AI模型。其中,200億歐(ou)(ou)元專門用于設立歐(ou)(ou)洲基(ji)金(jin)支持這些工(gong)(gong)廠(chang)。日(ri)本、沙特(te)、印度等國家也紛紛將算力(li)主權納入國家戰(zhan)略。
中國路徑:效率、可持續性與分布式協同
面對全球人工(gong)智(zhi)能(neng)發展的(de)新趨(qu)勢,以及算(suan)(suan)力(li)(li)與能(neng)源的(de)挑戰,中(zhong)國需(xu)要探索一條具有自身特色的(de)發展路徑(jing)。DeepSeekR1的(de)技(ji)術突破,為我們提供了一個重要的(de)啟示:在(zai)人工(gong)智(zhi)能(neng)發展中(zhong),效率和可持續性同樣重要,甚至比單純的(de)算(suan)(suan)力(li)(li)堆(dui)砌更為關鍵(jian)。
中(zhong)國在人工智能發(fa)展(zhan)上,既要(yao)仰望星空,追求前沿技術(shu)的(de)突破,也要(yao)腳踏(ta)實(shi)地(di)(di),注(zhu)重應用(yong)場(chang)景的(de)落地(di)(di)。DeepSeek R1和V3的(de)出現(xian),代表了一(yi)種相(xiang)對(dui)低算(suan)(suan)(suan)力(li)、高表現(xian)的(de)技術(shu)路線,這符合中(zhong)國國情(qing)和發(fa)展(zhan)階段的(de)實(shi)際需(xu)求。對(dui)于中(zhong)國而言,在算(suan)(suan)(suan)力(li)資源(yuan)相(xiang)對(dui)緊張的(de)情(qing)況下,更應該注(zhu)重效率優化,通(tong)過技術(shu)創新(xin),提(ti)升(sheng)單位算(suan)(suan)(suan)力(li)的(de)價值,降低對(dui)能源(yuan)的(de)消耗(hao)。
同時(shi),中國也要(yao)(yao)(yao)清醒地認識(shi)到,優秀(xiu)的(de)(de)硬件(jian)在人(ren)(ren)工智能(neng)發(fa)展過程中仍(reng)然不可替代。算法的(de)(de)優化固然重(zhong)要(yao)(yao)(yao),但更好的(de)(de)硬件(jian)意味著更低的(de)(de)訓練(lian)時(shi)間和更高(gao)的(de)(de)效率(lv)。尤其是(shi)在人(ren)(ren)工智能(neng)前沿研究領域(yu),例(li)如AI for Science,仍(reng)然需要(yao)(yao)(yao)足夠的(de)(de)算力進行(xing)支(zhi)持(chi)。因(yin)此,中國在發(fa)展高(gao)效算法的(de)(de)同時(shi),也要(yao)(yao)(yao)加強在算力基礎(chu)設(she)施(shi)領域(yu)的(de)(de)投入,構建自主可控的(de)(de)算力底(di)座。
未(wei)來,人(ren)工智能(neng)領域(yu)的競爭,將是前(qian)沿技(ji)(ji)術(shu)創新(xin)和(he)應用(yong)(yong)場景落地的雙線競爭。既(ji)要(yao)“卷前(qian)沿”,在基礎理論和(he)核心(xin)技(ji)(ji)術(shu)上取(qu)得突破(po),也(ye)要(yao)“卷應用(yong)(yong)”,將人(ren)工智能(neng)技(ji)(ji)術(shu)廣泛應用(yong)(yong)到各(ge)行各(ge)業,創造實際價值。有能(neng)力的企業,必然是“兩手都(dou)要(yao)抓,兩手都(dou)要(yao)硬”,既(ji)要(yao)布局前(qian)沿技(ji)(ji)術(shu),也(ye)要(yao)深耕應用(yong)(yong)場景。
在(zai)能源(yuan)戰略上,中國應堅持效(xiao)率優先(xian)、綠色(se)發展的(de)原(yuan)則,在(zai)效(xiao)率與(yu)可持續性之間尋找平衡。DeepSeek的(de)分布(bu)式算力架構,為我們提供了一個重要(yao)的(de)方向:通過分布(bu)式革命,瓦解算力集中壟(long)斷的(de)格局(ju),構建更加靈活、高效(xiao)、綠色(se)的(de)算力網絡。
更(geng)進(jin)一步,算(suan)力(li)(li)分(fen)(fen)布式(shi)革命,應與(yu)分(fen)(fen)布式(shi)能(neng)源(yuan)革命協(xie)同(tong)推(tui)進(jin)。通過將算(suan)力(li)(li)設施與(yu)分(fen)(fen)布式(shi)能(neng)源(yuan)(如(ru)光伏、風(feng)電)相結合,構建“源(yuan)-荷(he)-儲(chu)-算(suan)”協(xie)同(tong)的新型電力(li)(li)系(xi)統(tong)。分(fen)(fen)布式(shi)算(suan)力(li)(li)可(ke)以(yi)作為新型電力(li)(li)系(xi)統(tong)的“荷(he)”,通過智(zhi)能(neng)調度算(suan)法,與(yu)分(fen)(fen)布式(shi)能(neng)源(yuan)的波動性出力(li)(li)相匹配,實現“電-算(suan)協(xie)同(tong)”,提升清潔能(neng)源(yuan)的消納能(neng)力(li)(li),降低電力(li)(li)系(xi)統(tong)的風(feng)險。
分(fen)布式(shi)算力(li)革命(ming)與分(fen)布式(shi)能(neng)(neng)源(yuan)革命(ming)的協(xie)(xie)同(tong)發展,將倒逼電(dian)網進化(hua),加速傳(chuan)統(tong)電(dian)網向(xiang)智能(neng)(neng)電(dian)網轉型。智能(neng)(neng)電(dian)網需要具備動(dong)態負荷(he)優化(hua)分(fen)配、實時響應能(neng)(neng)力(li),以適應分(fen)布式(shi)能(neng)(neng)源(yuan)和分(fen)布式(shi)算力(li)的需求(qiu)。這將推動(dong)電(dian)力(li)系統(tong)從(cong)傳(chuan)統(tong)的“單(dan)向(xiang)傳(chuan)輸(shu)”模式(shi),向(xiang)“雙向(xiang)互動(dong)”、“源(yuan)網荷(he)儲”協(xie)(xie)同(tong)優化(hua)的模式(shi)轉變,構建更加清潔、高效、安(an)全、可靠的現代(dai)能(neng)(neng)源(yuan)體(ti)系。
結論:展望人工智能、算力與能源的未來
DeepSeek R1的(de)出現,標志著(zhu)人(ren)工智(zhi)能(neng)技術(shu)發展進(jin)入了(le)一(yi)個新的(de)階段。效率(lv)優化和成本控制(zhi),成為人(ren)工智(zhi)能(neng)技術(shu)發展的(de)重要驅動力(li)。然(ran)(ran)而,技術(shu)進(jin)步(bu)并不能(neng)改變人(ren)工智(zhi)能(neng)對算力(li)和能(neng)源(yuan)的(de)巨大需求。杰文斯(si)悖論提醒我們,效率(lv)提升并不必然(ran)(ran)導(dao)致(zhi)(zhi)資源(yuan)消(xiao)耗的(de)減少,反而可能(neng)刺激需求增長,最終導(dao)致(zhi)(zhi)資源(yuan)消(xiao)耗總量增加。
面對人工智能(neng)(neng)發(fa)展(zhan)帶(dai)來的算(suan)力(li)(li)與(yu)能(neng)(neng)源(yuan)(yuan)挑(tiao)戰,全球科技(ji)界和能(neng)(neng)源(yuan)(yuan)界需(xu)要攜(xie)手合作,共(gong)同探索可持(chi)續(xu)發(fa)展(zhan)之路(lu)。一(yi)方面,要繼續(xu)加強技(ji)術創新,提(ti)升算(suan)力(li)(li)效率(lv),降低單位算(suan)力(li)(li)能(neng)(neng)耗;另一(yi)方面,要大(da)力(li)(li)發(fa)展(zhan)清潔能(neng)(neng)源(yuan)(yuan),構建綠色(se)算(suan)力(li)(li)基(ji)礎(chu)設(she)施,推動能(neng)(neng)源(yuan)(yuan)結(jie)構的轉(zhuan)型升級。
在中國(guo),我們應堅持效率優先、綠色(se)發展的原則,探索具有中國(guo)特色(se)的AI發展路(lu)徑(jing)。通過技術創新、模式創新和政(zheng)策(ce)引導(dao),在效率與(yu)可(ke)持續性之間找到(dao)最佳平衡點,實(shi)現人(ren)工(gong)智(zhi)能(neng)(neng)(neng)與(yu)經濟社會、生態環(huan)境的和諧(xie)共生。算(suan)力(li)分(fen)布式革命(ming)與(yu)分(fen)布式能(neng)(neng)(neng)源革命(ming)的協同推(tui)進,將(jiang)為中國(guo)構建(jian)綠色(se)、高效、智(zhi)能(neng)(neng)(neng)的未(wei)來(lai)能(neng)(neng)(neng)源體系,贏得人(ren)工(gong)智(zhi)能(neng)(neng)(neng)時(shi)代的競(jing)爭優勢,提(ti)供強勁(jing)的動力(li)。
作者信(xin)息
劉少(shao)軒(xuan)
上海交通大學安泰經濟與(yu)管理(li)學院副院長
上(shang)海(hai)交(jiao)通大學中銀科技金融(rong)學院(yuan)執(zhi)行院(yuan)長(chang)
陳鈺什
New Energy Nexus中(zhong)(zhong)國首席研究員,上(shang)海交通大(da)學中(zhong)(zhong)銀科技金融學院(yuan)博士(shi)后
如需轉載請與《每日經濟新聞》報社聯系。
未(wei)經(jing)《每(mei)日(ri)經(jing)濟新聞(wen)》報社(she)授權,嚴禁轉(zhuan)載或鏡像,違(wei)者(zhe)必(bi)究(jiu)。
讀者(zhe)熱線:4008890008
特(te)別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬(chou)。如您(nin)不希望作品(pin)出現在本站,可聯系我們(men)要求(qiu)撤下(xia)您(nin)的作品(pin)。
歡迎關注(zhu)每日經濟新(xin)聞APP