要聞

英偉達深夜發“重磅” 預計2025年推出Blackwell Ultra AI芯片｜大模界

每日經濟新聞 2024-06-03 12:10:22

◎6月2日晚間，一身皮(pi)衣(yi)的英偉達創(chuang)始人黃(huang)仁勛又在舞臺(tai)上擺(bai)弄(nong)起了自家(jia)產(chan)品，重磅介紹了NVIDIANIM，一種推(tui)理(li)微服務(wu)，可(ke)通過經(jing)優化的容器(qi)形式提供模(mo)型，旨在助力各種規模(mo)企業部(bu)署AI服務(wu)。

每經(jing)記者｜楊卉每經(jing)編(bian)輯｜陳(chen)俊杰

6月(yue)2日晚間，英偉達創始人兼首(shou)席執行官黃仁勛登臺演(yan)講(jiang)，透(tou)露了(le)不少關鍵信息。據(ju)他介紹，使用(yong)(yong)NVIDIA NIM將(jiang)AI模型(xing)部署(shu)在云、數(shu)據(ju)中心(xin)或(huo)工作站上的開發者，可將(jiang)模型(xing)部署(shu)時間從(cong)以前的數(shu)周縮(suo)短至幾分鐘。和碩、勞氏(shi)公司、西門子等客戶均在使用(yong)(yong)。

此外(wai)，被英偉達寄(ji)予厚望的(de)新一代(dai)AI芯片(pian)與(yu)超級計算平(ping)臺Blackwell芯片(pian)已開始(shi)投產，預(yu)計將在2025年推出Blackwell Ultra AI芯片(pian)。

圖(tu)片(pian)來源；黃仁勛演講截圖(tu)

NVIDIANIM可將模型部署時間從數周縮短至幾分鐘

6月2日晚(wan)間，一身皮(pi)衣的英偉達(da)創始人(ren)黃仁勛又在舞臺上擺弄起了自家產品，重(zhong)磅介紹了NVIDIANIM，一種推理微(wei)服務(wu)，可通過經優(you)化的容器形(xing)式(shi)提供(gong)模型，旨(zhi)在助力(li)各種規模企業部署AI服務(wu)。

不(bu)過，嚴格(ge)來說，NVIDIANIM并(bing)非新品，最早露面是在今年3月(yue)。英偉達在6月(yue)2日晚間宣布(bu)，全球2800萬(wan)開發者(zhe)皆可下載(zai)NVIDIANIM，將(jiang)AI模型部署在云、數據中心或工(gong)作站(zhan)上(shang)，構建(jian)Copilot（一(yi)種AI助理）、ChatGPT聊天(tian)機器人等生成(cheng)式AI應用(yong)。下月(yue)起，NVIDIA 開發者(zhe)計劃(hua)的(de)會(hui)員可免(mian)費使用(yong)NIM，在其(qi)選擇(ze)的(de)基(ji)礎設施上(shang)進行(xing)研究、開發和測試。

根(gen)據英偉達的(de)說法(fa)，新的(de)生成式AI應用正變得越來(lai)越復雜，通(tong)常需要使用具(ju)有不同功能的(de)多個模型(xing)來(lai)生成文本，如圖像(xiang)、視頻(pin)、語音等。而NVIDIANIM提供了一種(zhong)簡(jian)單(dan)、標準化的(de)方式——將生成式AI添(tian)加到應用中，可使模型(xing)部署時間從以前的(de)數(shu)周縮短至幾分鐘(zhong)。

黃仁(ren)勛還透(tou)露，包括 Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近200家(jia)技術合作伙伴正在將(jiang)NIM集成(cheng)到他們的平(ping)臺(tai)(tai)中，以(yi)加快生成(cheng)式(shi)AI部署。“每個(ge)企(qi)業(ye)都(dou)(dou)希望在其運營(ying)中融入生成(cheng)式(shi)AI，但并非每個(ge)企(qi)業(ye)都(dou)(dou)擁有專門的AI研(yan)究團(tuan)隊(dui)。NVIDIA NIM 可被集成(cheng)到任(ren)意(yi)平(ping)臺(tai)(tai)中，任(ren)何(he)地方的開發者都(dou)(dou)可以(yi)訪(fang)問，并且可以(yi)在任(ren)意(yi)環境(jing)中運行。”黃仁(ren)勛稱。

《每日經濟新聞》記者(zhe)了解到(dao)，NIM是(shi)預先構建的(de)(de)，目前有(you)近40個模型可(ke)作為NIM的(de)(de)端(duan)點供開發者(zhe)體驗(yan)；開發人員(yuan)可(ke)從開源(yuan)社區平(ping)臺Hugging Face訪問(wen)適(shi)用于Meta Llama 3模型的(de)(de)NVIDIA NIM微服(fu)務(wu)，使用Hugging Face推(tui)理端(duan)點訪問(wen)和運(yun)行 Llama 3 NIM。

值得注意的是(shi)，英偉達還(huan)(huan)透露(lu)了一(yi)批(pi)大客戶的使用(yong)情況，如電(dian)子制造商(shang)Foxconn正(zheng)在(zai)(zai)使用(yong)NIM開發針(zhen)對特定領域的大語(yu)言模型（LLM），用(yong)于(yu)智(zhi)能(neng)制造、智(zhi)慧(hui)城(cheng)市和(he)(he)智(zhi)能(neng)電(dian)動汽車；和(he)(he)碩正(zheng)在(zai)(zai)將(jiang)NIM用(yong)于(yu)一(yi)個當(dang)地的混合(he)專家（MoE）模型；勞氏公(gong)司正(zheng)在(zai)(zai)用(yong) NVIDIA NIM推(tui)理微服務(wu)(wu)來提升員工和(he)(he)客戶的體驗；西門子正(zheng)在(zai)(zai)將(jiang)其(qi)運營技術(shu)與NIM微服務(wu)(wu)整合(he)，用(yong)于(yu)車間AI工作(zuo)負(fu)載；還(huan)(huan)有數(shu)(shu)十家醫療(liao)保健公(gong)司正(zheng)在(zai)(zai)部署NIM，為包括手術(shu)規劃、數(shu)(shu)字助(zhu)理、藥物(wu)發現和(he)(he)臨床試驗優化等在(zai)(zai)內(nei)的應用(yong)領域的生成性AI推(tui)理提供支持。

Blackwell芯片開始投產

除了上述產(chan)品，黃仁勛還在演講中透(tou)露(lu)，英偉達Blackwell芯(xin)片(pian)已開始投產(chan)，并將在2025年推出Blackwell Ultra AI芯(xin)片(pian)。

今年(nian)(nian)5月，黃(huang)仁勛在財(cai)報電話會上稱(cheng)，預(yu)計今年(nian)(nian)Blackwell架構芯(xin)片將(jiang)為公司帶(dai)來大(da)量收入。英偉達對Blackwell芯(xin)片寄予(yu)厚(hou)望(wang)，還(huan)是與(yu)市(shi)場強勁(jing)需求有(you)關。從最新披露的財(cai)報數據來看(kan)，2025財(cai)年(nian)(nian)第一財(cai)季，英偉達實現營(ying)收260億(yi)美(mei)元(yuan)，較上年(nian)(nian)同(tong)期增長262%。其中，數據中心業(ye)務營(ying)收226億(yi)美(mei)元(yuan)，與(yu)上年(nian)(nian)同(tong)期相比增長427%，是業(ye)績(ji)收入的“大(da)頭”。

據英(ying)偉達首席(xi)財(cai)務官科萊(lai)特•克(ke)雷斯解讀，數據中心業務的增長(chang)源(yuan)自Hopper架(jia)構(gou)GPU（例如(ru)H100）出貨量(liang)的增加；該季(ji)度的重要亮點(dian)之一就(jiu)是(shi)Meta宣布推(tui)出Lama 3開源(yuan)大模型(xing)，使用(yong)了近2.4萬塊H100 GPU。

除了披露(lu)芯片量產進度，英偉達此(ci)次還(huan)推出了一系(xi)列采(cai)用NVIDIABlackwell架(jia)構的系(xi)統。

據悉，這(zhe)些(xie)系(xi)統搭載(zai)了(le)(le)GraceCPU以及NVIDIA網絡和基礎設(she)施，用于(yu)助(zhu)力企業建立(li)AI工(gong)廠(chang)和數(shu)據中(zhong)心。其(qi)中(zhong)，NVIDIA MGX模塊化(hua)參考設(she)計(ji)平(ping)(ping)臺加入了(le)(le)對NVIDIA Blackwell產(chan)品的支持，包括專為主流大語言模型推理(li)、檢索增(zeng)強生(sheng)成和數(shu)據處理(li)提供卓越性能打造的NVIDIA GB200 NVL2平(ping)(ping)臺。

英偉達強調，GB200 NVL2適合用于數(shu)(shu)據分析(xi)等新興領域，借助NVLink—C2C互連(lian)技(ji)術帶來(lai)的(de)帶寬內存性能(neng)及Blackwell架構中(zhong)專有的(de)解壓縮引擎(qing)，較使用X86CPU時的(de)數(shu)(shu)據處理速(su)度可最多提速(su)到18倍，能(neng)效提高8倍。“新一(yi)輪工(gong)業(ye)革命(ming)已(yi)經開始(shi)，眾多企業(ye)和(he)地(di)區正在(zai)與NVIDIA合作(zuo)推動價值萬億美元的(de)傳統數(shu)(shu)據中(zhong)心向加(jia)速(su)計算轉型，并建造一(yi)種新型數(shu)(shu)據中(zhong)心AI工(gong)廠來(lai)生產(chan)新的(de)商品，人工(gong)智(zhi)能(neng)。”黃仁(ren)勛稱。

英偉(wei)達方(fang)面表示，目前(qian)已(yi)有超過25家合作(zuo)伙伴的(de)90多(duo)套已(yi)發(fa)布(bu)或正(zheng)在開發(fa)中(zhong)的(de)系統使用(yong)了(le)(le)MGX參考架構，開發(fa)成本較之(zhi)前(qian)最多(duo)降低(di)了(le)(le)四分(fen)之(zhi)三，開發(fa)時間縮(suo)短到六個(ge)月，較之(zhi)前(qian)減少了(le)(le)三分(fen)之(zhi)二。另外，英偉(wei)達還(huan)透(tou)露，比亞(ya)迪電子(zi)、西門子(zi)、泰瑞達和(he)Alphabet旗下(xia)公司Intrinsic等全球十多(duo)家機器(qi)人企業正(zheng)在將NVIDIAIsaac加(jia)速(su)庫、基(ji)于物理學的(de)仿真(zhen)和(he)AI模(mo)型集成到其(qi)軟件(jian)框架和(he)機器(qi)人模(mo)型中(zhong)，以此(ci)提(ti)高工廠、倉(cang)庫和(he)配送(song)中(zhong)心的(de)工作(zuo)效率(lv)。

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟(ji)新聞》報社授權，嚴禁轉(zhuan)載或(huo)鏡像(xiang)，違者必究。

讀者熱線：4008890008

特別提醒(xing)：如果我們使用了您的圖片，請作者與本站聯系索取稿(gao)酬(chou)。如您(nin)不希望(wang)作(zuo)品出現(xian)在本站(zhan)，可聯系(xi)我們要(yao)求撤下您(nin)的作(zuo)品。

AI芯(xin)片(pian) 英偉達生成式AI 黃仁(ren)勛

上一篇文章

恒指(zhi)早盤漲(zhang)2.32% 恒生科技指(zhi)數漲(zhang)2.72%

返回每經網首頁

下一篇文章

印(yin)尼(ni)5月(yue)消費者物價(jia)指數較(jiao)上年(nian)同期上漲2.8%，預估為上漲2.9%