每日經濟新聞 2024-06-03 12:10:22
◎6月2日晚間,一身皮(pi)衣(yi)的英偉達創(chuang)始人黃(huang)仁勛又在舞臺(tai)上擺(bai)弄(nong)起了自家(jia)產(chan)品,重磅介紹了NVIDIANIM,一種推(tui)理(li)微服務(wu),可(ke)通過經(jing)優化的容器(qi)形式提供模(mo)型,旨在助力各種規模(mo)企業部(bu)署AI服務(wu)。
每經(jing)記者|楊卉 每經(jing)編(bian)輯|陳(chen)俊杰
6月(yue)2日晚間,英偉達創始人兼首(shou)席執行官黃仁勛登臺演(yan)講(jiang),透(tou)露了(le)不少關鍵信息。據(ju)他介紹,使用(yong)(yong)NVIDIA NIM將(jiang)AI模型(xing)部署(shu)在云、數(shu)據(ju)中心(xin)或(huo)工作站上的開發者,可將(jiang)模型(xing)部署(shu)時間從(cong)以前的數(shu)周縮(suo)短至幾分鐘。和碩、勞氏(shi)公司、西門子等客戶均在使用(yong)(yong)。
此外(wai),被英偉達寄(ji)予厚望的(de)新一代(dai)AI芯片(pian)與(yu)超級計算平(ping)臺Blackwell芯片(pian)已開始(shi)投產,預(yu)計將在2025年推出Blackwell Ultra AI芯片(pian)。
圖(tu)片(pian)來源;黃仁勛演講截圖(tu)
6月2日晚(wan)間,一身皮(pi)衣的英偉達(da)創始人(ren)黃仁勛又在舞臺上擺弄起了自家產品,重(zhong)磅介紹了NVIDIANIM,一種推理微(wei)服務(wu),可通過經優(you)化的容器形(xing)式(shi)提供(gong)模型,旨(zhi)在助力(li)各種規模企業部署AI服務(wu)。
不(bu)過,嚴格(ge)來說,NVIDIANIM并(bing)非新品,最早露面是在今年3月(yue)。英偉達在6月(yue)2日晚間宣布(bu),全球2800萬(wan)開發者(zhe)皆可下載(zai)NVIDIANIM,將(jiang)AI模型部署在云、數據中心或工(gong)作站(zhan)上(shang),構建(jian)Copilot(一(yi)種AI助理)、ChatGPT聊天(tian)機器人等生成(cheng)式AI應用(yong)。下月(yue)起,NVIDIA 開發者(zhe)計劃(hua)的(de)會(hui)員可免(mian)費使用(yong)NIM,在其(qi)選擇(ze)的(de)基(ji)礎設施上(shang)進行(xing)研究、開發和測試。
根(gen)據英偉達的(de)說法(fa),新的(de)生成式AI應用正變得越來(lai)越復雜,通(tong)常需要使用具(ju)有不同功能的(de)多個模型(xing)來(lai)生成文本,如圖像(xiang)、視頻(pin)、語音等。而NVIDIANIM提供了一種(zhong)簡(jian)單(dan)、標準化的(de)方式——將生成式AI添(tian)加到應用中,可使模型(xing)部署時間從以前的(de)數(shu)周縮短至幾分鐘(zhong)。
黃仁(ren)勛還透(tou)露,包括 Cadence、Cloudera、Cohesity、DataStax、NetApp、Scale AI 和新思科技等近200家(jia)技術合作伙伴正在將(jiang)NIM集成(cheng)到他們的平(ping)臺(tai)(tai)中,以(yi)加快生成(cheng)式(shi)AI部署。“每個(ge)企(qi)業(ye)都(dou)(dou)希望在其運營(ying)中融入生成(cheng)式(shi)AI,但并非每個(ge)企(qi)業(ye)都(dou)(dou)擁有專門的AI研(yan)究團(tuan)隊(dui)。NVIDIA NIM 可被集成(cheng)到任(ren)意(yi)平(ping)臺(tai)(tai)中,任(ren)何(he)地方的開發者都(dou)(dou)可以(yi)訪(fang)問,并且可以(yi)在任(ren)意(yi)環境(jing)中運行。”黃仁(ren)勛稱。
《每日經濟新聞》記者(zhe)了解到(dao),NIM是(shi)預先構建的(de)(de),目前有(you)近40個模型可(ke)作為NIM的(de)(de)端(duan)點供開發者(zhe)體驗(yan);開發人員(yuan)可(ke)從開源(yuan)社區平(ping)臺Hugging Face訪問(wen)適(shi)用于Meta Llama 3模型的(de)(de)NVIDIA NIM微服(fu)務(wu),使用Hugging Face推(tui)理端(duan)點訪問(wen)和運(yun)行 Llama 3 NIM。
值得注意的是(shi),英偉達還(huan)(huan)透露(lu)了一(yi)批(pi)大客戶的使用(yong)情況,如電(dian)子制造商(shang)Foxconn正(zheng)在(zai)(zai)使用(yong)NIM開發針(zhen)對特定領域的大語(yu)言模型(LLM),用(yong)于(yu)智(zhi)能(neng)制造、智(zhi)慧(hui)城(cheng)市和(he)(he)智(zhi)能(neng)電(dian)動汽車;和(he)(he)碩正(zheng)在(zai)(zai)將(jiang)NIM用(yong)于(yu)一(yi)個當(dang)地的混合(he)專家(MoE)模型;勞氏公(gong)司正(zheng)在(zai)(zai)用(yong) NVIDIA NIM推(tui)理微服務(wu)(wu)來提升員工和(he)(he)客戶的體驗;西門子正(zheng)在(zai)(zai)將(jiang)其(qi)運營技術(shu)與NIM微服務(wu)(wu)整合(he),用(yong)于(yu)車間AI工作(zuo)負(fu)載;還(huan)(huan)有數(shu)(shu)十家醫療(liao)保健公(gong)司正(zheng)在(zai)(zai)部署NIM,為包括手術(shu)規劃、數(shu)(shu)字助(zhu)理、藥物(wu)發現和(he)(he)臨床試驗優化等在(zai)(zai)內(nei)的應用(yong)領域的生成性AI推(tui)理提供支持。
除了上述產(chan)品,黃仁勛還在演講中透(tou)露(lu),英偉達Blackwell芯(xin)片(pian)已開始投產(chan),并將在2025年推出Blackwell Ultra AI芯(xin)片(pian)。
今年(nian)(nian)5月,黃(huang)仁勛在財(cai)報電話會上稱(cheng),預(yu)計今年(nian)(nian)Blackwell架構芯(xin)片將(jiang)為公司帶(dai)來大(da)量收入。英偉達對Blackwell芯(xin)片寄予(yu)厚(hou)望(wang),還(huan)是與(yu)市(shi)場強勁(jing)需求有(you)關。從最新披露的財(cai)報數據來看(kan),2025財(cai)年(nian)(nian)第一財(cai)季,英偉達實現營(ying)收260億(yi)美(mei)元(yuan),較上年(nian)(nian)同(tong)期增長262%。其中,數據中心業(ye)務營(ying)收226億(yi)美(mei)元(yuan),與(yu)上年(nian)(nian)同(tong)期相比增長427%,是業(ye)績(ji)收入的“大(da)頭”。
據英(ying)偉達首席(xi)財(cai)務官科萊(lai)特•克(ke)雷斯解讀,數據中心業務的增長(chang)源(yuan)自Hopper架(jia)構(gou)GPU(例如(ru)H100)出貨量(liang)的增加;該季(ji)度的重要亮點(dian)之一就(jiu)是(shi)Meta宣布推(tui)出Lama 3開源(yuan)大模型(xing),使用(yong)了近2.4萬塊H100 GPU。
除了披露(lu)芯片量產進度,英偉達此(ci)次還(huan)推出了一系(xi)列采(cai)用NVIDIABlackwell架(jia)構的系(xi)統。
據悉,這(zhe)些(xie)系(xi)統搭載(zai)了(le)(le)GraceCPU以及NVIDIA網絡和基礎設(she)施,用于(yu)助(zhu)力企業建立(li)AI工(gong)廠(chang)和數(shu)據中(zhong)心。其(qi)中(zhong),NVIDIA MGX模塊化(hua)參考設(she)計(ji)平(ping)(ping)臺加入了(le)(le)對NVIDIA Blackwell產(chan)品的支持,包括專為主流大語言模型推理(li)、檢索增(zeng)強生(sheng)成和數(shu)據處理(li)提供卓越性能打造的NVIDIA GB200 NVL2平(ping)(ping)臺。
英偉達強調,GB200 NVL2適合用于數(shu)(shu)據分析(xi)等新興領域,借助NVLink—C2C互連(lian)技(ji)術帶來(lai)的(de)帶寬內存性能(neng)及Blackwell架構中(zhong)專有的(de)解壓縮引擎(qing),較使用X86CPU時的(de)數(shu)(shu)據處理速(su)度可最多提速(su)到18倍,能(neng)效提高8倍。“新一(yi)輪工(gong)業(ye)革命(ming)已(yi)經開始(shi),眾多企業(ye)和(he)地(di)區正在(zai)與NVIDIA合作(zuo)推動價值萬億美元的(de)傳統數(shu)(shu)據中(zhong)心向加(jia)速(su)計算轉型,并建造一(yi)種新型數(shu)(shu)據中(zhong)心AI工(gong)廠來(lai)生產(chan)新的(de)商品,人工(gong)智(zhi)能(neng)。”黃仁(ren)勛稱。
英偉(wei)達方(fang)面表示,目前(qian)已(yi)有超過25家合作(zuo)伙伴的(de)90多(duo)套已(yi)發(fa)布(bu)或正(zheng)在開發(fa)中(zhong)的(de)系統使用(yong)了(le)(le)MGX參考架構,開發(fa)成本較之(zhi)前(qian)最多(duo)降低(di)了(le)(le)四分(fen)之(zhi)三,開發(fa)時間縮(suo)短到六個(ge)月,較之(zhi)前(qian)減少了(le)(le)三分(fen)之(zhi)二。另外,英偉(wei)達還(huan)透(tou)露,比亞(ya)迪電子(zi)、西門子(zi)、泰瑞達和(he)Alphabet旗下(xia)公司Intrinsic等全球十多(duo)家機器(qi)人企業正(zheng)在將NVIDIAIsaac加(jia)速(su)庫、基(ji)于物理學的(de)仿真(zhen)和(he)AI模(mo)型集成到其(qi)軟件(jian)框架和(he)機器(qi)人模(mo)型中(zhong),以此(ci)提(ti)高工廠、倉(cang)庫和(he)配送(song)中(zhong)心的(de)工作(zuo)效率(lv)。
如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟(ji)新聞》報社授權,嚴禁轉(zhuan)載或(huo)鏡像(xiang),違者必究。
讀者熱線:4008890008
特別提醒(xing):如果我們使用了您的圖片,請作者與本站聯系索取稿(gao)酬(chou)。如您(nin)不希望(wang)作(zuo)品出現(xian)在本站(zhan),可聯系(xi)我們要(yao)求撤下您(nin)的作(zuo)品。
歡迎關注每日(ri)經濟(ji)新聞APP