推理性能提升30倍！英偉達(dá)發(fā)布史上最強(qiáng)AI芯片，黃仁勛：將成最成功產(chǎn)品

作者：羅靈姣　日期：2024-03-19 13:32:58　點(diǎn)擊數(shù)：

萬(wàn)眾矚目的英偉達(dá)GPU技術(shù)大會(huì)（GTC）如期舉行，備受期待的最新AI芯片也被如期推出。

當(dāng)?shù)貢r(shí)間3月18日，黃仁勛發(fā)表主題演講《見(jiàn)證AI的變革時(shí)刻》。在兩個(gè)小時(shí)的演講中，黃仁勛圍繞五大板塊，介紹了英偉達(dá)的最新研發(fā)進(jìn)展：新的產(chǎn)業(yè)發(fā)展、Blackwell平臺(tái)、創(chuàng)新軟件NIMs、AI平臺(tái)NEMO和AI工坊（AI foundry）服務(wù)，以及仿真平臺(tái)Omniverse和適用于自主移動(dòng)機(jī)器人的Isaac Robotics平臺(tái)。

推理性能提升30倍！英偉達(dá)發(fā)布史上最強(qiáng)AI芯片，黃仁勛：將成最成功產(chǎn)品(圖1)

黃仁勛在演講中重點(diǎn)介紹的五大板塊。英偉達(dá)直播截圖

毫不夸張地說(shuō)，英偉達(dá)本次GTC大會(huì)可能決定美股科技股的未來(lái)命運(yùn)。英偉達(dá)股價(jià)在19日當(dāng)天早盤(pán)一度上漲超過(guò)4%，隨后回落，收于每股884.55美元，漲0.7%，總市值2.21萬(wàn)億美元。

在大會(huì)現(xiàn)場(chǎng)，18日下午四點(diǎn)，身穿經(jīng)典黑色皮衣的黃仁勛登臺(tái)亮相。面對(duì)座無(wú)虛席的美國(guó)加州圣何塞SAP中心，他笑著說(shuō)道“希望你們知道，這可不是一場(chǎng)演唱會(huì)”。

隨后，黃仁勛用一張手繪圖回顧了計(jì)算機(jī)產(chǎn)業(yè)的發(fā)展史，以及英偉達(dá)的發(fā)家史。從1964年IBM推出世界首個(gè)通用計(jì)算機(jī)開(kāi)始，伴隨著Windows 95、加速計(jì)算乃至深度學(xué)習(xí)模型AlexNet的出現(xiàn)，再到2016年，黃仁勛親手將第一臺(tái)DGX-1超級(jí)計(jì)算機(jī)送給了OpenAI。而在2022年，隨著聊天機(jī)器人ChatGPT橫空出世，生成式AI帶來(lái)了全新一輪產(chǎn)業(yè)革命。

推理性能提升30倍！英偉達(dá)發(fā)布史上最強(qiáng)AI芯片，黃仁勛：將成最成功產(chǎn)品(圖2)

黃仁勛手繪計(jì)算機(jī)發(fā)展史。英偉達(dá)直播截圖

隨后，便到了本次主題演講眾望所歸的大戲：最新一代AI芯片Blackwell GPU的亮相。

黃仁勛一邊說(shuō)著“Hopper很棒，但我們需要更大的GPU”，一邊在現(xiàn)場(chǎng)展示了英偉達(dá)的首款Blackwell芯片。這款芯片被命名為B200，計(jì)劃于今年晚些時(shí)候上市。

英偉達(dá)目前按照平均兩年一次的更新頻率升級(jí)GPU架構(gòu)，對(duì)產(chǎn)品性能進(jìn)行大幅提升。英偉達(dá)于2022年發(fā)布了基于Hopper架構(gòu)的H100加速卡，而現(xiàn)在推出基于Blackwell的加速卡在性能上也得到了全面提升，更擅長(zhǎng)處理AI相關(guān)任務(wù)。

從外觀來(lái)看，Blackwell GPU的體積明顯大于H100，采用臺(tái)積電的4納米（4NP）工藝蝕刻而成，整合了兩個(gè)獨(dú)立制造的裸晶（Die），共有2080億個(gè)晶體管。英偉達(dá)使用傳輸速度達(dá)到10 TB每秒的NVLink 5.0技術(shù)來(lái)連接每塊裸晶。

推理性能提升30倍！英偉達(dá)發(fā)布史上最強(qiáng)AI芯片，黃仁勛：將成最成功產(chǎn)品(圖3)

左邊B200，右邊H100。英偉達(dá)直播截圖

據(jù)黃仁勛介紹，一個(gè)B200 GPU能夠從其2080億個(gè)晶體管中提供高達(dá)20 petaflops（每秒千萬(wàn)億次浮點(diǎn)運(yùn)算）的FP4八精度浮點(diǎn)運(yùn)算能力。相比之下，英偉達(dá)H100芯片所包含的晶體管數(shù)量為800億個(gè)，提供4 petaflops的FP4八精度浮點(diǎn)運(yùn)算能力。

在此基礎(chǔ)上，一個(gè)GB200加速卡結(jié)合了兩個(gè)B200 GPU和一個(gè)獨(dú)立的Grace CPU，將能夠使大模型推理工作負(fù)載的性能提升30倍，同時(shí)提高效率。相比于H100，它可以“將成本和能源消耗降至1/25”。

這就意味著，以前訓(xùn)練一個(gè)擁有1.8萬(wàn)億參數(shù)的模型需要8000個(gè)Hopper GPU 和15兆瓦的功耗。而今天，黃仁勛表示，同樣的工作只需要2000個(gè)Blackwell GPU就能完成，功耗僅為4兆瓦。同時(shí)，取決于各種Blackwell設(shè)備的內(nèi)存容量和帶寬配置，工作負(fù)載的實(shí)際性能可能會(huì)更高。

推理性能提升30倍！英偉達(dá)發(fā)布史上最強(qiáng)AI芯片，黃仁勛：將成最成功產(chǎn)品(圖4)

黃仁勛展示GB200加速卡開(kāi)發(fā)板（左側(cè)），稱(chēng)其“可能價(jià)值100億美元”。來(lái)源：英偉達(dá)直播截圖

而在參數(shù)為1750億的GPT-3 LLM基準(zhǔn)測(cè)試中，GB200的性能達(dá)到了H100的7倍，而訓(xùn)練速度則達(dá)到了H100的4倍。

對(duì)此，黃仁勛也自豪地曬出了AI芯片技術(shù)的發(fā)展圖，并表示：“在過(guò)去，計(jì)算能力平均每十年性能提升100倍。而在過(guò)去的八年中，我們已經(jīng)將性能提升了1000倍，距離十年還有兩年?！?/span>

推理性能提升30倍！英偉達(dá)發(fā)布史上最強(qiáng)AI芯片，黃仁勛：將成最成功產(chǎn)品(圖5)

AI芯片技術(shù)的發(fā)展圖。英偉達(dá)直播截圖

英偉達(dá)還將面向有大型需求的企業(yè)提供成品服務(wù)，例如體積龐大的GB200 NVL72服務(wù)器，共包含36個(gè)CPU和72個(gè)Blackwell GPU，并提供完整的一體水冷散熱方案，可實(shí)現(xiàn)總計(jì)720 petaflops的AI訓(xùn)練性能，或高達(dá)1440 petaflops的推理性能。其內(nèi)部使用的電纜長(zhǎng)度累計(jì)接近2英里，共有5000條獨(dú)立電纜。

不過(guò)，英偉達(dá)并沒(méi)有公布關(guān)于B200和其相關(guān)產(chǎn)品的價(jià)格，只表示亞馬遜、谷歌、微軟和甲骨文等公司都已計(jì)劃在其云服務(wù)產(chǎn)品中裝配N(xiāo)VL72機(jī)架，但沒(méi)有公布這些公司的購(gòu)買(mǎi)數(shù)量，只透露了亞馬遜AWS已計(jì)劃采購(gòu)由2萬(wàn)片GB200芯片組建的服務(wù)器集群，可以部署27萬(wàn)億個(gè)參數(shù)的模型。

黃仁勛表示，Blackwell帶來(lái)了“令人難以置信的興奮”：“我們將會(huì)把Blackwell推廣給全球的AI公司，現(xiàn)在有很多這樣的公司都在不同領(lǐng)域做著令人驚奇的工作……全球各地都在簽約啟動(dòng)Blackwell，這款Blackwell將成為我們歷史上最成功的產(chǎn)品發(fā)布?！?/span>

推理性能提升30倍！英偉達(dá)發(fā)布史上最強(qiáng)AI芯片，黃仁勛：將成最成功產(chǎn)品(圖6)

GB200 NVL72服務(wù)器的外觀和內(nèi)部。英偉達(dá)直播截圖

在硬件之外，英偉達(dá)在AI軟件領(lǐng)域也取得了新的進(jìn)展。

黃仁勛宣布，英偉達(dá)推出數(shù)十項(xiàng)企業(yè)級(jí)生成式AI微服務(wù)，其中最新的NIM微服務(wù)，可適用于對(duì)英偉達(dá)及合作伙伴生態(tài)系統(tǒng)中20多個(gè)熱門(mén)的AI模型進(jìn)行推理優(yōu)化。這些云原生微服務(wù)目錄在英偉達(dá)CUDA平臺(tái)上開(kāi)發(fā)，企業(yè)可以利用這些微服務(wù)在自己的平臺(tái)上創(chuàng)建和部署定制應(yīng)用，同時(shí)保留對(duì)知識(shí)產(chǎn)權(quán)的完整所有權(quán)和控制權(quán)。

其中，重點(diǎn)介紹的NIM微服務(wù)將提供基于英偉達(dá)推理軟件的預(yù)構(gòu)建容器，使開(kāi)發(fā)者能夠?qū)⒉渴饡r(shí)間從幾周縮短至幾分鐘，并為語(yǔ)言、語(yǔ)音和藥物發(fā)現(xiàn)等領(lǐng)域提供行業(yè)標(biāo)準(zhǔn)API，使開(kāi)發(fā)者能夠利用在自己基礎(chǔ)設(shè)施中的專(zhuān)有數(shù)據(jù)來(lái)快速構(gòu)建AI應(yīng)用，而不是在云服務(wù)器上運(yùn)行。

英偉達(dá)希望通過(guò)這些服務(wù)來(lái)吸引購(gòu)買(mǎi)英偉達(dá)服務(wù)器的客戶(hù)來(lái)注冊(cè)英偉達(dá)企業(yè)版NVIDIA AI Enterprise 5.0，對(duì)每個(gè)GPU每年收取4500美元的費(fèi)用。企業(yè)可以自己選擇基礎(chǔ)設(shè)施來(lái)部署這些微服務(wù)，包括亞馬遜云科技（AWS）、谷歌云、Azure 和 Oracle Cloud Infrastructure 等云平臺(tái)。超過(guò)400個(gè)英偉達(dá)認(rèn)證系統(tǒng)也支持 NVIDIA 微服務(wù)，包括思科、戴爾科技、慧與（HPE）、惠普、聯(lián)想和超微的服務(wù)器和工作站。

除了硬件和軟件，黃仁勛還在演講中花大篇幅來(lái)介紹英偉達(dá)的仿真平臺(tái)Omniverse和適用于自主移動(dòng)機(jī)器人的Isaac Robotics平臺(tái)。

對(duì)于Omniverse，黃仁勛重點(diǎn)介紹了英偉達(dá)研究團(tuán)隊(duì)利用其在預(yù)測(cè)氣候問(wèn)題方面的進(jìn)展。黃仁勛還提到，Omniverse Cloud將可以連接到蘋(píng)果的混合現(xiàn)實(shí)（MR）頭顯Vision Pro。黃仁勛在現(xiàn)場(chǎng)展示了一款可以完全交互的汽車(chē)模型，能夠通過(guò)流媒體技術(shù)傳輸?shù)絍ision Pro中。

關(guān)于機(jī)器人領(lǐng)域，黃仁勛在現(xiàn)場(chǎng)宣布，英偉達(dá)推出名為Project GROOT Foundation的AI模型，旨在創(chuàng)建性能更好的人形機(jī)器人。此外，還發(fā)布了一款專(zhuān)用于機(jī)器人的名為T(mén)hor的系統(tǒng)芯片。

黃仁勛表示：“機(jī)器人領(lǐng)域出現(xiàn)ChatGPT時(shí)刻的可能性近在咫尺，我們已經(jīng)花了一段時(shí)間來(lái)構(gòu)建端到端的機(jī)器人系統(tǒng)?！?/span>

上一篇 : 強(qiáng)化中國(guó)芯片行業(yè)的統(tǒng)一計(jì)劃性，扭轉(zhuǎn)芯片各自為政下的脆弱生態(tài) 下一篇 : 針對(duì)中國(guó)芯片，歐盟考慮跟著美國(guó)搞審查

隨便看看

04 2023-08

芯片行業(yè)持續(xù)衰退，國(guó)內(nèi)企業(yè)如何尋找新機(jī)遇？2023世界半導(dǎo)體大會(huì)上臺(tái)積電展示的300毫米晶圓（來(lái)源：鈦媒體App編輯拍攝）在當(dāng)前全球經(jīng)濟(jì)走弱、中美芯片競(jìng)爭(zhēng)和全球半...
27 2022-04

消費(fèi)類(lèi)MCU降價(jià)？業(yè)內(nèi)人士稱(chēng)IC經(jīng)銷(xiāo)商正在減少庫(kù)存蔡榮宗提到，因晶圓成本上升影響，預(yù)期第2季毛利率將較1季略降，且晶圓供應(yīng)商后續(xù)未再提漲價(jià)，盛群也沒(méi)有進(jìn)一步漲價(jià)計(jì)劃。此外...
22 2023-11

李彥宏：有大量的AI芯片儲(chǔ)備，大模型四季度有望帶來(lái)數(shù)億廣告增李彥宏李彥宏稱(chēng)文心大模型重構(gòu)后的廣告系統(tǒng)，將在四季度帶來(lái)數(shù)億元增量收入。而美國(guó)面向芯片領(lǐng)域的禁令，短期來(lái)看對(duì)百度影響有限...
09 2023-09

獨(dú)家 |聯(lián)發(fā)科大砍2024年晶圓投片量?官方回應(yīng)于聯(lián)發(fā)科開(kāi)始大砍2024年的wafer（晶圓）投片數(shù)量的消息，官方予以否認(rèn)。9月8日晚間，面對(duì)市場(chǎng)傳聞，聯(lián)發(fā)科CFO顧大...

国产精品无码一区二区三级,国产一级婬片a免费播放口欧美,欧美日韩电影一区二区三区,久久久久成人亚洲电影

推理性能提升30倍！英偉達(dá)發(fā)布史上最強(qiáng)AI芯片，黃仁勛：將成最成功產(chǎn)品

桂林珩源科技有限公司

關(guān)于我們

新聞動(dòng)態(tài)

產(chǎn)品選型

產(chǎn)品展示

国产精品无码一区二区三级,国产一级婬片a免费播放口欧美,欧美日韩电影一区二区三区,久久久久成人亚洲电影

推理性能提升30倍！英偉達(dá)發(fā)布史上最強(qiáng)AI芯片，黃仁勛：將成最成功產(chǎn)品

桂林珩源科技有限公司

關(guān)于我們

新聞動(dòng)態(tài)

產(chǎn)品選型

產(chǎn)品展示

推理性能提升30倍！英偉達(dá)發(fā)布史上最強(qiáng)AI芯片，黃仁勛：將成最成功產(chǎn)品