盡管AI芯片種類繁多,GPU因其適應(yīng)性和強(qiáng)大的并行計(jì)算能力,仍是AI模型訓(xùn)練的主流硬件。英偉達(dá)在GPU領(lǐng)域的技術(shù)積累和生態(tài)建設(shè)使其處于領(lǐng)先地位,而國(guó)內(nèi)GPU廠商雖在追趕,但仍存在差距。AI應(yīng)用向云、邊、端全維度發(fā)展,模型小型化技術(shù)成熟,數(shù)據(jù)傳輸需求增加,Chiplet技術(shù)降低設(shè)計(jì)復(fù)雜度和成本。
如果大家每天需要處理數(shù)百萬(wàn)億次AI模型執(zhí)行,并在生成式AI步入主流的背景下時(shí)刻準(zhǔn)備將這樣的負(fù)載規(guī)模再提升一、兩個(gè)數(shù)量級(jí),那GPU就是各位不可或缺的戰(zhàn)略資源。Meta Platforms明顯就是這樣,他們正拿出大筆財(cái)務(wù)預(yù)算,想要用“鈔能力”從英偉達(dá)手中奪取顯卡產(chǎn)能。
智算中心的發(fā)展依托最新AI理論和計(jì)算架構(gòu),以AI大模型和算力技術(shù)為核心。GPU主導(dǎo)算力芯片市場(chǎng),AI信創(chuàng)推動(dòng)國(guó)產(chǎn)算力。AI分布式計(jì)算市場(chǎng)由算力芯片、內(nèi)存和互聯(lián)設(shè)備組成。ChatGPT推動(dòng)GPU需求,SK海力士HBM3產(chǎn)量售罄。CoWoS封裝技術(shù)集成HBM與處理器,臺(tái)積電領(lǐng)先封裝市場(chǎng)。AI算力需求推動(dòng)高效電源技術(shù)發(fā)展,背面供電技術(shù)成為關(guān)鍵。
ChatGPT的火爆使生成式AI(AIGC)回歸焦點(diǎn),AIGC指利用AI技術(shù)生成內(nèi)容,涵蓋文本、圖像、音頻等領(lǐng)域。AIGC產(chǎn)業(yè)圖譜V2.0展示了基礎(chǔ)設(shè)施、算法模型、內(nèi)容應(yīng)用等生態(tài)布局。
Arm Neoverse數(shù)據(jù)中心計(jì)算路線圖剛剛迎來(lái)一系列新鮮元素,遺憾的是數(shù)據(jù)中心級(jí)獨(dú)立GPU加速器仍然缺席。
今天Nvidia公布了第四季度財(cái)務(wù)業(yè)績(jī),結(jié)果再次超出華爾街預(yù)期,使其股價(jià)在盤后交易中走高。
根據(jù)Groq官網(wǎng)的介紹,LPU是一種專為AI推理所設(shè)計(jì)的芯片。但要訓(xùn)練大模型,仍然需要購(gòu)買GPU。
NVIDIA RTX 2000 Ada的推出為AI加速帶來(lái)了高性價(jià)比的解決方案,展現(xiàn)了NVIDIA在推動(dòng)技術(shù)進(jìn)步和賦能未來(lái)工作方式方面的前瞻性。
要說(shuō)當(dāng)下最困難的挑戰(zhàn),就是如何為計(jì)算系統(tǒng)采購(gòu)充足的英偉達(dá)“Hopper”H100 GPU。哪怕是作為供應(yīng)商的英偉達(dá)自己,也只能在有限的配額之下謹(jǐn)慎規(guī)劃、調(diào)撥給內(nèi)部使用。
英偉達(dá)公司今天推出了新的Nvidia RTX 2000 Ada Generation GPU,將更強(qiáng)大的生成式人工智能處理器打包到“緊湊型工作站”中,讓用戶能夠在設(shè)備上運(yùn)行高級(jí)AI應(yīng)用程序。
從最近的態(tài)勢(shì)來(lái)看,AMD旗下Instinct數(shù)據(jù)中心GPU加速器業(yè)務(wù)在2024年的表現(xiàn)似乎將比人們的預(yù)期好上不少。
各大云服務(wù)商已經(jīng)部署數(shù)以萬(wàn)計(jì)的GPU與AI加速器,希望充分滿足市場(chǎng)在大語(yǔ)言模型方面的需求激增。
整個(gè)世界正為生成式AI而瘋狂,且瘋狂程度仍在與日俱增。到2027年,全球GPU硬件總支出將達(dá)到4000億美元。
AMD在圣何塞召開的Advancing AI大會(huì)上公布了MI300產(chǎn)品家族,基本與英偉達(dá)、英特爾和其他AI加速器廠商的節(jié)奏保持一致。
一個(gè)月前,在英偉達(dá)通過(guò)財(cái)務(wù)會(huì)議放出的技術(shù)路線圖中,可以看到GH200 GPU和H200 GPU加速器將作為“Blackwell”GB100 GPU和B100 GPU之前的過(guò)渡產(chǎn)品,而Blackwell家族計(jì)劃在明年年內(nèi)推出。
近日,Imagination Technologies推出IMG DXD,這是支持DirectX的高性能GPU IP新產(chǎn)品線的首款產(chǎn)品。
Omdia發(fā)布統(tǒng)計(jì),認(rèn)為在一定時(shí)期之內(nèi),服務(wù)器市場(chǎng)將繼續(xù)以GPU為最主要的核心組件。這家市場(chǎng)研究機(jī)構(gòu)估計(jì),單英偉達(dá)H100 GPU這一款產(chǎn)品在今年第二季度的出貨量就超過(guò)了900噸。
Nvidia公司正在和位于多倫多的初創(chuàng)公司Xanadu Quantum Technologies展開合作,首次實(shí)現(xiàn)在超級(jí)計(jì)算機(jī)上運(yùn)行量子計(jì)算模擬。
Nvidia近日宣布推出一款名為TensorRT-LLM的新開源軟件套件,擴(kuò)展了Nvidia GPU上大型語(yǔ)言模型優(yōu)化的功能,并突破了部署之后人工智能推理性能的極限。
NVIDIA L40S GPU 結(jié)合 NVIDIA Omniverse 平臺(tái),將加速計(jì)算密集型的復(fù)雜應(yīng)用,推動(dòng)生成式 AI 發(fā)展并開啟更多可能性。