天下苦英偉達久矣。
讓英偉達躺著賺錢?其他科技巨頭們不幹了!
這幾天,谷歌、英特爾、Meta等科技巨頭集體官宣新款AI芯片。其中既有英特爾Gaudi 3這樣直接硬剛英偉達H200的“性能怪獸”,也有谷歌Axion這種主打高效全能的“性能鋼炮”。
而這些芯片都有同一個特性,都是爲了AI模型服務。
在此之前,微軟、亞馬遜都陸續推出了自研處理器的計劃。
這場AI軍備競賽,最終還是卷向了硬件。
主打性價比,英特爾硬剛英偉達當地時間4月9日,在Intel Vision 2024會議上,英特爾CEO帕特·基辛格(Pat Gelsinger)推出了最新AI芯片Gaudi3,並現場與DJ來了一場蹦迪。
爲什麽基辛格如此高興?讓我們看看這款芯片的參數——芯片模型訓練層面,Gaudi3比英偉達H100快40%;推理層面Gaudi 3比英偉達H100快50%。
與現在最強的英偉達H200相比,Gaudi 3的推理速度依然保持優勢。雖然基辛格沒有在現場給出直接的數據,但他表示Gaudi 3在某些領域的性能甚至會更好。
英偉達H200的性能毋庸置疑,它具備460萬億次的浮點運算能力,並且有豐富的CUDA生態。相比之下,Gaudi 3其實並沒有太大優勢,更別說對標B200這種最強大的芯片。
但Gaudi 3的特點就是“又好用又便宜”。
目前,H100的售價約在每台2.5萬至4萬美元之間。那麽作爲升級款的H200,其上市後必然不會低于這個價格。
同理,英偉達的Backwell芯片預計售價爲3-4萬美元,也符合英偉達目前的“身價”。這對于急需AI芯片的客戶來說,購入H100已經是一筆不小的開銷。
成本高是一回事,買不到貨更客戶們頭疼。
最近,X用戶“The Technology Brother”發布了一張圖片,數據顯示Meta公司囤積了全球最多的 H100 GPU,數量達到驚人的35萬塊,剩下的公司從3萬塊到300塊不等。
根據GPU Utils網站在2023年的測算,H100缺口高達43萬張。如此大的供應缺口,一些小公司只能等著訂單排隊。
H100芯片賣給誰,基本是英偉達CEO黃仁勳說了算。目前只有大客戶還有CoreWeave這種英偉達親自投資的公司才有優先購買權,亞馬遜、微軟等競爭對手只能限量供應。
更不要說,國內AI公司只能購買到A800這樣的閹割版産品。在AI算力競賽面前,手握高端GPU就是手握優勢。
當然,限制H100並不全是英偉達的問題,台積電的産能也要背很大的鍋。
總的來說,Gaudi 3不僅性能不輸H100,英特爾又有自己的代工能力,難怪基辛格有硬剛英偉達的信心。
當客戶變成對手除了多了一位競爭對手外,英偉達的客戶們也選擇自研芯片的方式來減少對高端GPU的依賴。
在英特爾公布Gaudi3後,谷歌在Next大會上宣布推出自研首款基于Arm的CPU——Axion。
據悉這款CPU處理器Axion,將提供比英特爾CPU更好的性能和能源的效率,並且比目前基于Arm的最快通用芯片,性能還要高出30%。
雖然對標著英特爾的CPU,但谷歌這塊芯片實際是爲了訓練複雜的AI模型做准備。和Gaudi 3一樣,Axion主打一個“性價比”,靠著自己出色的AI能力,爲包括Google地球引擎和YouTube廣告平台在內的多項服務提供算力。
同樣是自研芯片項目,谷歌也對自家超算平台進行了升級,推出了TPU v5p。
這是一個類似于英偉達GPU的替代品産品,用于AI加速任務。在自家最先進的AI模型Gemini和開放AI模型Gemma支持下,TPU v5p將支持更大、更苛刻的模型。
有著CPU與TPU的雙重加持,谷歌的自研芯片項目越來越豐富。
無獨有偶,Meta也趕在了今天推出了新一代訓練和推理加速器MTIA 。
早在去年5月,Meta公布了 7nm工藝的MTIA v1,專注于向數據中心服務。
而此次推出的新款 MTIA 芯片,采用5nm工藝,使用更大的物理設計、擁有更多的處理核心,功耗從25W提升到了90W,時鍾頻率也從800MHz提高到了 1.35GHz,整體性能提高了3倍。
Meta表示,目前已經在16個數據中心使用新款 MTIA芯片,這就意味著Meta在自研芯片上費了不小的精力。
除了近期陸續公布新芯片的三家巨頭以外,算上亞馬遜AWS推出的Trainium和Inferentia兩個系列AI芯片,以及微軟在自家技術大會期間發布的用于雲端AI訓練和推理芯片Maia 100,目前絕大多數科技公司們都有了自研AI芯片項目。
結語AI算力的軍備競賽,正在愈演愈烈。每家科技公司都已經預料到AI模型的規模會迅速擴大。
然而從目前現狀來看,英偉達GPU依然牢牢掌握著全球算力資源,並且通過最新的AI芯片不斷穩固當前的商業模式。
但GPU的價格擺在那裏,即使是財大氣粗的科技巨頭,也要計算性能和成本效益。
既然自己有能力在硬件上做出性能相當且最合適自己的AI芯片,那麽誰不想與英偉達全面一較高下呢?
不過在缺少生態和産量的前提下,英偉達的GPU依然是科技公司的首選。就看台積電和英特爾在代工這一環節,能不能給點力了。
本文作者:jh,觀點僅代表個人,題圖源:網絡