據報道,日本電信巨頭軟銀集團將在未來兩年投資1500億日元(9.6億美元)升級其計算設施,該計劃包括大量采購英偉達GPU。除了采用GPU來驅動其內部的大型語言模型(LLM),軟銀還將爲需要超算服務的企業客戶提供訪問權限。
這筆投資將使軟銀去年在計算基礎設施投入的200億日元(1.3億美元)相形見绌,據日經新聞報道,這是日本公司中規模最大的此類投資。
GenAI的發展和應用並沒有放緩的迹象,軟銀因此希望開發日語版GenAI滿足用戶需求。
軟銀在去年3月成立了一個新部門,負責開發LLM和提供GenAI服務。該部門隨後于去年8月作爲軟銀的一家子公司SB Intuitions成立。
SB Intuitions在去年10月完成了其計算平台的部署,並正在開發其首個國産LLM,該項目將在今年推出,擁有3500億個參數。這將使其功能比OpenAI擁有1750億個參數的GPT-3更強大,但遠低于據稱有100萬億個參數的GPT-4。
令人關注的是,OpenAI在本月早些時候表示在東京開設了一個新的辦事處,並開始向日本企業提供日語版GPT-4的早期服務。軟銀因此面臨著加快提供可行替代方案的壓力。
軟銀的AI計算平台運行在英偉達的硬件上,特別是采用2000多個英偉達Tensor Core GPU構建的Nvidia DGX SuperPOD AI超級計算機。鑒于這兩家公司的良好合作,軟銀有理由在其AI超級計算擴張計劃中選擇英偉達。
此外,法國電信集團伊利亞特集團(Iliad) 在去年9月展示了一台SuperPOD,該公司聲稱這是歐洲最強大的AI超級計算機。但正在致力搶占GenAI硬件市場份額的英偉達推出了性能更強的AI超級計算機。
去年5月,英偉達將Grace GPU與Hopper GPU結合在一起創建了Grace Hopper芯片,這是一條專門爲GenAI設計的芯片。英偉達即將推出的DGX GH200超級計算機將使用256個Grace Hopper,並將計劃向那些希望自己構建LLM的公司銷售。
雖然目前還沒有Grace Hopper定價的消息,但肯定會貴得令人瞠目。然而,考慮到目前競爭激烈的GenAI市場,像軟銀這樣的公司可能會認爲在AI方面加大投資將會物有所值。