百模大戰進入新階段,先把價格給大家打下來

三易生活 2024-05-16 19:41:24

就在5月15日,太平洋兩岸的兩大科技巨頭谷歌和字節跳動都舉行了活動,而多模態大模型全家桶則都成爲了主角。其中,谷歌發布了AI助手Project Astra、對標Sora的文生視頻模型Veo,字節跳動也正式上線“豆包大模型”家族。如果說這兩大巨頭發布的新技術、新功能可能還有些晦澀難明,那麽新品的價格則無疑是普羅大衆非常感興趣的一點。

在發布豆包大模型的同時,字節跳動方面還搞出了一個大新聞,並吹響了AI大模型價格戰的號角。據字節跳動火山引擎總裁譚待介紹,“大的使用量才能打磨出好模型,也能大幅降低模型推理的單位成本。豆包主力模型在企業市場的定價只有0.0008元/千Tokens,0.8厘就能處理1500多個漢字,比行業便宜99.3%。”

其實不僅僅是字節跳動,進入2024年之後,幾乎所有的國內大模型廠商都開始琢磨“價格力”了。此前在Create 2024百度AI開發者大會上,李彥宏除了貢獻“開源模型會越來越落後”、“閉源是有真正的商業模式,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才”等金句之外,還表示文心大模型的推理成本降到了原來的1%,在客戶原來一天調用1萬次同樣的成本之下,現在一天就可以調用100萬次。”

緊接著,國內明星AI初創公司智譜AI宣布降價,其能力對標GPT3.5-Turbo的GLM-3 Turbo大模型API調用價格最高下調90%,僅需1元就可以購買200萬Tokens。按一個漢字兩個Token計算,給智譜AI的LM-3 Turbo充值1元,就能讓大模型輸出百萬字的內容,都夠一本長篇小說的體量了。

此外,百度方面也在不久前發布了文心大模型的輕量版,其中ERNIE Tiny版本的價格也來到0.001元每千tokens,1元也能買到100萬tokens。而面壁智能的端側模型“小鋼炮”MiniCPM,則更是打出了“0元購”的口號。

此前在2023年,大模型賽道軍備競賽的主題是“性能”,各廠商樂此不疲地在C-Eval、CMMLU等大語言模型基准測試榜單上“刷榜”,“不服跑個分”也成爲了彼時百模大戰的經典場面,各家更是無不以更多的得分爲傲。可到了2024年,隨著大家對大模型祛魅,純粹比拼性能已經很難調動用戶的興趣,大家更看重的則是如何通過大模型來解決實際問題。

2023年國內大模型賽道主要是進行宣傳,大幹快上是爲了更好地從投資人手中拿錢,可面對這個賽道“燒錢如燒紙”的狀態,投資者的熱情也在迅速消退,一級市場的觀望情緒開始占據主流。緊接著,大模型的商業化,或者說利用現有AI能力構建新産品就成爲了今年的主題。既然要商業化,最簡單、最直接的手段自然就是價格戰,畢竟用投入來換市場份額是互聯網行業爛熟于心的一套玩法。

這時候如果大模型廠商繼續維持0.1元/千Tokens的價格,不光是C端消費者會望而卻步,即使是B端用戶恐怕也心有戚戚。畢竟大模型想要真正意義上有作用,廉價化是必經之路。當然,如果沒有技術進步,即使大模型廠商想要打價格戰也是巧婦難爲無米之炊。但在百模大戰拉開帷幕的一年時間裏,國內大模型賽道也堪稱是日新月異。

數據、算力、算法無疑是大模型的基石,考慮到目前算力供應短缺,以至于OpenAI、微軟、谷歌等海外廠商都在琢磨著自研芯片,以及英偉達GPU受管制的背景,所以國産大模型打價格戰,算力並不是關鍵。同樣,數據也不是主因,因爲在高質量語料的價值已經成爲共識之後,大模型預訓練需要的數據成本是不降反升。實際上,大模型的算法在過去一年突飛猛進,才是如今各大廠商敢于打價格戰的核心因素。

此前李彥宏在Create 2024上就曾表示,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理成本降到了原來的1%。例如百度的異構計算平台“百舸”,就宣稱實現了訓練和推理場景的吞吐量提高30%-60%,提供有效訓練時長達到98%,帶寬有效利用率達95%。

這一變化就意味著原先需要用100天的訓練才能達到的效果,如今最低僅需40天。除此之外,百度的“千帆”大模型平台還兼容昆侖、昇騰、海光DCU、英特爾等,英偉達之外的AI算力供應商,爲客戶提供了低成本的算力解決方案。除了百度之外,騰訊也在去年秋季升級了混元大模型背後的自研機器學習框架Angel,升級後的訓練效率可提升至主流開源框架的2.6倍,用該框架訓練千億級大模型可節省50%的算力成本,使得大模型推理速度提高了1.3倍。

在確保同等效果的前提下,提高硬件利用率、縮短算力資源的使用時長,以及優化工具鏈以提高訓練、推理效率,這就是過去一年國産大模型共同的思路。用一句話來概括,就是在過去一年,國産大模型在把PPT寫得天花亂墜的同時,也確確實實地在進行降本增效。

但需要注意的是,0.0008元/千Tokens這樣超低定價或許很難持續。畢竟作爲巨頭的字節跳動這番操作幾乎就是明牌,那就是通過持續的價格戰來擠壓中小廠商的生存空間,進而擴大市占率、以期與BAT等巨頭決戰,甚至其他一些有資本支持的AI獨角獸可能也是這樣想的。所以在接下來,高烈度的價格戰或許將會是這一賽道的主旋律。

0 阅读:7

三易生活

簡介:專注IT,最快最專業資訊!