對技術發展太樂觀?字節豆包大模型直接“擊穿底價”

電科技 2024-05-17 14:40:19

不久前,零一萬物CEO李開複老師表示,模型推理的成本每年下降十倍,過去兩年已經證明了這一點。做得好的話,推理成本能下降二三十倍。

5月15日,字節跳動豆包大模型在火山引擎原動力大會上正式發布,主力模型推理輸入價格0.0008元/千tokens,相當于把行業價格直降100多倍!要知道,大模型推理的GPU算力是寶貴的資源。如果沒有瘋的話,字節很顯然對于優化推理成本的技術有著非常樂觀的預期。

火山引擎總裁譚待表示,超低定價來自對技術的信心,而且大模型要真正落地開花,降低使用成本是必要的條件。對于企業而言,大模型從以分計價到以厘計價的巨大跨越,將助力企業以更低成本加速業務創新。

豆包推動AI普惠

一直低調的字節AI在此次大會放了大招。

首先,品牌名稱統一了。從原來的“雲雀”大模型改名爲“豆包大模型,從基座模型到上層應用,一口氣抛出了一系列9款模型。

其中,豆包主力模型分爲通用模型pro和lite兩個版本,分別適配不同用戶的使用需求。除此之外,還有 7 款功能性模型,涵蓋角色扮演、語音識別、語音合成、聲音複刻、文生圖等方面。

此外,字節跳動基于豆包大模型還打造了AI(人工智能)對話助手“豆包”、AI應用開發平台“扣子”、互動娛樂應用“貓箱”以及河馬愛學(AI學習助手)、星繪(AI分身創作)、即夢(AI創作平台)等。

字節跳動産品和戰略副總裁朱駿認爲,技術在快速演化,但用戶核心的需求沒有改變,包括高效獲取信息、工作提效、自我表達、社交娛樂等等。字節跳動做了很多學習和探索,希望找到適合的大模型應用形態,以足夠自然的交互方式,爲用戶的生活和工作帶來便利。

比起首次亮相的豆包大模型家族,價格才是此次大會最大的意外和驚喜。當火山引擎總裁譚待公布“豆包通用模型Pro 32k模型,正式定價是0.0008元/千tokens”,現場響起了一陣驚呼和掌聲。

這可以說是一個之前誰也沒辦法想象的“地板價 ”。

以 OpenAI 發布的全新模型GPT-4o爲例,GPT-4o的價格已經來到輸入5美元/百萬Token(約爲0.035元/千tokens),輸出15美元/百萬Tokens(0.1元/千tokens)。國內的一衆大模型廠商,均價在0.12元/千Tokens左右——豆包大模型的價格比其便宜了150倍。火山引擎公布的價格計算顯示,一元錢能買到豆包主力模型的125萬tokens,大約是200萬個漢字,相當于三本《三國演義》。

對于大幅降價的原因,譚待給出了解釋:“一個是我們能夠做到,第二是我們需要這麽做。”根本原因在于,模型推理成本快速下降是軟硬件技術發展的必然規律。很顯然,字節對于通過技術手段優化成本非常樂觀。

對于降價是否會引起大模型市場的競爭,譚待表示,目前大模型市場仍在發展初期階段,“池塘有多大,魚就有多大,現在整個池塘還在培養的過程。”目前,大模型仍處于百家爭鳴的狀態,需要大家一起實現應用落地、降低成本,讓更多人受益,因此目前還不存在激烈競爭。

在會後的采訪中,譚待則表示,0.0008元/千Tokens並不是一個意在“打價格戰”的價格 。作爲字節跳動 To B 的重要的載體,火山的定價會遵循正常的商業邏輯,虧錢補貼,並不能換來長久的商業合作。

可以預見,從豆包大模型開始,大模型行業從“以分計價”到“以厘計價”的時代。

産品力久經打磨

本次發布會上,字節跳動沒有放出任何榜單分數和參數規模,對于自家的産品可謂是胸有成竹。

譚待在會後采訪中直言,爲什麽不披露測試結果和參數,因爲這些大家都可以自己測就好了,好不好用完全可以自己體驗一下就能感受到。

實際上,早在去年大模型就在字節跳動內部完成了上線,也是首批通過大模型服務安全備案的大模型之一。豆包字節跳動內部已經把大模型接入抖音、番茄小說、飛書、巨量引擎,覆蓋了辦公智能助手、電商導購、售後客服、營銷創作、數據智能分析、編程助手等業務場景50余個業務。

字節跳動自身的産品也爲豆包大模型提供了豐富且能夠規模化的應用場景。其中,在蘋果APP Store和各大安卓應用市場,豆包APP的下載量在AIGC類應用中排名第一。豆包上已有超過800萬個智能體被創建,月度活躍用戶達到2600萬。

譚待介紹,經過一年時間的叠代和市場驗證,豆包大模型正成爲國內使用量最大、應用場景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬張圖片。

豆包大模型在成本和效果上已經得到了成功驗證,在服務字節內部的同時,也在與火山引擎的衆多企業客戶合作共創大模型的應用落地。

去年,火山引擎發布了一站式大模型服務平台火山方舟,希望通過模型即服務的理念,幫助企業在高效、安全的環境裏應用各類模型。此次大會將火山方舟平台進行了全新升級,推出了方舟2.0平台大幅提升核心插件、系統性能以及平台體驗,幫助企業推進大模型的價值創造。

首先是聯網插件,升級後提供頭條抖音同款搜索能力,實時連接海量優質數據,同時使用文本、圖像、語音等多模態交互方式,並通過業內領先的意圖識別能力,大幅提升模型的信息獲取能力;隨後是大模型內容插件,可以獨家提供抖音豐富的視頻和圖文內容,並且作爲相當的重要信息去豐富大模型和用戶的交互過程;以及知識庫插件,對企業來說,其實內部積累了很多專業數據,通過知識庫的應用,可以通過這些專業數據更好地輔助大模型,提升它的精確度,降低幻覺。火山方舟的知識庫插件內置了字節自主研發的大規模高性能向量檢索引擎,可以實現百億級別數據的毫秒級檢索,而且能支持秒級索引流式更新。這是一個重要的功能。

除以上核心插件升級之外,火山方舟2.0也全面升級了系統承載能力、安全防護能力和算法服務能力。在系統承載力上,提供超萬卡的GPU資源池來支撐大模型推理服務,並提供極致的彈性調度,僅僅只需要 3 分鍾,就能夠順利完成千卡擴容;安全防護上,通過安全沙箱構建可信的執行環境,多維度的安全架構,保障數據安全;此外,火山引擎提供專業的算法團隊服務,幫助客戶釋放獨有數據價值,讓企業大模型應用輕松落地。

除了好的模型效果、便捷的插件、強勁的系統性能,還需要提供簡單易用開發平台。扣子産品經理潘宇揚介紹,扣子(coze)作爲字節跳動推出的新一代AI應用開發平台,具備低門檻、個性化、實時性、多模態等優勢,並集合海量的AI資源、豐富的發布渠道、一鍵自定義API服務,幫助填補大模型到用戶場景的最後一公裏。

譚待表示,火山引擎致力于成爲AI時代最開放和領先的雲服務平台。全新升級的火山方舟2.0將通過更強性能、更優插件、更好服務以及安全可信方案,助力大模型應用落地

大模型落地蓄勢待發

在豆包大模型和火山方舟平台加持下,汽車、金融、消費、教育等行業都在抓緊機遇運用大模型。

例如招商銀行基于扣子和豆包大模型搭建了可以推薦餐飲優惠門店的“掌上生活”bot,以及能彙總市場行情的“財富看點”bot;海底撈通過使用豆包大模型搭建顧客評價分析模型,分析結果應用于服務質量、菜品質量、經營管理的優化叠代;超級猩猩基于扣子和豆包大模型搭建了AI顧問,爲用戶提供全能答疑,智能推薦健身課程;OPPO的小布助手與豆包大模型在通用問答、定制化聊天人設智能體和定制化職場人設智能體上展開合作,豐富了知識儲備,提升了實時檢索能力和安全合規保障;複旦大學基于扣子和豆包大模型,搭建了通識核心課程《生態學》的輔導助手。

蒙牛集團副總裁首席數智官李琤潔在大會現場分享AI應用表示,蒙牛運用大模型技術,構建AI矩陣。目前已經生成AI營養專家、AI育嬰師、AI運動營養師、AI廣告投手、AI SEO專家。蒙牛利用AI進行智能優化後投放廣告,節省預算超過以往30%以上。運用AI完成(一人運營自有媒體)利用AIGC,基于熱點話題産出創意概念,生成可直接用于社媒傳播的圖像和文案。生成可直接用于傳播的圖像和文案海量實時在社交媒體發布。

發布會當天,火山引擎聯合中國電動汽車百人會,與吉利汽車、長城汽車、捷途汽車、賽力斯、智己汽車等20余家廠商,宣布成立汽車大模型生態聯盟,致力于爲消費者帶來汽車全場景AI新體驗。

同時,火山引擎與OPPO、vivo、榮耀、小米、三星、華碩宣布成立智能終端大模型聯盟。OPPO小布助手、榮耀MagicBook的YOYO助理、小米“小愛同學”,以及華碩筆記本電腦的豆叮AI助手等應用,均已接入火山引擎的大模型服務。

當前大模型應用發展仍處于早期階段。QuestMobile 數據顯示,截至今年 3 月,基于大模型的AIGC行業用戶量爲7380萬,同比增長了8倍,僅占移動互聯網用戶量的6%,存在廣闊的增長空間。

在推動AI轉型的浪潮中,技術創新與商業落地並行不悖。技術驅動下的極致性價比,讓大模型的使用門檻大大降低,使得人人都能享受到其帶來的便利。

編輯:高明

1 阅读:26