中國AI賽道上,阿裏雲成了最激進堅決的玩家

極客公園 2024-05-10 20:30:54

在「AI 驅動」上好久沒發聲的阿裏雲,突然公布了一系列大動作。

5 月 9 日,在 AI 智領者峰會·北京站上,阿裏雲正式發布通義千問 2.5,中文性能已趕超 GPT4 Turbo。同時,通義千問 1100 億參數開源模型在多個基准測評收獲最佳成績,超越 Llama-3-70B,成爲開源領域最強大模型。不止于此,阿裏雲模型和 AI 應用定制平台——百煉也迎來全面升級。

圖片來源:阿裏雲

這一系列發布多少讓人意外。今年以來,阿裏雲聚焦「公共雲優先」戰略,但在「AI 驅動」上,遲遲不見蹤影。業內一度猜測阿裏雲在 AI 路線上「躺平」了。

年初,阿裏雲先是推出公共雲産品史上最大幅度降價;3 月底,羅永浩在交個朋友直播間售賣阿裏雲的公共雲産品;此後在機場、地鐵站等廣告牌上,王小川、陳向東、江南春代言「上雲就上阿裏雲」。

相比之下,阿裏雲在 AI 路線,尤其是自研模型上卻鮮少有新消息放出,倒是有一些投資傳聞。去年,阿裏集團和阿裏雲投資了幾乎所有的國內大模型,今年也被傳追加投資了月之暗面和 Minimax。看上去,阿裏雲似乎是要用投資「買」一張大模型時代的船票。

但從昨天的發布來看恰恰相反,阿裏雲對 AI,尤其是基礎大模型這個産業關鍵,依然保持著激進地投入。

此前阿裏雲在大模型創業團隊上幾乎大滿貫式的投資布局,現在看起來只是「心態絕對開放」的一種動作,以此來支持 AI 生態所有的可能性。技術層面,阿裏雲全線 AI 業務一直在不斷探索,不僅開源、閉源模型齊頭並進,在工具和服務上,阿裏雲「模型即服務」的整個開發棧也全面開花。

阿裏雲的 AI 戰略決心和目標,到現在已經開始完整顯現出來。

01 模型和 AI Infra「絕對激進」

5 月 9 日,阿裏雲公布了其在閉源模型、開源模型及 AI Infra 等方面的最新進展。

其最新發布的閉源 SOTA 大模型通義千問 2.5 相比此前的 2.1 版,在理解能力、邏輯推理、指令遵循、代碼能力分別提升 9%、16%、19%、10%,中文能力更是持續領先業界。根據權威基准 OpenCompass 的測評結果,通義千問 2.5 得分追平 GPT-4 Turbo,這是國産大模型第一次取得這麽高的排名。

同時,通義多模態模型和專有能力模型也在業界建立了廣泛影響。在多個多模態標准測試中,通義千問視覺理解模型 Qwen-VL-Max 得分超越 Gemini Ultra 和 GPT-4V,這款模型已在多家企業落地;代碼大模型 CodeQwen1.5-7B 則是 HuggingFace 代碼模型榜單 Big Code 的榜首模型,也是國內用戶規模第一的智能編碼助手——通義靈碼的底座。

在開源路線上,阿裏雲最新開源了 1100 億參數的 Qwen1.5-110B。該模型在 MMLU、TheoremQA、GPQA 等基准測評中超越了 Meta 最新開源的 Llama-3-70B 模型;在 HuggingFace 推出的開源大模型排行榜 Open LLM Leaderboard 上,Qwen1.5-110B 沖上榜首,堪稱當前中國最強的開源大模型。

既做閉源模型開發,又做開源模型,阿裏雲的基礎模型在兩條路線上並舉。阿裏雲 CTO 周靖人表示,這是「模型即服務」的內涵之一,來滿足用戶和開發者生態對基礎模型的不同需求。

但有了基礎模型,距離模型在具體場景中被用起來也有很大距離。因爲每個各行各業的不同企業都有自己特殊的場景、數據、需求,一個標准化的基礎模型很難直接被用起來。

爲此,阿裏雲貼著開發者生態的場景需求,升級了 AI Infra 平台——百煉,推出了百煉 2.0。

圖片來源:阿裏雲

「當下企業應用大模型存在三種範式:一是對大模型開箱即用,二是對大模型進行微調和持續訓練,三是基于模型開發應用,其中最典型的需求是 RAG,以企業數據對大模型進行知識增強。圍繞這些需求,百煉打造了模型中心和應用中心,提供最豐富的模型和最易用的工具箱。」周靖人介紹。

對希望直接調用模型進行推理的企業,百煉集成了包括開源和閉源在內的上百款大模型 API,同時聯動魔搭開源社區,支持企業上架通用或行業模型,給開發者提供足夠多的模型選擇。同時,百煉依托阿裏雲 AI 基礎設施,支持千億級模型的萬級並發推理需求。

對需進一步訓練模型的用戶,百煉提供從數據管理、模型調優、評測到部署的全鏈路模型服務,用戶可彈性按需調用算力,無需關心底層架構。訓練過程可視化,還可自動評測模型質量,並與其他模型對比。

對希望打造 RAG 應用的企業,百煉支持 Assistant API 開發模式,可在百煉上輕松創建知識庫,並一鍵開啓知識檢索增強(RAG),通過 Assistant API 聯合輸出。同時,百煉支持 agent 智能體開發,並能實現多智能體協作、對話記憶等高級功能。

事實上,隨著大模型成爲軟件開發的新範式後,國內各大模型廠商都推出了模型 api 供開發者調用,但大部分廠商在微調及 AI 應用開發工具上相對缺乏。阿裏雲百煉平台則依托阿裏雲豐富的基礎設施,在工具鏈豐富度、大規模 AI 服務能力以及對開發者生態的融合上,更勝一籌。

這得益于其強大的雲計算和生態能力。大模型時代的雲計算,長什麽樣子?這個問題在大模型還沒有火出圈時,阿裏雲就在 2022 年雲棲大會上首次提出,今天也被整個行業擁抱成爲大模型時代雲的新架構——MaaS(模型即服務)。百煉這樣的工具層正是 MaaS 的一種表現形式。

圖片來源:阿裏雲

但 MaaS 並不是無中生有的新架構,而是雲計算中的 PaaS 工具層在大模型時代的延伸。阿裏雲之所以最早看到這一趨勢,也是由于其在雲計算架構上的前瞻性。隨著基礎模型的豐富,百煉平台的完善, 開發者可以快速定制自己的模型和 AI 應用,像玩樂高一樣,從場景和數據出發,DIY 大模型時代的 AI 應用。

不難發現,阿裏雲的 AI 路線在開源、閉源、工具都朝著行業領先在投入和「較勁兒」,從這一系列發布中,你很難發現阿裏雲用「生態投入」替代「技術研發」的苗頭,更談不上坐享其「賣鏟子」的基礎設施定位。取而代之地,阿裏雲更加縱深的「AI 驅動」路線顯現。

02 心態上「絕對開放」,業務上「全面覆蓋」

看完了這一串眼花缭亂的發布,最後我們回到一個基礎的問題:阿裏雲的「AI 驅動」戰略到底是什麽思路?

ChatGPT 發布一年以後,大型雲廠商逐漸構建起日趨完善的 AI 産品服務體系,並逐漸分化出自己的特點。有的主打開放生態,有的主打自研閉源,也有的專注工具層。

而阿裏雲當下的路線,是覆蓋了幾乎所有的 AI 技術棧,並在每一條線上都持續投入。

在基礎模型上,阿裏雲不僅自研對標 GTP-4 水平的閉源模型,也在開源模型上一騎絕塵,甚至投資了國內其他的大模型公司;在 AI 工具層面,從 Prompt Engineering、RAG 到 Agent,任何一條新的技術棧出現,阿裏雲也都在第一時間跟進。

在場景上,阿裏雲沒有像其他雲平台一樣,聚集在一兩個垂類場景或者電商、生成等一兩個熱門場景,走單點突破然後以點帶面的打法,而是以極高的壓強投入,覆蓋所有重點的業務場景。

作爲國內最大的雲廠商,阿裏雲的規模和資源決定了其有做這種全覆蓋打法的底氣。但更深層次地,決定其這麽做的原因是:在當前這個階段,AI 技術棧還遠非收斂的時刻,更不用說最終哪個場景可以長得足夠大這樣的問題。另外,阿裏雲企業客戶類型和需求的豐富度,也是國內之最,驅使它必須全面布局。

過去不到兩年的時間裏,從 GPT-3.5 再到 GPT-4 Turbo 甚至傳言中的 4.5/5,幾乎每過半年 AI 基礎模型或工具能力就會迎來一次代際級的提升,每一代 AI 的能力就像是從高中生到大學生、職場新人再到總監、VP。與此同時,技術棧也在快速變化,從對話式 AI,到智能助理、智能體、RAG、Prompt Engineering……遠遠沒有到 AI 技術範式出現定格的時刻。

阿裏雲目前顯然沒有放棄某一條路線的打算。而是在算力平台、開源社區、開源模型、工具鏈上全方位投入,不僅自研開源和閉源模型,還以開放的姿態引入産業鏈的各個合作夥伴。這讓他們在過去一年裏收獲了最多的用戶、開發者和場景用例。阿裏雲透露,通義千問每天的日調用量早已過億,也擁有 9 億企業客戶數成爲中國企業最受歡迎的大模型。

圖片來源:視覺中國

場景上也是如此,不是用過去的視角笃定某一個行業會率先爆發,而是從客戶需求出發,探索和滿足各行各業的可能性。這與當年移動時代的阿裏雲有相似之處,阿裏雲創始人王堅博士在 2014 年自己去米哈遊辦公室研究早期阿裏雲産品故障時,後者還只是大學畢業生創建的小團隊,誰能想到包括米哈遊在內的遊戲賽道會成爲雲計算主要場景之一,米哈遊這樣一個當年稚嫩的小公司,也成了阿裏雲今天 Top10 的客戶。

心態上「絕對開放」,業務上「順其自然」地全面覆蓋。不去爭論「開源、閉源哪個更好」,或者「單一模型架構、MoE 架構哪個更優」,又或者「電商、視頻哪個會先誕生殺手級 App」,而是覆蓋每一條技術棧,每一個場景,不放過每一個可能性。

這是阿裏雲「AI 驅動」戰略的真相,與外界此前猜測的躺平,可能恰恰相反。

5 阅读:355
评论列表
  • llflqw 21
    2024-05-11 09:32

    不是激進,是實力!沒有實力就如吉利連個自動駕駛都嚇得要死!

  • 2024-05-11 11:43

    阿裏歸來,實力至上。之前做短視頻平台這樣出力,早就沒有快手抖音的事了。阿裏與時俱進才有未來。

  • 2024-05-11 22:02

    猶太勞德諾越努力,華山越舔碗!