全面趕超GPT-4Turbo?通義千問也追上來了

作者|葉二編輯|魏曉

阿裏雲，當然不能落後。

在百度文心一言、商湯日日新等當下國內主流大模型，陸續産品叠代升級至“全面對標GPT-4Turbo”之後，阿裏雲也入場了。

今天，阿裏雲正式官宣發布通義千問2.5。

阿裏雲方面表示，該模型性能全面趕超GPT-4Turbo。

據介紹，與通義千問2.1版本相比，通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%；與GPT-4相比，中文語境下，通義千問2.5文本理解、文本生成、知識問答及生活建議、閑聊及對話、安全風險等多項能力趕超GPT-4。

在權威基准OpenCompass上，通義千問2.5得分追平GPT-4Turbo，阿裏雲表示，這是國産大模型首次在該基准取得該項成績。

很明顯，國內通用大模型的“跑分”競賽，已經到了白熱化的階段。

正如此前kimi引領的長文本處理能力上，文心一言、通義千問也隨之跟進，將長文本能力分別開放至500萬、1000萬一樣，在大模型賽道上，在追趕OpenAI的路上，通用大模型玩家都不容絲毫松懈。

當然，“跑分”再強，也得落地。

在基礎能力之外，此次升級的通義千問2.5還拓展了文檔處理、音視頻理解、智能編碼等多種能力。

比如文檔處理上，通義千問2.5支持單次最長1000萬字、100個文檔，覆蓋PDF、Word、Excel等多種文件格式，可解析標題、段落、圖表等多種數據格式。

音視頻理解方面，通義千問2.5融合語音、LLM、多模態、翻譯能力，具備實時語音識別、說話人分離功能，能夠提取全文摘要、總結發言、提取關鍵詞等，可同時上傳處理50個音視頻文件。等等。

C端上，阿裏雲還將原“通義千問APP”升級爲“通義”APP，將通義實驗室文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等全棧能力“All in one”，目標是成爲每個人的全能AI助手。

並且是放出了免費大招。

AI算力的高成本，有目共睹，尤其是叠代至更智能的GPT4後。有數據顯示，OpenAI的GPT4 API價格是Chat-GPT API 使用價格的15-30倍。

在業內人士看來，生成式AI産品收費是大勢所趨，訓練和運行大模型需要大量的計算資源，包括高性能服務器、大規模數據集和算法工程師團隊等，如果不收費，沒有任何一家企業能夠持續燒錢提供服務。

目前在GPT4水平能力上，OpenAI采取了每月20美金的收費，百度在去年11月上線文心一言專業版，定價59.9元/月，連續包月優惠價爲49.9元/月，同時還推出文心一言和文心一格的聯合會員，價格爲99元/月。

而同爲國內主流互聯網大廠，阿裏則選擇了免費路線，目的自然是希望通過免費，快速擴大C端的用戶規模。

原因也很好理解。

作爲通用大模型，基于阿裏雲以及釘釘在B端的多年深耕，尤其是釘釘早就完成了接入，通義千問在B端是非常有優勢的。

此次2.5版本的發布上，通義千問就打出了“最受企業歡迎的大模型”旗號。

數據顯示，目前，通義大模型已通過阿裏雲服務企業超9萬、通過釘釘服務企業超過220萬，通義開源模型累計下載量突破700萬。通義落地應用進程加速，現已進入PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。

但在C端，相比較百度的文心一言，通義千問缺乏在C端産品應用場景的積累。去年12月，文心一言用戶便突破1億，今年4月，這一數據便翻番至2億。

顯然在用戶規模上，文心一言已經領先不少。這自然就給通義千問等通用大模型造成足夠的壓力。免費，也就不失爲與文心一言爭奪用戶的一條有效路徑。

而在這背後，阿裏在確立“AI電商”的戰略方向之後，AI這一環已然不容有失。

不僅僅是阿裏雲以通義大模型在通用大模型賽道參與“內卷”，阿裏也瘋狂地在市場上以投資的方式對大模型創業公司獨角獸進行“掃貨”。

公開信息顯示，截止目前，阿裏已經投了5家國內市場上的大模型獨角獸，分別是MiniMax、月之暗面、智譜AI、百川智能、零一萬物，是投資最爲激進的大廠。

並且在這些獨角獸的相關融資過程中，阿裏也多以領投方的角色出現。

足見阿裏的決心。

一方面是對AI的看重，另一方面，也跟阿裏在大模型賽道上的戰略有關。

無論是通義千問的免費，還是阿裏掃貨大模型獨角獸，阿裏最大的目標不是靠自研模型賺錢，而是爲一衆大模型提供雲計算能力，把握成爲AI算力基礎設施的機會。

但無論如何，都需要建立在通用大模型産品真正跑出來的前提下。

放到通義千問這個“親兒子”這裏，壓力也就不僅僅來自文心一言等友商，也來自于集團投資的其他“兄弟”。

來源|AI藍媒彙作者|葉二

文采家