全面趕超GPT-4Turbo?通義千問也追上來了

藍媒彙 2024-05-09 18:57:02

作者|葉二 編輯|魏曉

阿裏雲,當然不能落後。

在百度文心一言、商湯日日新等當下國內主流大模型,陸續産品叠代升級至“全面對標GPT-4Turbo”之後,阿裏雲也入場了。

今天,阿裏雲正式官宣發布通義千問2.5。

阿裏雲方面表示,該模型性能全面趕超GPT-4Turbo。

據介紹,與通義千問2.1版本相比,通義千問2.5的理解能力、邏輯推理、指令遵循、代碼能力分別提升9%、16%、19%、10%;與GPT-4相比,中文語境下,通義千問2.5文本理解、文本生成、知識問答及生活建議、閑聊及對話、安全風險等多項能力趕超GPT-4。

在權威基准OpenCompass上,通義千問2.5得分追平GPT-4Turbo,阿裏雲表示,這是國産大模型首次在該基准取得該項成績。

很明顯,國內通用大模型的“跑分”競賽,已經到了白熱化的階段。

正如此前kimi引領的長文本處理能力上,文心一言、通義千問也隨之跟進,將長文本能力分別開放至500萬、1000萬一樣,在大模型賽道上,在追趕OpenAI的路上,通用大模型玩家都不容絲毫松懈。

當然,“跑分”再強,也得落地。

在基礎能力之外,此次升級的通義千問2.5還拓展了文檔處理、音視頻理解、智能編碼等多種能力。

比如文檔處理上,通義千問2.5支持單次最長1000萬字、100個文檔,覆蓋PDF、Word、Excel等多種文件格式,可解析標題、段落、圖表等多種數據格式。

音視頻理解方面,通義千問2.5融合語音、LLM、多模態、翻譯能力,具備實時語音識別、說話人分離功能,能夠提取全文摘要、總結發言、提取關鍵詞等,可同時上傳處理50個音視頻文件。等等。

C端上,阿裏雲還將原“通義千問APP”升級爲“通義”APP,將通義實驗室文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等全棧能力“All in one”,目標是成爲每個人的全能AI助手。

並且是放出了免費大招。

AI算力的高成本,有目共睹,尤其是叠代至更智能的GPT4後。有數據顯示,OpenAI的GPT4 API價格是Chat-GPT API 使用價格的15-30倍。

在業內人士看來,生成式AI産品收費是大勢所趨,訓練和運行大模型需要大量的計算資源,包括高性能服務器、大規模數據集和算法工程師團隊等,如果不收費,沒有任何一家企業能夠持續燒錢提供服務。

目前在GPT4水平能力上,OpenAI采取了每月20美金的收費,百度在去年11月上線文心一言專業版,定價59.9元/月,連續包月優惠價爲49.9元/月,同時還推出文心一言和文心一格的聯合會員,價格爲99元/月。

而同爲國內主流互聯網大廠,阿裏則選擇了免費路線,目的自然是希望通過免費,快速擴大C端的用戶規模。

原因也很好理解。

作爲通用大模型,基于阿裏雲以及釘釘在B端的多年深耕,尤其是釘釘早就完成了接入,通義千問在B端是非常有優勢的。

此次2.5版本的發布上,通義千問就打出了“最受企業歡迎的大模型”旗號。

數據顯示,目前,通義大模型已通過阿裏雲服務企業超9萬、通過釘釘服務企業超過220萬,通義開源模型累計下載量突破700萬。通義落地應用進程加速,現已進入PC、手機、汽車、航空、天文、礦業、教育、醫療、餐飲、遊戲、文旅等領域。

但在C端,相比較百度的文心一言,通義千問缺乏在C端産品應用場景的積累。去年12月,文心一言用戶便突破1億,今年4月,這一數據便翻番至2億。

顯然在用戶規模上,文心一言已經領先不少。這自然就給通義千問等通用大模型造成足夠的壓力。免費,也就不失爲與文心一言爭奪用戶的一條有效路徑。

而在這背後,阿裏在確立“AI電商”的戰略方向之後,AI這一環已然不容有失。

不僅僅是阿裏雲以通義大模型在通用大模型賽道參與“內卷”,阿裏也瘋狂地在市場上以投資的方式對大模型創業公司獨角獸進行“掃貨”。

公開信息顯示,截止目前,阿裏已經投了5家國內市場上的大模型獨角獸,分別是MiniMax、月之暗面、智譜AI、百川智能、零一萬物,是投資最爲激進的大廠。

並且在這些獨角獸的相關融資過程中,阿裏也多以領投方的角色出現。

足見阿裏的決心。

一方面是對AI的看重,另一方面,也跟阿裏在大模型賽道上的戰略有關。

無論是通義千問的免費,還是阿裏掃貨大模型獨角獸,阿裏最大的目標不是靠自研模型賺錢,而是爲一衆大模型提供雲計算能力,把握成爲AI算力基礎設施的機會。

但無論如何,都需要建立在通用大模型産品真正跑出來的前提下。

放到通義千問這個“親兒子”這裏,壓力也就不僅僅來自文心一言等友商,也來自于集團投資的其他“兄弟”。

來源|AI藍媒彙 作者|葉二

0 阅读:35

藍媒彙

簡介:藍媒彙由多位資深媒體人打造,專注互聯網産業報道!