微軟押注“歐洲版OpenAI”,Mistral新模型直追GPT-4,這次不開源了

36氪 2024-02-28 17:00:32

文|王怡甯

編輯|鄧詠儀

封面來源|IC Photo

OpenAI最近可能很忙——Google前腳還沒發完Gemini Pro模型,後腳又來一位新秀要同台對壘。

北京時間2月27日淩晨,法國開源大模型公司Mistral AI正式發布Mistral Large模型,從各種基准測試結果來看,都強勢對標GPT-4。

這還沒完。就在同一天,微軟也正式宣布,與Mistral AI達成合作。

△圖源:X

成立于2023年5月的Mistral AI,是近期的AI圈內當之無愧的香饽饽、新興獨角獸公司。在OpenAI轉閉源路線之後,高舉開源大旗,喊出“要讓GenAI(生成式AI)爲所有企業所用,完全開源。”的Mistral AI,也被認爲是OpenAI的有力競爭者。

微軟此前一直以OpenAI的堅定支持者形象出現,其AI生態系統Copilot也與OpenAI深度綁定,此次突然宣布與Mistral AI合作,讓很多人感到出乎意料。

△圖源:網絡

而且,微軟自己的AI動作絲毫沒有放松的迹象,就在2月26日,微軟也才宣布了自家的Copilot GPTs上線。目前的Copilot更是有OpenAI的各項最新技術加持,性能不可謂不強。

這個關頭再把Mistral AI納入麾下,這是爲啥?有網友直接在評論區發問:

是現在的Copilot不夠強大嗎?

△圖源:X

強勢對標GPT-4,但這次沒開源

此前,Mistral其實已經正式發布了規模更小的Mistral Small和Medium版本。這次,Mistral宣布正式推出的是超大杯版本——大模型Mistral Large。

Mistral Large在英語、法語、西班牙語、德語和意大利語中都具有原生的流利程度,對語法和文化背景有細致的理解。另外,其上下文窗口爲32K,也允許用戶從大型文檔中精確召回信息。

根據官方數據,Mistral Large在基礎測試中的表現出色,以81.2%的分數超越了谷歌Gemini Pro、GPT-3.5、Meta Llama 2-70B三款模型,成爲僅次于GPT-4、世界第二大可通過API訪問的AI大模型。

△圖源:Mistral AI

不僅如此,Mistral AI還宣布要推出名爲Le Chat的聊天助手,不過這個産品仍在測試當中。

據科技媒體TechCrunch,Mistral AI的商業模式也越來越像OpenAI——通過付費API提供Mistral Large,並基于使用量定價。目前,查詢Mistral Large每百萬個輸入token的費用爲8美元,每百萬個輸出token的費用爲24美元。和GPT-4的32k版本相比,Mistral Large便宜5到7.5倍左右。

智能湧現此前也報道過這家來自法國的明星獨角獸公司。Mistral AI成立于2023年5月,公司創始人團隊來自DeepMind和Meta等研究團隊,很多創始成員,也是爲大模型領域基礎技術做出關鍵貢獻的人才。

在成立半年後,這家僅僅20人規模的公司就籌集了3.85億歐元(約4.15億美元),估值達20億美元。

△圖源:Mistral AI

支持其高估值的,是Mistral AI強大的模型表現。

2023年11月,Mistral AI推出的開源MoE模型Mixtral8x7B,就曾引起AI界的廣泛討論。Mixtral8x7B采用小模型組合,跑分全面超越GPT-3.5,更在多個跑分上超過了Llama2 70B,並且推理速度還是後者的6倍,在當時就被稱爲被稱爲“最強小模型”。

此時正值在OpenAI轉閉源路線後,Mistral AI亮眼的數據表現和專攻小模型的路線,一度讓楊立昆(Yann Lecun)等領軍人物爲其站台,也盛贊其是“開源希望”。

但現在,Mistral AI是否還是開源路線的扛把子,得打個問號。

這次,Mistral AI發布的Large模型就沒有開源,還悄悄在官網把所有有關開源社區義務的內容全部撤掉了,讓不少網友懷疑——Mistral AI是否也要走上OpenAI開源轉閉源的老路?

△Mistral AI刪除官網上的開源承諾。圖源:X

對此,Mistral的CEO對外回複表示,團隊未來依然會堅持開源理念,同時也會推出更強大的閉源模型參與商業競爭。目前,開源模型包括“Mistral 7B”、“Mistral 8 x 7B”都是以模型規模命名的,而基于商業化考量的模型則以“大中小”的方式來命名。

雞蛋不放在一個籃子,微軟:我全都要

無論模型層的廠商們打得怎麽難舍難分,現在漁翁得利的,是手握OpenAI和Mistral AI兩枚大將的微軟。

事實上,此前微軟就表現出了對Mistral AI的欣賞和興趣。

2023年11月,在微軟的Ignite大會上,微軟就公布了將Mistral 7B集成到Azure AI模型目錄中的消息。Mistral AI在技術上穩定持續的優異表現也吸引了微軟推動合作的深入。

而對本次的合作,微軟反複突出的一點是:此次合作是對兩家公司的雙贏選擇。

此後,雙方的深度合作將圍繞三方面來展開:

算力:微軟將通過Azure AI超級計算基礎設施支持Mistral AI,爲Mistral AI旗艦模型的AI訓練和推理工作負載提供一流的性能和規模。

渠道合作:和OpenAI的合作模式一樣,微軟自家的模型即服務 (MaaS) 也將會向微軟的全球客戶提供Mistral AI的高級模型。

人工智能研究和開發:微軟和Mistral AI將探索圍繞爲特定客戶(包括歐洲公共部門)培訓特定目的模型的合作。

簡言之,雙方達成深度合作後,Mistral AI能夠利用Azure的尖端人工智能基礎設施,加快其下一代大型語言模型的開發和部署。另外,雙方的合作也可以幫助這家來自巴黎的獨角獸公司加速拓展全球市場。

不過,微軟此舉也讓不少網友疑惑,微軟與OpenAI之間的合作關系是否出現重要轉折?

此前,微軟曾大手筆投資OpenAI,甚至兩家公司的CEO還曾多次爲對方站台,Sam Altman此前能夠在公司內亂中成功回歸重掌大權,也離不開微軟在背後的強力支持和斡旋。

△微軟CEO 納德拉爲OpenAI Dev Day站台

但想要不斷擴大業務規模的兩家公司,勢必會面臨從合作到正面競爭的關系。福布斯此前就預言,2024年AI圈的十大事件之一,將是微軟與OpenAI“蜜月期”的結束。

雞蛋也不能只放在OpenAI一家籃子裏。微軟不僅僅在自家模型上提供了多元化的選擇,自己也在開發新的小模型。

1月24日,據The information就援引兩位知情人士透露,微軟正在組建新的GenAI團隊,將專注于開發更小的語言模型(SLM) 。新團隊將由微軟公司副總裁Misha Bilenko和首席技術官Scott領導,微軟還將數名頂級人工智能開發人員從其研究團隊調至新的GenAI團隊,其中包括微軟研究院首席研究員Sébastien Bubeck。

2023年12月中旬,微軟發布了只有27億參數的小模型Phi-2。在規模上下功夫,有效降低使用大模型的成本。這也是微軟與Mistral AI目標上的一致之處。

很多舉措都顯示,微軟不僅要在Copilot中爲用戶提供最好的技術服務,比如OpenAI的ChatGPT、DALL·E3和Sora,更要努力擺脫對單一公司的依賴。

模型之外,微軟在AI時代的版圖,還在持續布局中。

就在2月20日,The information援引一位知情人士透露,微軟正在開發一種網卡,作爲英偉達網卡的替代品,以確保數據在其服務器之間快速傳輸。除了節省資金外,微軟還希望新的網絡設備能改善其英偉達芯片服務器的性能。此前,微軟已經開發了自己的Maia AI服務器芯片,今年將安裝在數據中心。

△圖源:微軟官網

2月21日,微軟又宣布和英特爾達成了一項數十億美元的芯片交易,讓後者爲其代工生産定制芯片。彭博社也指出,微軟一直在計劃爲處理器和人工智能加速器進行內部設計。

歡迎交流

0 阅读:1