新火種AI|微軟扶持下一個OpenAI?MistralAI新模型對標GPT-4

新火種 2024-02-27 21:45:57

作者:一號

編輯:美美

OpenAI的大金主微軟,還想締造“下一個OpenAI”。

周一晚間,成立僅9個月的Mistral AI正式發布了最強力的旗艦模型Mistral Large。和此前他們所推出的一系列模型不同,Mistral AI本次發布的版本性能更強,體量也更大,直接對標OpenAI的GPT-4。

 

在目前所有能夠通過API訪問的大模型中,Mistral Large排名第二,僅次于“當紅明星”GPT-4,並且和GPT-4一樣,是唯二在MMLU考試中拿到了80分以上的。

而且隨著Mistral Large上線,Mistral AI還推出了名爲Le Chat的聊天機器人,對標ChatGPT,大有複制OpenAI成功道路的意圖。即便有微軟Azure算力資源的加持,Le Chat的服務器還是被擠爆了。

忘了初心,開源變閉源?

早在本次Mistral Large“炸街”之前,Mistral AI所提出的Mistral-Medium就因爲其強大的性能,還有令人意外的開源而名噪一時。使得不少的大模型初創企業不再對標Llama2這個開源模型,而是轉而將Mistral旗下的模型作爲直接競爭對手。這一次Mistral Large的橫空出世,自然引人注目。

從性能上來說,盡管Mistral Large在參數量上還比不上GPT-4,但在一些關鍵性能上,它還是能夠和GPT-4一戰的,可以說,已經是當前業內前三的地位。

 

在推理准確性上,Mistral Large也已經超過了Claude 2、Gemini 1.0 Pro、GPT-3.5等一衆爲人所熟知的大模型,並且它還支持32k token的上下文窗口,支持精確指令,自帶函數調用能力。在推理速度上,Mistral Large甚至還超過了GPT-4還有谷歌剛推出不久的Gemini Pro。

但有眼尖的網友發現,Mistral修改了網站內容,刪除了所有提及開源社區義務的內容,這讓不少開源大模型愛好者開始擔心,Mistral AI也會像OpenAI一樣,從開放走向封閉。

 

不過據媒體對Mistral CEO的采訪,未來他們依舊會堅持開源理念,但與此同時,也會推出性能最爲強大的閉源模型來參與商業競爭。

從誕生之初,就充滿傳奇光環

誰能想到,今天這個逼近GPT-4的模型,是來自一家僅僅成立9個月的法國公司。

Mistral AI的創始人Arthur Mensch在1993年時出生于法國。在巴黎綜合理工學院和巴黎高等師範學院學習期間,他結識了後來成爲Mistral AI聯合創始人的Timothée Lacroix和Guillaume Lample。而後兩位都曾在Meta AI團隊工作過,其中Lample還領導了LLaMA模型的開發。在那時,全球範圍內具備構建、訓練和優化大型語言模型(LLM)專業經驗的人才不超過100人。

 

Arthur Mensch本人也頗有實力。他在2020年初便加入了谷歌,成爲了DeepMind的研究員,專注于提高AI和機器學習系統的效率。在那裏,他參與開發了大型語言模型,並以主要作者的身份發表了著名的“Chinchilla論文”,該研究重新定義了人們對AI模型大小、訓練數據量及其性能之間關系的認識。

然而隨著AI競賽的升溫,Mensch對于大公司AI實驗室減少與研究社區分享研究成果的做法感到失望。他所在的團隊從一個10人的小團隊迅速擴大到70人的大團隊,但他覺得在大型科技公司中開發不透明的技術過于官僚化,于是決定離開。

 

2023年初,他離開了谷歌,和前文所提到的Lacroix和Lample一起創立了Mistral AI。他們的目標是通過更加高效的方法構建和部署AI模型,並堅持開源模型的原則,希望讓每個人對自己使用的AI有更多的控制權。

在種子輪融資時,Mistral AI的故事更具傳奇色彩:一個6人團隊憑借著7頁PPT就拿到了8億歐元的融資。而當前公司的估值已經達到了20億美元,漲了七倍多。盡管與美國的競爭者相比,所獲得的資金並不算多,但他們的目標是成爲AI領域中最節省資本的公司。

微軟想要打造下一個OpenAI?

在Mistral Large以令人驚喜的性能收獲目光之時,微軟CEO納德拉宣布,微軟已經和Mistral AI建立了多年合作夥伴關系。這也是微軟繼OpenAI之後,又再一次地把“真金白銀”投給了AI圈的另一家頂流模型公司。

 

人們不禁懷疑,微軟這是想要打造“下一個OpenAI”?

根據公告,微軟和Mistral AI的合作將集中在以下三個關鍵領域:

超算基礎結構:微軟將通過Azure AI超算基礎結構支持Mistral AI,用于AI訓練和推理工作負載。

擴展市場:微軟和 Mistral AI 將通過 Azure AI Studio 和 Azure 機器學習模型目錄中的模型即服務(MaaS)向客戶提供 Mistral AI 的高級模型。除 OpenAI 模型外,模型目錄還提供了多種開源和商業模型。

人工智能研發:微軟和 Mistral AI 將探索爲特定客戶訓練特定目的模型的合作。

毫無疑問,除了OpenAI之外,微軟還想給自己的Azure雲服務吸引更多客戶。並且,微軟兩頭下注,實際上很可能是想要分散風險,並且期望獲得更大的影響力。

去年11月,OpenAI經曆了CEO奧特曼被解雇而後又重返的董事會風波。而作爲OpenAI的最大股東,微軟直到消息公布之前的5到10分鍾才從OpenAI那裏得到消息。盡管在這場風波之後,微軟設法在控制 OpenAI 的非營利性董事會中獲得了一個無投票權的觀察員席位,這讓他們對OpenAI的內部運作有了更多的了解,但在一些重大決策上,微軟依舊沒有投票權。

微軟作爲OpenAI的最大金主,顯然沒在OpenAI的決策上取得與之相對應的影響力。因此,微軟想要扶持另一家能夠與OpenAI對位的企業也是情理之中。

這一點,在路透社對Mistral AI的采訪中也得到了體現,Mistral AI承認,作爲交易的一部分,微軟將持有該公司少數股權,但並沒有透露更多細節。而微軟這邊則僅僅是證實了其對Mistral的投資,在是否持有該公司股權的問題上,微軟給出了否定的回答。而這很可能與微軟因向OpenAI提供了巨額資金而受到歐洲和美國監管機構的審查有關。

 

另外,由于Mistral AI是一家法國公司,在語言支持上也更加偏向于歐洲本土語言,因此微軟投資Mistral AI也是想要在歐洲建立起自己的AI影響力,在歐洲AI領域站穩腳跟。

與美國不同,歐洲許多國家對AI的態度偏保守,持批判性看法,尤其是數據保護方面。因此投資一家歐洲本土的AI企業,打造一家“歐洲版OpenAI”,也許能夠更讓人放心。

0 阅读:1

新火種

簡介:讓一億人用上AI