微軟將推出自研5000億個參數的大模型：MAI-1

2024 年 5 月 7 日，《The Information》報道，微軟正在開發一個擁有大約 5000 億個參數的大語言模型（LLM）。

這標志著微軟自從往 OpenAI 投資逾 100 億美元，以便可以重複使用這家初創公司的 AI 模型以來，首次自行開發這等規模的 AI 模型。

該 LLM 在微軟內部被稱爲 MAI-1，預計最早將于本月首次亮相。

OpenAI 在 2020 年年中推出 GPT-3 時，詳細說明該模型的初始版本有 1750 億個參數。該公司透露，GPT-4 更龐大，擁有更多的參數，但尚未透露具體數字。

一些報道顯示，OpenAI 的旗艦 LLM 擁有 1.76 萬億個參數，而谷歌的 Gemini Ultra 據稱擁有 1.6 萬億個參數，性能與 GPT-4 旗鼓相當。

微軟的 MAI-1 擁有 5000 億個參數，這表明它可能被定位爲介于 GPT-3 和 GPT-4 之間的某種中檔模型。這樣的配置將允許模型提供高響應准確度，但耗用的功率比 OpenAI 的旗艦 LLM 低得多。言外之意，這將爲微軟帶來更低的推理成本。

開發 MAI-1 的工作由 LLM 開發商 Inflection AI Inc.的創始人 Mustafa Suleyman 監管。

Mustafa Suleyman

今年 3 月，通過一筆價值 6.25 億美元的交易，Suleyman 和這家初創公司的大多數員工一起加入了微軟。這位高管早些時候與他人共同創立了谷歌的DeepMind AI 研究部門。

微軟可能使用 Inflection AI 的訓練數據及另外某些資産來驅動 MAI-1。

據稱，該模型的訓練數據集還包含多種類型的信息，包括 GPT-4 和互聯網內容生成的文本。

爲《The Information》提供信源的知情人士表示，微軟尚未決定它將如何使用 MAI-1。如果這個模型確實擁有 5000 億個參數，那麽它太過複雜了，無法在消費級設備上運行。這意味著微軟很可能會將 MAI-1 部署在其數據中心，那樣 LLM 可以集成到必應和 Azure 之類的服務中。

據信，微軟可能會在 5 月 16 日召開的 Build 開發者大會上展示MAI-1，如果到時候該模型的表現足夠令人滿意的話。這暗示該公司預計會在幾周內推出該模型的工作原型（如果目前還沒有工作原型的話）。

就在不到兩周前，微軟剛剛開源了一種名爲 Pi-3 Mini 的語言模型。據微軟聲稱，這種模型僅擁有 38 億個參數，但性能卻比參數多 10 倍的 LLM 更勝一籌。Pi-3 是一個 AI 系列的一部分，該系列還包括另外兩個更龐大的、性能略勝一籌的神經網絡。

開發 MAI-1表明微軟內部對 AI采取了雙管齊下的做法，既關注面向移動設備的本地運行的小型語言模型，也關注由雲支持的大型先進模型。據報道，蘋果也在探索類似的做法。這也凸顯了微軟不依賴OpenAI 探索 AI 開發的意願，OpenAI的技術目前支持微軟最雄心勃勃的生成式 AI 功能，包括嵌入到 Windows 中的聊天機器人。

文采家

微軟將推出自研5000億個參數的大模型：MAI-1

聊點雲上事兒