零一萬物千億參數模型Yi-Large發布，基准測試登頂國産大模型，新MoE模型對打GPT-5

作者| 程茜

編輯| 心緣

智東西5月13日報道，今天，在成立一周年之際，國內AI大模型獨角獸零一萬物重磅發布系列産品升級。

閉源模型方面，零一萬物發布全球SOTA千億參數閉源大模型Yi-Large，評測結果部分超越GPT-4，同時，零一萬物創始人及CEO李開複該公司正在訓練更大參數規模的MoE模型Yi-XLarge MoE。

在開源領域，零一萬物將早先發布的Yi-34B、Yi-9B、6B中小尺寸開源模型版本升級爲Yi-1.5系列，每個版本達到同尺寸中SOTA性能最佳。

開源地址：https://huggingface.co/01-ai

魔搭社區：https://www.modelscope.cn/organization/01ai

同時，李開複還介紹了一站式AI工作平台萬知，支持PC網頁和微信小程序使用，能做會議紀要、周報、寫作助手、PPT，解讀財報、論文等各類文件，同時可以在1-2分鍾內生成PPT。

零一萬物成立于去年5月，一周年之際其産品矩陣重磅升級，2023年11月發布首款預訓練大模型Yi-34B之後，其已經形成了面向開源、閉源和B端、C端的完整産品矩陣。

在媒體交流環節，李開複分享說，零一萬物的C端海外生産力應用今年收入預計將達到1~2億元，以國外用戶訂閱付費爲主。

通用人工智能（AGI）是李開複40多年來的夢想，據他透露，他曾在一年前向投資人承諾10年不套現，上市是零一萬物團隊未來兩年會努力的目標。

李開複看好國産芯片的發展，稱零一萬物將在合適的時候去采用國産芯片，同時創新工場一直在關注這方面的投資。零一萬物的模式比較務實，會持續探索如何用最少的芯片、最低的成本訓練出最好的模型。

此外，李開複也提到自己最近開了抖音號，將直播分享技術、産品以及一些觀點。

一、千億參數閉源大模型評測超GPT-4，已啓動Yi-XLarge MoE，將沖擊GPT-5性能

零一萬物發布全球SOTA千億參數閉源大模型Yi-Large，並同步開放API，允許開發者調用，在此基礎上還發布了一站式AI工作平台萬知。

李開複透露，經測試，Yi-Large評測結果已經至少達到對齊GPT-4，部分指標超越GPT-4。

在第三方測評結果中，Yi-Large在斯坦福英語測評中位居第二，僅次于GPT-4-Turbo，中文SuperCLUE結果中，位于國産大模型榜首。

此外，零一萬物正在訓練的基于MoE架構的更大模型Yi-XLarge MoE，目前初步訓練結果顯示，Yi-XLarge MoE的各個指標都已經超過Yi-Large，將沖擊GPT-5的性能與創新性。

在此前開源的6B、34B模型之上，今天，該公司宣布Yi-1.5開源系列同步升級，開源了6B、9B、34B不同參數規模，以及預訓練、Chat模型等，包括Yi-34B Base+Chat、Yi-9B Base+Chat、Yi-6B Base+Chat。

李開複稱，Yi-1.5系列模型已經全面超越Gemma、Mistral以及Llama-3-8B模型，測評結果顯示，Yi-1.5系列中34B模型在34B-50B模型中處于絕對領先地位，並且一些指標中表現甚至不遜色于70B模型。

那麽，開源、閉源模型如何見用戶？第一種方法是調用API，零一萬物宣布面向國內市場一次性發布了包含Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark等多款模型API接口。

此外，還有價錢相對較低的API，包括基于開源34B模型微調出的Yi-Vision、多模態視覺模型Yi-Vision以及參數規模更小的Yi-Spark。

目前零一萬物已經提供了免費的額度，供開發者使用，李開複透露說，初步接觸的開發者中有80%選擇從原來的模型轉移到使用零一萬物的模型。

據零一萬物API平台負責人藍雨川透露，Yi-Large API的定價是20元對應百萬tokens，大概是GPT-4 Turbo成本和定價的1/3，對比其他大尺寸模型同樣非常有競爭力。同時零一萬物還提供了更快更便宜的Yi-Large-Turbo。

二、一站式AI工作站萬知上線，速讀超長文檔，2分鍾生成PPT

零一萬物一站式AI工作站萬知有微信小程序和PC網頁版。用戶通過使用萬知既可以閱讀海量數據、分析圖表和文字，又可以在1-2分鍾內生成PPT。

李開複談道，所有應用都應該是AI原生，未來生産力工具的使用模式會徹底被顛覆，用戶提出指令，大模型就可以生成各種內容。

他現場展示了萬知的各項能力。

首先，當問到“我要做台灣鹵肉飯，請給我食材表格、和做法時間步驟的思維導圖”。萬知通過表格呈現了鹵肉飯的食譜，還通過思維導圖呈現了制作的步驟。

在回答關于北京的熱門演出時，萬知給出了具體的活動時間、地點，還會有甘特圖呈現出來，用戶根據自己的時間空閑就能清晰看到演出的具體信息。

萬知也可以快速閱讀理解PDF文檔、理解圖表。將PDF文檔上傳後，萬知在閱讀完成後，右邊就會生成總結和建議提問。

面對PDF中的單一圖表，萬知會根據上下文生成內容，如下圖中“關于2010年至2022年間按地理區域劃分的被授予AI專利百分比”的圖表，萬知會給出圖表的來源以及其中呈現出的明顯趨勢供用戶理解。

此外，萬知作爲生産力工具的場景中，還能快速生成PPT，當爲學生介紹什麽是AI，PPT內容需要深入淺出，還要有精彩的圖片。萬知首先會自動總結PPT內容應該涵蓋的重點，然後直接生成PPT。用戶如果對PPT中某一頁圖片不滿意，也可以通過AI增強搜圖快速換圖。

李開複稱，萬知生成的PPT比微軟Office Copilot的效果更好，一個PPT的制作時間大概在1-2分鍾左右。

三、大模型走向普惠，AI 2.0時代TC-PMF成關鍵

關于對未來的沉澱和展望，李開複談道，最近有一個熱門的討論：一些人認爲我們應該瘋狂追求AGI，AGI一旦發生就會改寫全部；另一部分人認爲模型做得越大越難用，我們應該快速找到PMF（産品市場匹配度）。

他認爲，這兩種觀點都對，但都不完整，沒有一家公司可以只靠技術長期領跑所有公司，一定是靠非技術優勢，也就是最終産品的勝出。

因此，企業不能忘記PMF重要性，但在AI 2.0時代還需要考慮TC-PMF（Product-Market-Technology-Cost Fit，技術成本 X産品市場契合度），其中T代表技術，C代表成本。

今天模型基于Scaling Law在快速演進，企業需要不斷預測未來技術的走向，同時整個行業的推理成本過高，社交、電商、短視頻等很多應用無法全面嵌入AI，企業需要不斷降低推理成本。

在應用方面，一般來說要實現最佳的AI-First應用，需要頂級模型才能實現。但有時候一些應用會先爆發，可以在更小的模型上實現。

針對上述這些現象與行業的痛點，李開複剖析了零一萬物一直以來堅持的4個發展原則。

首先，零一萬物的産品面向全世界，其單一産品今年收入達到1億人民幣，産品ROI接近1，上線9個月海外産品用戶數已經接近千萬。

第二個特點是模基共建，李開複談道，國外大廠的GPU數量達到國內創企的10倍以上，在這樣的背景下，零一萬物的模型和推理團隊有基本一樣的規模。

在訓練方面，零一萬物此前和英偉達合作，成爲全球前三實現FP8訓練的，也就是說可以從頭到尾使用FP8精度實現更快速訓練。他補充道，在這一技術的累積下，其訓練成本相比同行能低一半左右。

第三個特點是持續重視用戶體驗，模型的價值産生在對用戶的價值，一個很典型的功能就是萬知對于圖表的分析，而不是普通照片的理解。

最後，對所有大模型玩家的一個考驗是，企業需要考慮如何同時開發産品、了解市場和用戶，還要關注技術發展的速度以及模型能力的演進、成本下降等。這裏所需要的能力Know-How，包括足夠的前瞻性，還需要是否可以以獨立的力量實現、執行力等。

李開複認爲，在此基礎上，零一萬物有四大優勢，零一萬物的技術、産品以及創新工廠的研究人員可以預測技術發展趨勢、對産品的打磨能力和耐心、投資人的預測能力、推理團隊不斷降低推理成本。

談到大模型能力轉化爲生産力所看重的市場反饋與數據指標，零一萬物生産力産品負責人曹大鵬分享說，産品在0-1階段重點關注長期留存率，包括能否産生用戶自發傳播的口碑，在1-100階段會更關注增長速度是否足夠快、商業模式和付費轉化等指標。

在打造AI-First應用時，零一萬物看重技術和成本，既要在模型能力上達到全球領先水平，又要從用戶視角出發，降低價格同時質量滿足用戶需求。

結語：開閉源矩陣雙輪驅動，零一萬物瞄准AI原生應用

成立一年，零一萬物的産品矩陣擁有開源、閉源模型，且應用方向涵蓋B端、C端，其正在基于底層大模型強大的理解推理能力，去挖掘用戶日常的核心痛點，如制作PPT、分析圖表等，使得AI原生的應用真正出現。

今年以來，在全面趕超國外頂尖大模型的同時，國內諸多大模型應用爆發，深入用戶生活、工作的方方面面，産業競爭的焦點正在轉移，未來隨著模型性能的進一步增強，以及這些應用與用戶的距離被拉近，AI原生應用的更多高價值場景將被挖掘出來。

文采家

零一萬物千億參數模型Yi-Large發布，基准測試登頂國産大模型，新MoE模型對打GPT-5

智東西