零一萬物千億參數模型Yi-Large發布,基准測試登頂國産大模型,新MoE模型對打GPT-5

智東西 2024-05-13 19:45:58

作者| 程茜

編輯| 心緣

智東西5月13日報道,今天,在成立一周年之際,國內AI大模型獨角獸零一萬物重磅發布系列産品升級。

閉源模型方面,零一萬物發布全球SOTA千億參數閉源大模型Yi-Large,評測結果部分超越GPT-4,同時,零一萬物創始人及CEO李開複該公司正在訓練更大參數規模的MoE模型Yi-XLarge MoE。

在開源領域,零一萬物將早先發布的Yi-34B、Yi-9B、6B中小尺寸開源模型版本升級爲Yi-1.5系列,每個版本達到同尺寸中SOTA性能最佳。

開源地址:https://huggingface.co/01-ai

魔搭社區:https://www.modelscope.cn/organization/01ai

同時,李開複還介紹了一站式AI工作平台萬知,支持PC網頁和微信小程序使用,能做會議紀要、周報、寫作助手、PPT,解讀財報、論文等各類文件,同時可以在1-2分鍾內生成PPT。

零一萬物成立于去年5月,一周年之際其産品矩陣重磅升級,2023年11月發布首款預訓練大模型Yi-34B之後,其已經形成了面向開源、閉源和B端、C端的完整産品矩陣。

在媒體交流環節,李開複分享說,零一萬物的C端海外生産力應用今年收入預計將達到1~2億元,以國外用戶訂閱付費爲主。

通用人工智能(AGI)是李開複40多年來的夢想,據他透露,他曾在一年前向投資人承諾10年不套現,上市是零一萬物團隊未來兩年會努力的目標。

李開複看好國産芯片的發展,稱零一萬物將在合適的時候去采用國産芯片,同時創新工場一直在關注這方面的投資。零一萬物的模式比較務實,會持續探索如何用最少的芯片、最低的成本訓練出最好的模型。

此外,李開複也提到自己最近開了抖音號,將直播分享技術、産品以及一些觀點。

一、千億參數閉源大模型評測超GPT-4,已啓動Yi-XLarge MoE,將沖擊GPT-5性能

零一萬物發布全球SOTA千億參數閉源大模型Yi-Large,並同步開放API,允許開發者調用,在此基礎上還發布了一站式AI工作平台萬知。

李開複透露,經測試,Yi-Large評測結果已經至少達到對齊GPT-4,部分指標超越GPT-4。

在第三方測評結果中,Yi-Large在斯坦福英語測評中位居第二,僅次于GPT-4-Turbo,中文SuperCLUE結果中,位于國産大模型榜首。

此外,零一萬物正在訓練的基于MoE架構的更大模型Yi-XLarge MoE,目前初步訓練結果顯示,Yi-XLarge MoE的各個指標都已經超過Yi-Large,將沖擊GPT-5的性能與創新性。

在此前開源的6B、34B模型之上,今天,該公司宣布Yi-1.5開源系列同步升級,開源了6B、9B、34B不同參數規模,以及預訓練、Chat模型等,包括Yi-34B Base+Chat、Yi-9B Base+Chat、Yi-6B Base+Chat。

李開複稱,Yi-1.5系列模型已經全面超越Gemma、Mistral以及Llama-3-8B模型,測評結果顯示,Yi-1.5系列中34B模型在34B-50B模型中處于絕對領先地位,並且一些指標中表現甚至不遜色于70B模型。

那麽,開源、閉源模型如何見用戶?第一種方法是調用API,零一萬物宣布面向國內市場一次性發布了包含Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark等多款模型API接口。

此外,還有價錢相對較低的API,包括基于開源34B模型微調出的Yi-Vision、多模態視覺模型Yi-Vision以及參數規模更小的Yi-Spark。

目前零一萬物已經提供了免費的額度,供開發者使用,李開複透露說,初步接觸的開發者中有80%選擇從原來的模型轉移到使用零一萬物的模型。

據零一萬物API平台負責人藍雨川透露,Yi-Large API的定價是20元對應百萬tokens,大概是GPT-4 Turbo成本和定價的1/3,對比其他大尺寸模型同樣非常有競爭力。同時零一萬物還提供了更快更便宜的Yi-Large-Turbo。

二、一站式AI工作站萬知上線,速讀超長文檔,2分鍾生成PPT

零一萬物一站式AI工作站萬知有微信小程序和PC網頁版。用戶通過使用萬知既可以閱讀海量數據、分析圖表和文字,又可以在1-2分鍾內生成PPT。

李開複談道,所有應用都應該是AI原生,未來生産力工具的使用模式會徹底被顛覆,用戶提出指令,大模型就可以生成各種內容。

他現場展示了萬知的各項能力。

首先,當問到“我要做台灣鹵肉飯,請給我食材表格、和做法時間步驟的思維導圖”。萬知通過表格呈現了鹵肉飯的食譜,還通過思維導圖呈現了制作的步驟。

在回答關于北京的熱門演出時,萬知給出了具體的活動時間、地點,還會有甘特圖呈現出來,用戶根據自己的時間空閑就能清晰看到演出的具體信息。

萬知也可以快速閱讀理解PDF文檔、理解圖表。將PDF文檔上傳後,萬知在閱讀完成後,右邊就會生成總結和建議提問。

面對PDF中的單一圖表,萬知會根據上下文生成內容,如下圖中“關于2010年至2022年間按地理區域劃分的被授予AI專利百分比”的圖表,萬知會給出圖表的來源以及其中呈現出的明顯趨勢供用戶理解。

此外,萬知作爲生産力工具的場景中,還能快速生成PPT,當爲學生介紹什麽是AI,PPT內容需要深入淺出,還要有精彩的圖片。萬知首先會自動總結PPT內容應該涵蓋的重點,然後直接生成PPT。用戶如果對PPT中某一頁圖片不滿意,也可以通過AI增強搜圖快速換圖。

李開複稱,萬知生成的PPT比微軟Office Copilot的效果更好,一個PPT的制作時間大概在1-2分鍾左右。

三、大模型走向普惠,AI 2.0時代TC-PMF成關鍵

關于對未來的沉澱和展望,李開複談道,最近有一個熱門的討論:一些人認爲我們應該瘋狂追求AGI,AGI一旦發生就會改寫全部;另一部分人認爲模型做得越大越難用,我們應該快速找到PMF(産品市場匹配度)。

他認爲,這兩種觀點都對,但都不完整,沒有一家公司可以只靠技術長期領跑所有公司,一定是靠非技術優勢,也就是最終産品的勝出。

因此,企業不能忘記PMF重要性,但在AI 2.0時代還需要考慮TC-PMF(Product-Market-Technology-Cost Fit,技術成本 X産品市場契合度),其中T代表技術,C代表成本。

今天模型基于Scaling Law在快速演進,企業需要不斷預測未來技術的走向,同時整個行業的推理成本過高,社交、電商、短視頻等很多應用無法全面嵌入AI,企業需要不斷降低推理成本。

在應用方面,一般來說要實現最佳的AI-First應用,需要頂級模型才能實現。但有時候一些應用會先爆發,可以在更小的模型上實現。

針對上述這些現象與行業的痛點,李開複剖析了零一萬物一直以來堅持的4個發展原則。

首先,零一萬物的産品面向全世界,其單一産品今年收入達到1億人民幣,産品ROI接近1,上線9個月海外産品用戶數已經接近千萬。

第二個特點是模基共建,李開複談道,國外大廠的GPU數量達到國內創企的10倍以上,在這樣的背景下,零一萬物的模型和推理團隊有基本一樣的規模。

在訓練方面,零一萬物此前和英偉達合作,成爲全球前三實現FP8訓練的,也就是說可以從頭到尾使用FP8精度實現更快速訓練。他補充道,在這一技術的累積下, 其訓練成本相比同行能低一半左右。

第三個特點是持續重視用戶體驗,模型的價值産生在對用戶的價值,一個很典型的功能就是萬知對于圖表的分析,而不是普通照片的理解。

最後,對所有大模型玩家的一個考驗是,企業需要考慮如何同時開發産品、了解市場和用戶,還要關注技術發展的速度以及模型能力的演進、成本下降等。這裏所需要的能力Know-How,包括足夠的前瞻性,還需要是否可以以獨立的力量實現、執行力等。

李開複認爲,在此基礎上,零一萬物有四大優勢,零一萬物的技術、産品以及創新工廠的研究人員可以預測技術發展趨勢、對産品的打磨能力和耐心、投資人的預測能力、推理團隊不斷降低推理成本。

談到大模型能力轉化爲生産力所看重的市場反饋與數據指標,零一萬物生産力産品負責人曹大鵬分享說,産品在0-1階段重點關注長期留存率,包括能否産生用戶自發傳播的口碑,在1-100階段會更關注增長速度是否足夠快、商業模式和付費轉化等指標。

在打造AI-First應用時,零一萬物看重技術和成本,既要在模型能力上達到全球領先水平,又要從用戶視角出發,降低價格同時質量滿足用戶需求。

結語:開閉源矩陣雙輪驅動,零一萬物瞄准AI原生應用

成立一年,零一萬物的産品矩陣擁有開源、閉源模型,且應用方向涵蓋B端、C端,其正在基于底層大模型強大的理解推理能力,去挖掘用戶日常的核心痛點,如制作PPT、分析圖表等,使得AI原生的應用真正出現。

今年以來,在全面趕超國外頂尖大模型的同時,國內諸多大模型應用爆發,深入用戶生活、工作的方方面面,産業競爭的焦點正在轉移,未來隨著模型性能的進一步增強,以及這些應用與用戶的距離被拉近,AI原生應用的更多高價值場景將被挖掘出來。

0 阅读:22

智東西

簡介:智能産業第一媒體!聚焦智能變革,服務産業升級。