且慢歡呼,今晨亮相的GPT-4O的4個意想不到

邁步看大勢 2024-05-15 02:02:10

北京時間5月14日淩晨,OpenAI公布了最新的GPT-4o,o代表Omnimodel(全能模型)。美國媒體倒沒什麽,中國的自媒體連夜做報道,一片驚呼。

如果你仔細看看OpenAI發布的內容,你會發現OpenAI發展慢了,産品化的東西少了,産品的焦慮更大了。

不過,OpenAI的發布,有5個意想不到,確實值得關注。

一是産品。從GPT-4,人們期望OpenAI發布GPT-4.5或者GPT-5,讓大模型實現質的飛躍。

業內對OpenAI的期待太高,除非是GPT-5這樣的顛覆式創新,否則很難滿足觀衆的“胃口”。

雖然Sam Altman在OpenAI線上直播前,已經預告不會發布GPT-5(或GPT-4.5),但外界對OpenAI的期待早已是九牛拉不轉了。

最終,公布了最新的GPT-4o,o代表Omnimodel(全能模型)。雖然GPT-4o的演示效果仍可稱得上“炸裂”,但業內人士普遍認爲很難配得上Altman預告中的“魔法”二字。很多人認爲,這些功能性的産品,都是“偏離OpenAI使命”的。

二是ChatGPT搜索引擎沒有推出。在關于搜索引擎即將進入 ChatGPT 的傳言中,OpenAI 今天表示,它將在周一演示其 AI 聊天機器人和 GPT-4 的更新。但首席執行官山姆·奧特曼(Sam Altman)表示,該活動將不包括GPT-5或搜索引擎的推出。相反,他承諾“一些我們認爲人們會喜歡的新東西,對我來說就像魔術一樣。

如果我們真的得到了一個 OpenAI 搜索引擎,它與 ChatGPT 已經做的事情有什麽不同?

ChatGPT 的免費版本沒有連接到網絡,因此它無法在其回複中鏈接到引用的來源。它也沒有 2022 年 1 月之後的數據,因爲它是從固定的數據主體中提取的。ChatGPT Plus 克服了這兩個問題,但每月收費 20 美元。今年 3 月,OpenAI 爲付費用戶提供了更突出的鏈接。

也許搜索産品是免費的,可以像谷歌一樣在網絡上搜索,但更像人性化,對話式的聊天機器人會帶來更多。

三是免費漫天飛,但是國內能否用不得而知。OpenAI 的首席技術官 Mira Murati說,以後 OpenAI 做産品就是要免費優先,爲的就是讓更多的人能使用。

最近,ChatGPT 不用注冊也可以使用了,今天又增加了桌面程序,OpenAI 的目標就是讓人們可以隨時隨地的無感使用它,讓 ChatGPT 集成在你的工作流中。這 AI 現在就是生産力了。

OpenAI 在一個模型中集成了所有模態,大幅提升了大模型的實用性。

GPT-4o 提供了「GPT-4 水准」的智能,但在 GPT-4 的基礎上改進了文本、視覺和音頻方面的能力,將在未來幾周內「叠代式」地在公司産品中推出。

而在 GPT-4o 上,OpenAI 跨文本、視覺和音頻端到端地訓練了一個新模型,這意味著所有輸入和輸出都由同一神經網絡處理。

GPT-4o不僅通過縮短延遲極大地提升了體驗,還在GPT-4的基礎上做了很多升級包括:

·極佳的多模態交互能力,包括語音、視頻,以及屏幕共享。

·可以實時識別和理解人類的表情,文字,以及數學公式。

·交互語音感情豐富,可以變換語音語調、風格,還可以模仿,甚至“即興”唱歌。

·超低延時,且可以在對話中實時打斷AI,增加信息或開啓新話題。

·所有ChatGPT用戶均可免費使用(有使用上限)。

·速度是GPT-4 Turbo的2倍,API成本低50%,速率限制高5倍。

「從技術角度來看,OpenAI 已經找到了一種方法,可以將音頻直接映射到音頻作爲一級模態,並將視頻實時傳輸到 transformer。這些需要對 token 化和架構進行一些新的研究,但總體來說是一個數據和系統優化問題(大多數事情都是如此)。」英偉達科學家 Jim Fan 如此評論道。

0 阅读:0

邁步看大勢

簡介:感謝大家的關注