李彥宏:開發大模型,百度踩了無數坑,交了高昂學費

華爾街科技眼 2024-04-16 17:27:18

文/侯煜

編輯/吳妍

今日,Create 2024百度AI開發者大會在粵港澳大灣區舉辦。面對現場來了5000多位開發者和科技愛好者。百度集團創始人李彥宏跟創業者、開發者交流,分享了自己對大模型和生成式AI的洞見。

大模型和生成式AI,將徹底改變開發者

李彥宏認爲,過去,開發者用代碼改變世界;未來,自然語言將成爲新的通用編程語言,你只要會說話,就可以成爲一名開發者,用自己的創造力改變世界。

“這一天並不遙遠,我們看到,因爲有了強大的基礎大模型,有了很多低門檻,甚至零門檻的開發工具,開發者的生産力大大提高了”。

李彥宏舉例,基于文心大模型的智能代碼助手Comate,不僅支持100多種語言和所有主流IDE平台,可以推薦代碼、生成代碼注釋、查找代碼缺陷、給出優化方案,還可以深度解讀代碼庫、關聯私域知識生成新的代碼。上崗一年多,Comate已經走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業,生成的代碼采納率達到了46%,百度每天新增的代碼中,已經有27%是由Comate生成的。

李彥宏對開發者說:“今天,你不會寫代碼,也可以做出一個AI應用;不用編程,也可以做出一個智能體。AI正在掀起一場創造力革命,未來開發應用就像拍個短視頻一樣簡單,人人都是開發者,人人都是創造者。”

基于大模型,百度開發各種應用工具

作爲一家技術公司,百度的角色定位,就是盡可能地爲大家提供所需的開發工具。具體來說,就是提供1個強大的基礎模型系列,就是文心大模型系列,這包括旗艦版的ERNIE3.5, ERNIE4.0, 也包括輕量版的ERNIE Speed、Lite、Tiny等等。

李彥宏介紹,百度還提供基于大模型來開發各種應用的工具,包括:

Ø 智能體開發工具AgentBuilder,

Ø AI原生應用開發工具AppBuilder,

Ø 各種尺寸的模型定制工具ModelBuilder。

以上這三個工具,都代表了先進生産力。

文心一言用戶突破2億

文心一言從去年3月16日發布,到今天是一年零一個月的時間。其用戶數突破了2億,API日均調用量也突破了2億,服務的客戶數達到了8.5萬,利用千帆平台開發的AI原生應用數超過了19萬。(詳見:《文心一言毀譽參半,卻成爲百度業績增長新杠杆》)

李彥宏指出,文心一言正在改變更多人的工作和生活。

支撐文心一言的基座模型,就是文心大模型。過去一年,文心一言經曆了從3.0版本到3.5,再到4.0版本的進化。文心4.0在理解、生成、邏輯、記憶四大能力方面,均達到了業界領軍水平。

近幾個月來,文心大模型在代碼生成、代碼解釋、代碼優化等通用能力方面實現了進一步的顯著提升,達到國際領先水平。

今天,我們正式發布文心大模型4.0的工具版,現在,大家可以在工具版上,體驗代碼解釋器功能,通過自然語言交互,就能實現對複雜數據和文件的處理與分析,還可以生成圖表或文件,能夠快速洞察數據中的特點、分析變化趨勢、爲後續的決策提供高效精准的支撐。

文心大模型已經成爲了中國最領先、應用最廣泛的AI基礎模型。

不僅如此,相比一年前,文心大模型的算法訓練效率提升到了原來的5.1倍,周均訓練有效率達到98.8%,推理性能提升了105倍,推理的成本降到了原來的1%。

也就是說,客戶原來一天調用1萬次,同樣成本現在可以調用100萬次。媒體可能不會因爲成本下降99%而興奮。但是企業也好,開發者也好,一旦用起來,最關注的就是效果和成本。

我們能在提升性能的同時,把推理成本降到1%,正是因爲百度在芯片、框架、模型、應用這四層架構上有著全棧的布局,通過端到端優化,不斷地把成本打下來,讓更多人都可以高效、低價地用大模型來做AI應用。

李彥宏特別強調,大模型本身並不直接創造價值,基于大模型開發出來的AI應用才能滿足真實的市場需求。百度在過去一年大模型的實踐中,踩了無數的坑,交了高昂的學費。(詳見:《敢打仗的景鲲離場,百度硬件生態戰略該叫停!》)之後李彥宏向開發者分享了基于大模型開發AI原生應用的具體思路和工具。

Ø 第一是MoE。未來大型的AI原生應用基本都是MoE架構,這裏所說的MoE不是一般的學術概念,而是大小模型的混用,不依賴一個模型來解決所有問題。但什麽時候調用小模型、什麽時候調用大模型、什麽時候不調用模型,這都是有技術含量的,要針對應用的不同場景做匹配。

Ø 第二是小模型。小模型推理成本低,響應速度快,在一些特定場景中,經過SFT精調後的小模型,它的使用效果可以媲美大模型。百度Speed,Lite、Tiny三個輕量模型的原因。

Ø 第三是智能體。智能體是當下很熱的一個話題,隨著智能體能力的提升,會不斷催生出大量新的應用。智能體機制,包括理解、規劃、反思和進化,它讓機器像人一樣思考和行動,可以自主完成複雜任務,在環境中持續學習、實現自我叠代和進化。在一些複雜系統中,我們還可以讓不同的智能體互動,相互協作,更高質量地完成任務。這些智能體能力,我們已經開發出來了,並且向開發者全面開放。

在MoE、小模型、智能體這三個方向上,百度都已經給大家做好了“開箱即用”的工具。分別是:智能體開發工具AgentBuilder、AI原生應用開發工具AppBuilder、各種尺寸的模型定制工具ModelBuilder。

Apollo視覺感知大模型應用到了制圖領域

李彥宏介紹,基于超過1億公裏的、中國複雜城市道路測試裏程數據,百度訓練出來了Apollo視覺感知大模型。它具備檢測、跟蹤、理解、建圖四大基礎能力。這讓百度擁有了更智能、適應性更強、更安全的自動駕駛方案。

百度地圖也率先將視覺感知大模型應用到了制圖領域。現在,全球最大規模的車道級地圖數據,已經上線全國360座城市。只要百度地圖導航能去的地方,智駕就都能開。(詳見:《四維圖新訴百度侵權案落錘,地圖生意單打獨鬥有多難?》)

李彥宏介紹,今年春節後,百度的蘿蔔快跑實現了萬裏長江“第一跨”, 已經把服務從長江的北岸延伸到了南岸,在武漢的部分區域,百度已經實現了7X24小時的全天候運營,還計劃年內在武漢部署1000台無人駕駛車輛。

李彥宏認爲,這是自動駕駛走向真正商業化的一個標志性事件,它不再僅僅是區域性的示範,而是進入到了城市級應用示範的新階段。目前,蘿蔔快跑在武漢覆蓋了3000多平方公裏、770萬人口,是全球範圍內最大規模的自動駕駛運營區域。

李彥宏在現場展示了百度文心大模型系列,以及三個開發工具——AgentBuilder、AppBuilder、ModelBuilder,“他們組成了一個工具箱,你們可以馬上打包帶走,隨取隨用。”李彥宏介紹稱。

0 阅读:61

華爾街科技眼

簡介:理性看待商業世界 審慎研判科技趨勢