李彥宏：開發大模型，百度踩了無數坑，交了高昂學費

文/侯煜

編輯/吳妍

今日，Create 2024百度AI開發者大會在粵港澳大灣區舉辦。面對現場來了5000多位開發者和科技愛好者。百度集團創始人李彥宏跟創業者、開發者交流，分享了自己對大模型和生成式AI的洞見。

大模型和生成式AI，將徹底改變開發者

李彥宏認爲，過去，開發者用代碼改變世界；未來，自然語言將成爲新的通用編程語言，你只要會說話，就可以成爲一名開發者，用自己的創造力改變世界。

“這一天並不遙遠，我們看到，因爲有了強大的基礎大模型，有了很多低門檻，甚至零門檻的開發工具，開發者的生産力大大提高了”。

李彥宏舉例，基于文心大模型的智能代碼助手Comate，不僅支持100多種語言和所有主流IDE平台，可以推薦代碼、生成代碼注釋、查找代碼缺陷、給出優化方案，還可以深度解讀代碼庫、關聯私域知識生成新的代碼。上崗一年多，Comate已經走入了喜馬拉雅、三菱電梯、軟通動力等上萬家企業，生成的代碼采納率達到了46%，百度每天新增的代碼中，已經有27%是由Comate生成的。

李彥宏對開發者說：“今天，你不會寫代碼，也可以做出一個AI應用；不用編程，也可以做出一個智能體。AI正在掀起一場創造力革命，未來開發應用就像拍個短視頻一樣簡單，人人都是開發者，人人都是創造者。”

基于大模型，百度開發各種應用工具

作爲一家技術公司，百度的角色定位，就是盡可能地爲大家提供所需的開發工具。具體來說，就是提供1個強大的基礎模型系列，就是文心大模型系列，這包括旗艦版的ERNIE3.5， ERNIE4.0，也包括輕量版的ERNIE Speed、Lite、Tiny等等。

李彥宏介紹，百度還提供基于大模型來開發各種應用的工具，包括：

Ø 智能體開發工具AgentBuilder，

Ø AI原生應用開發工具AppBuilder，

Ø 各種尺寸的模型定制工具ModelBuilder。

以上這三個工具，都代表了先進生産力。

文心一言用戶突破2億

文心一言從去年3月16日發布，到今天是一年零一個月的時間。其用戶數突破了2億，API日均調用量也突破了2億，服務的客戶數達到了8.5萬，利用千帆平台開發的AI原生應用數超過了19萬。（詳見：《文心一言毀譽參半，卻成爲百度業績增長新杠杆》）

李彥宏指出，文心一言正在改變更多人的工作和生活。

支撐文心一言的基座模型，就是文心大模型。過去一年，文心一言經曆了從3.0版本到3.5，再到4.0版本的進化。文心4.0在理解、生成、邏輯、記憶四大能力方面，均達到了業界領軍水平。

近幾個月來，文心大模型在代碼生成、代碼解釋、代碼優化等通用能力方面實現了進一步的顯著提升，達到國際領先水平。

今天，我們正式發布文心大模型4.0的工具版，現在，大家可以在工具版上，體驗代碼解釋器功能，通過自然語言交互，就能實現對複雜數據和文件的處理與分析，還可以生成圖表或文件，能夠快速洞察數據中的特點、分析變化趨勢、爲後續的決策提供高效精准的支撐。

文心大模型已經成爲了中國最領先、應用最廣泛的AI基礎模型。

不僅如此，相比一年前，文心大模型的算法訓練效率提升到了原來的5.1倍，周均訓練有效率達到98.8%，推理性能提升了105倍，推理的成本降到了原來的1%。

也就是說，客戶原來一天調用1萬次，同樣成本現在可以調用100萬次。媒體可能不會因爲成本下降99%而興奮。但是企業也好，開發者也好，一旦用起來，最關注的就是效果和成本。

我們能在提升性能的同時，把推理成本降到1%，正是因爲百度在芯片、框架、模型、應用這四層架構上有著全棧的布局，通過端到端優化，不斷地把成本打下來，讓更多人都可以高效、低價地用大模型來做AI應用。

李彥宏特別強調，大模型本身並不直接創造價值，基于大模型開發出來的AI應用才能滿足真實的市場需求。百度在過去一年大模型的實踐中，踩了無數的坑，交了高昂的學費。（詳見：《敢打仗的景鲲離場，百度硬件生態戰略該叫停！》）之後李彥宏向開發者分享了基于大模型開發AI原生應用的具體思路和工具。

Ø 第一是MoE。未來大型的AI原生應用基本都是MoE架構，這裏所說的MoE不是一般的學術概念，而是大小模型的混用，不依賴一個模型來解決所有問題。但什麽時候調用小模型、什麽時候調用大模型、什麽時候不調用模型，這都是有技術含量的，要針對應用的不同場景做匹配。

Ø 第二是小模型。小模型推理成本低，響應速度快，在一些特定場景中，經過SFT精調後的小模型，它的使用效果可以媲美大模型。百度Speed，Lite、Tiny三個輕量模型的原因。

Ø 第三是智能體。智能體是當下很熱的一個話題，隨著智能體能力的提升，會不斷催生出大量新的應用。智能體機制，包括理解、規劃、反思和進化，它讓機器像人一樣思考和行動，可以自主完成複雜任務，在環境中持續學習、實現自我叠代和進化。在一些複雜系統中，我們還可以讓不同的智能體互動，相互協作，更高質量地完成任務。這些智能體能力，我們已經開發出來了，並且向開發者全面開放。

在MoE、小模型、智能體這三個方向上，百度都已經給大家做好了“開箱即用”的工具。分別是：智能體開發工具AgentBuilder、AI原生應用開發工具AppBuilder、各種尺寸的模型定制工具ModelBuilder。

Apollo視覺感知大模型應用到了制圖領域

李彥宏介紹，基于超過1億公裏的、中國複雜城市道路測試裏程數據，百度訓練出來了Apollo視覺感知大模型。它具備檢測、跟蹤、理解、建圖四大基礎能力。這讓百度擁有了更智能、適應性更強、更安全的自動駕駛方案。

百度地圖也率先將視覺感知大模型應用到了制圖領域。現在，全球最大規模的車道級地圖數據，已經上線全國360座城市。只要百度地圖導航能去的地方，智駕就都能開。（詳見：《四維圖新訴百度侵權案落錘，地圖生意單打獨鬥有多難？》）

李彥宏介紹，今年春節後，百度的蘿蔔快跑實現了萬裏長江“第一跨”，已經把服務從長江的北岸延伸到了南岸，在武漢的部分區域，百度已經實現了7X24小時的全天候運營，還計劃年內在武漢部署1000台無人駕駛車輛。

李彥宏認爲，這是自動駕駛走向真正商業化的一個標志性事件，它不再僅僅是區域性的示範，而是進入到了城市級應用示範的新階段。目前，蘿蔔快跑在武漢覆蓋了3000多平方公裏、770萬人口，是全球範圍內最大規模的自動駕駛運營區域。

李彥宏在現場展示了百度文心大模型系列，以及三個開發工具——AgentBuilder、AppBuilder、ModelBuilder，“他們組成了一個工具箱，你們可以馬上打包帶走，隨取隨用。”李彥宏介紹稱。

文采家

李彥宏：開發大模型，百度踩了無數坑，交了高昂學費

華爾街科技眼