打通AI任督二脈,國産自研通用大模型“砭石”實力邁向AGI

之槐看科技 2024-05-01 05:07:30

編輯:編輯部

【新智元導讀】全球領先AI公司智慧眼發布了自研的通用大模型——砭石,海量代碼文本數據訓練後展現出強大的湧現能力,不僅能實現代碼生成,韻律創作,甚至是多模態AI理解效果驚人。

每一次關鍵技術取得通用化的突破,都會深刻改變生産方式,並顯著提升生産力水平,而「大模型」成爲了打通人工智能技術通用性「任督二脈」的關鍵。智慧眼,作爲全球領先的人工智能企業,最近推出了其創新研發的通用大模型——砭石。

AI正在從感知智能、認知智能向決策智能快速叠代演進。

在1.0時代,感知智能中以計算機視覺爲代表,即基于深度學習算法,賦能計算機理解數字圖像和視頻,智慧眼正是在這個時候構建了機器視覺大模型,並在IDC的中國人工智能之計算機視覺應用市場份額排名中進入前七,榮獲中國智能科學技術最高獎——吳文俊人工智能科技進步獎。

2.0階段,認知智能將從認知心理學、腦科學及人類社會曆史中汲取靈感,並結合跨領域知識圖譜、自然語言處理、因果推理等技術,建立穩定獲取和表達知識的有效機制,智慧眼發布了人工智能中台和大數據中台産品,實現了從感知智能到認知智能的跨越。

到了3.0時代,AI+X成爲前沿方向,需要采用海量的高質量通用數據訓練一個基礎的底座,再針對不同的場景,利用少量的專業數據進行微調,實現低成本的AI場景落地。

智慧眼研發了通用大模型砭石,該模型基于嚴格審核過濾的海量多模態數據訓練,通過「預訓練+精調」模式帶來了新的標准化AI研發範式,實現AI模型在更統一、簡單的方式下規模化生産,支持多種任務執行。

大模型生成代碼,砭石通過對開源代碼數據集進行多次清洗,得到高質量的代碼數據集,隨後通過預訓練和CoT訓練等方式,使得大模型具有強大的代碼生成和推理能力,極大地提高了軟件開發的效率和質量。

大模型寫作能力,砭石大模型在更多參數和更複雜的結構基礎上,使用海量的通用文本型數據進行預訓練,學習了大量通用知識和邏輯,表現出了強大湧現能力和學習能力,生成了富有韻律、節奏和情感表達的詩歌。

砭石大模型基于自然對話方式理解和執行任務,提供多種能力包含文本、圖像、視頻、音頻輸入,生成式輸出文本信息,具備閑聊和知識問答能力,可以爲情感陪伴、政策問答、大數據分析等場景賦能。

三大核心技術賦能,新一代大模型順勢而出

大模型的創新,遠不止于模型本身的革新,其更深層次地依賴于人工智能領域中的各項核心技術突破。

在這方面,智慧眼公司擁有顯著的優勢,其在知識圖譜、智能大模型以及隱私計算等關鍵技術上,都擁有自主研發的核心算法和獨立的知識産權,這爲通用大模型創新提供了堅實的基礎。包括:

在知識圖譜方面:公司突破保護隱私的分布式知識遷移和聯邦圖譜推理,接入差異化的大規模行業數據,構建世界一流的高可信高質量的海量數據知識圖譜,爲知識圖譜緩解大模型幻覺奠定基礎。在智能大模型方面:公司突破了隱私計算條件下的大模型聯邦訓練、基于知識圖譜的大模型知識增強等核心技術,顯著提升大模型在專業領域的信息生成准確度。在隱私計算方面:突破了保護隱私的分布式知識遷移和聯邦圖譜推理技術,實現對高價值用戶的敏感隱私數據的脫敏,真正做到數據的「可用不可見」安全應用,實現分布式知識的融合和基于分布式數據的大模型訓練,支撐了用戶數據價值的釋放。

四大基礎模型融合,共同塑造超強通用能力

智慧眼砭石大模型的核心定位是爲各行各業注入新的活力,采用完全的分層解耦設計,包括兩層:

第一層爲砭石通用大模型層,主要包括機器視覺、自然語言理解、多模態和認知4大基礎模型,爲各種應用場景提供相關的AI基礎能力;第二層爲行業大模型,基于通用大模型層,能夠整合行業用戶的自有數據,訓練客戶的自有專有大模型。

通過這種分層次的設計,智慧眼砭石大模型不僅提供了廣泛的通用能力,還能根據各行業的具體情況,實現高度個性化的賦能。

具體來說,基礎模型層面包含:

機器視覺大模型,「爲機器植入眼睛與大腦」。此模型通過在大規模圖像數據上進行訓練,可以實現各種視覺任務,能夠進行圖像的分割和識別、分析視頻等。自然語言理解大模型,「讓機器理解人類語言」。此模型基于數T Token的高質量語料訓練而成,能夠實現負責的自然語言處理任務。多模態大模型,「讓機器擁有豐富感官」。此模型通過對文本、圖片、視頻和音頻等不同儲存信息載體的認知和理解,來模擬人與人之間的交互方式,爲創新性應用提供了堅實的基礎。認知大模型,「讓機器思考分析決策」。此模型能夠適應包括各類傳感器等不同類型感知數據源的輸入,實現對環境的的理解與分析。

在行業大模型層面,砭石將涵蓋諸如醫療、醫保、金融、保險、政務、養老、教育多個專業領域,這些大模型的核心價值在于爲不同行業的發展提供了強大的賦能。

總結來說,基礎大模型致力于攻克技術難題,深入探索通用性與泛化性;而行業大模型則通過深度融合行業數據與知識特性,爲特定行業量身打造堅實的基礎。

基礎大模型爲行業大模型的建設提供有力支撐,同時,行業大模型又能夠結合實際應用場景與真實數據,爲基礎大模型的進一步優化提供寶貴的反饋與滋養。

大模型堪稱人工智能領域的一座重要裏程碑。

展望未來,智慧眼將秉承持續創新的精神,引領AI技術發展浪潮,推動大模型技術如高山流水般洶湧澎湃,廣泛覆蓋醫療、醫保、金融、保險、政務、養老、教育等各行各業,從而爲社會發展注入全新的、高質量的生産力。

0 阅读:0

之槐看科技

簡介:感謝大家的關注