支付寶在AI大模型時代

36氪 2024-02-21 18:40:17

AI已經成爲切口,一個新的支付寶正在淬煉中。

作爲億萬用戶的“過年搭子”,國民APP支付寶今年憑借多元化、強互動的五福玩法強勢出圈。

支付寶發布的數據顯示,今年,近6億人次通過AI科技體驗新年味用AI換臉參演《熱辣滾燙》等春節檔電影、一鍵生成“會說話”的視頻紅包,五福熱度不減,依然是全民春節必備的儀式感。

春節的支付寶好玩好逛好買,用戶們能夠順暢“嗨翻天”,離不開技術團隊下的苦功夫。今年的五福節,是首次由AI全面驅動的五福活動,也是支付寶技術團隊的又一個“大型戰場”。

支付寶CTO陳亮(花名俊義)對此感慨頗深,盡管內部已經有過好幾輪演練,但在大模型這樣一個“新事物”面前,說不緊張是騙人的。

1月28日,晚上8點,支付寶技術團隊所在的螞蟻空間8號樓已經坐滿了人,再過四個小時,五福節就要正式上線了。

俊義已經很久沒有這麽緊張過,“AI大模型是全新的東西,不像雙11已經比較成熟了,(擔心)過程中會有各種各樣的bug”。

在螞蟻內部很多人看來,這次五福節帶來了久違的“興奮感”,和頭幾年備戰雙11相媲美。充分准備下,五福節經受住了考驗。

今年五福期間,近6億人次通過支付寶推出的AI互動玩法體驗新年味。其中,“大家來找福”成爲最受歡迎的集福卡方式,共有近30億個AI生成的福字被用戶找到。賈玲新電影《熱辣滾燙》換臉片段上線五福“飙戲小劇場”後,一天吸引近百萬網友AI“參演”,自發成爲電影的“編外宣傳員”。

五福節作爲一個關鍵時間點,推動AI在支付寶上規模化落地應用的同時,也推動了支付寶的第二次技術叠代。這也向外界傳遞出支付寶技術遇山開山、遇水搭橋的決心,以及眼下重投AI的態度。

01.支付寶“AI技術戰”

近日Sora的面世,再次印證了人工智能浪潮勢不可擋的氣勢。誠然,在推動生成式AI的技術能力上,美國科技巨頭不斷取得突破性進展。不過,AI技術能力和AI大規模落地應用的可行性是兩回事。兩者之間,隔著成本可控、可持續性等必須解決的難題。

在AI規模化落地應用的可行性上,中國互聯網公司正在積極探索和驗證各種解決方案,支付寶就是其中一個。

俊義舉例介紹,杭州亞運,作爲亞組委技術支持方,支付寶已經在推動AI規模化落地——全球1億數字火炬手。背後的數字人技術爲螞蟻自研,這一技術專注數字人建模、渲染、驅動、交互等核心能力,充分結合AIGC與大模型技術,通過AI降低數字人全鏈路生産成本,目前可支持2D、3D數字人,提供播報型、交互型解決方案。

到了五福節——這個支付寶每年的重頭戲,今年多了AI玩法,挑戰則繼續升級。對于一個用戶數量超10 億的國民APP,春節期間要面對大量用戶同時湧入的情況,AI互動更是首次在支付寶大範圍亮相。

好在任務圓滿完成,2024五福節,在支付寶技術團隊的努力下,用戶玩得開心之余,還有兩個不容易被發現的“隱藏服務”。

首先是智能手機99%全覆蓋:Galacean結合端雲協同渲染,能做到UI和Canvas互動分離,僅將Canvas互動部分交給雲端渲染。這使得11年前的iPhone 5S都可以流暢運行,做到99% 設備支持。

其次是圖片流量節省約50%:支付寶客戶端推進行業前沿的AVIF圖片標准落地,在保證驗收通過的前提條件下,壓縮率在PNG、WebP 壓縮的基礎上還能再壓50% 以。極大降低用戶圖片資源的流量消耗,同時降低網絡耗時。

談及這次AI驅動的五福節,俊義最大的成就是“讓整個AI在支付寶融入到了日常生活中。”在他看來,AI驅動的五福不管面向to C也好,to內部員工也好,都是解決大規模落地的問題。”

2024支付寶五福節,就是一次AI互動應用集中大規模落地的練兵場,而好士兵從來不打無准備之戰。

自2021 年大模型在學界引發震動以來,螞蟻集團的技術團隊就在關注這個領域。2023年11月,螞蟻集團技術團隊訓練的螞蟻百靈大模型通過了備案。

螞蟻大模型堅持自主研發、全棧布局,目前已形成包括大模型底層基礎設施、基礎大模型、行業大模型、應用産品在內的完整技術鏈條。

螞蟻建設了超過萬卡的異構集群,其中硬件算力效率(HFU)超過60%,集群有效訓練時長占比90%以上,RLHF訓練在同等模型效果下訓練吞吐性能相較于業界方案提升3.59倍,推理性能相較于業界方案提升約2倍。

02. 技術團隊護航

五福節衆多AI小産品的湧現,看上去是娛樂用戶,實則是螞蟻大模型落地的第一次大規模探索。

爲了推動AI大規模落地,支付寶技術團隊基于基于百靈大模型升級了安全大模型,

“ChatGPT火了以後,從去年開始訓練這個模型,支付寶有萬卡異構規模GPU集群能力,有硬件和訓練能力。”

俊義介紹,AI要實現大規模落地應用,需要解決兩個技術性問題,即算力支撐得住、成本可控。

眼下螞蟻基礎大模型平台具備萬卡異構集群,其中千卡規模訓練MFU可達到40%,集群有效訓練時長占比達到90%以上。

數據層面,除了全網通用語料與金融領域的優質語料,螞蟻還注入了優質的研判分析數據,以及大規模知識工程所帶來的超過270億Token的知識量;模型層面,螞蟻認爲金融專屬指令更能夠代表大模型,解決特定金融任務的能力,其從真實場景中萃取了超過60萬條以上的專屬指令。

成本方面,目前,螞蟻的CPU利用率從2017年的不到10%,提升到了2023年的近40%。

此外,螞蟻自研代碼大模型CodeFuse也幫助支付寶提升可代碼開發效率。目前,約50%的螞蟻程序員在寫代碼時都用上了CodeFuse,AI生成代碼占比超過10%,大大提高了代碼開發效率。

算力和成本優勢下,支付寶在今年五福節完成了一個挑戰,成爲第一款億級用戶産品中,第一個推出多人AI人像的。

五福節的時空照相館可同時支持6人同框,包括單人照、雙人照、全家福,一共有近千個關系對。單人、雙人、全家福,每個類型下面有5-6個風格模版,每個風格模版有最多10種姿勢可選,這就意味著支付寶的後台模版多達近三萬張。

作爲AI改造支付寶業務的“總指揮”,俊義表示:“支付寶技術發生了一些變化,過去成熟東西依舊在,同時在疊加新的,2024年的五福尤其明顯,因爲AI驅動應用更多了,等于站在新起點。”

03. 支付寶AI方向是什麽?

實際上,這已經是支付寶經曆的第二次技術叠代,上一次則要追溯到雙11。支付寶的技術淬煉,就是在一個又一個“大型戰場”上磨練升級突破的。

作爲螞蟻集團14年的技術老兵,俊義從第一屆雙11開始,完整經曆雙11十余年的支付壓測與技術保障,他身上的一個大標簽就是“雙11技術總指揮”。

俊義見證了雙11飛速發展的整個過程,也感受到雙11影響力帶來的巨大挑戰,尤其是容量挑戰。

2009年,淘寶CEO給當時的支付寶CTO發了個郵件,要做促銷活動,俊義說“大家也沒當回事,只是覺得量蠻大的”。第二年,雙11正式開始後,流量峰值一年比一年離譜,“我都不太信,我們只能竭盡全力去打這些峰值。”

就這樣,支付寶的第一次技術叠代被業務需求逼了出來,其中最關鍵的自研技術有分布式數據庫技術(OceanBase)、綠色計算技術(分布式架構)。

目前,OceanBase已服務超過1000家行業客戶,其中30%將其應用于核心系統。在金融領域,OceanBase已成爲市場占有率第一的分布式數據庫。

螞蟻在使用綠色計算技術之前,全局的算力利用率跟行業平均水平一樣,8%。而從2019年投入研發,經過4年時間,現在翻了好幾倍,達到了近40%。

在當下AI浪潮中,爲了跟上技術周期浪潮的節奏,倒逼自己去解決規模化、商業化落地中不可避免的問題,是行業的共同現狀

從螞蟻內部傳遞出的信息來看,螞蟻做大模型第一階段仍是圍繞自身業務,支付寶自身業務從大模型豐富起來,基于通用大模型基礎之上,衍生出在醫療場景、遙感領域、民生領域的應用。

AI應用能否大規模落地關系到AI是否能夠真正服務社會並走向真正的AGIC時代,搶跑大模型落地已成爲行業的默契。面對這個艱巨的行業共同使命,百靈大模型被賦予了全面改造支付寶的應用場景的意義。

但螞蟻集團對此並不陌生,其自主研發的硬核科技,如分布式數據庫、雲原生分布式計算架構、智能風控等,一直引領行業的技術方向,也都是被國民級項目倒逼出來。

正如俊義常挂在嘴邊的一句話那樣,“我們挑戰就是源于業務對我們的需求。不是別人不聰明,是因爲他們沒有遇到這樣的挑戰。”

支付寶上每一個億級用戶活動,對用戶而言是各種買買買和玩玩玩的線上嘉年華,對螞蟻集團而言,則是一次次逢山開路,遇水搭橋的技術拉練和技術升級。

在用戶看不見的地方,AI已經成爲切口,一個新的支付寶正在淬煉中。

0 阅读:83
评论列表