科教玩轉AI:懂行的都在卷算力,更懂行的在升級全閃存儲

阿明觀察 2024-04-26 10:13:16

引言:讓更懂行的用戶聚焦存力,從而可以更好助推産教融合發展。

【全球存儲觀察 | 熱點關注】從ChatGPT到Sora,新一代人工智能的蓬勃發展帶給了IT業界新啓示,大模型離不開大算力的支撐與大數據的洞察。

當“大模型+大算力+大數據”業已新一代人工智能發展的基本範式時,懂行的早已關注大算力,更懂行的卻將目光更多轉移到了存力。

其一,存力核心基礎設施價值凸顯。數據質量高低在很大程度上決定了大模型智能化水平,作爲支撐高質量數據集的載體,高性能的存儲系統成爲大模型進化不可或缺的核心基礎設施。這一觀點得到了大模型廠商的認證,4月18日Meta正式發布最強開源大模型Llama 3,紮克伯格就在訪談中提到,外置專業存儲在AI訓練中很重要。

其二,升級全閃成爲降低能耗最佳途徑之一。然而,大模型進化雖然迅猛,但能源將成爲限制。談及能耗管控方面,相比傳統磁盤存儲,全閃存儲憑借高性能、低功耗、高可靠的優勢受到許多企業的歡迎。

算力存力協同發展,

大模型進化才能跑得更快

在AI大模型時代,算力發展迅猛,成爲大模型訓練的主要成本,用戶特別關注算力順理成章。

在卷算力的同時,保障算力使用的存力也需重點關注,實際上在大模型訓練過程中,算力存力協同發展才有現實意義。

一方面,從AIGC發展現狀來分析,AIGC在很大程度上促進了內容生産更快更多,根據其內容模態不同可分爲文本、視頻、圖像,音頻與跨模態生成,這對于任何有志于大模型創新的科技公司而言,都需要大量的存儲空間來保存模型數據采集、預處理、訓練集數據及結果數據等。

二方面,隨著Sora文生視頻異軍突起,生成式AI將迎來新的技術革命,與此同時,文生視頻也將進一步引爆大模型數據爆炸式增長的新趨勢。大模型數據存儲容量將發生新的飛躍式攀升,從而加快邁向PB級的大模型存儲時代,這對于大模型進化將是一項新挑戰。

由此而言,大模型對于算力基礎設施要求將會聚焦在智能算力、數據存力與網絡運力三個方面。作爲高質量數據集載體的存儲系統,當仁不讓地成爲大模型核心基礎設施之一。

用戶已經從一味的堆疊算力,到讓每一分算力都發揮最大價值的階段,這時候就要看存儲的技術創新了。

那麽,問題來了,如何更好地實現算力存力協同發展呢?在此之前,必須明確了解多模態的大模型海量計算,已經對數據存儲提出了前所未有的高要求。道理大家都容易懂,存儲高要求實現越好,匹配智能算力發揮就越充分,從而大模型進化就越快。

然而,事實上,當前大模型存儲卻湧現出了三大制約其進化的挑戰。

其一,數據加載速度低下,成爲影響模型訓練時間的重要因素。其二,數據訪問協議多樣性,導致數據訪問效率不高。其三,大模型進入落地應用階段,開始走進千行百業,與各種各樣的場景進行深度融合。基于此,大模型面對多種安全威脅與挑戰。

可見,不搞定大模型存儲的三大挑戰,恐怕難以讓大模型進化跑得更快。

聚焦大模型進化的木桶短板,

自研XDS創新破局

哪裏有挑戰,哪裏就有突破。

誠然,在AIGC數據風暴下,大模型存儲針對存儲性能、訪問效率、數據安全等方面的挑戰,成爲大模型進化的木桶短板。一直在數據存儲領域有著全面布局的曙光存儲,在應對AIGC存力挑戰上,自研XDS技術實現存儲創新破局,滿足大模型快速進化的高性能存儲需求,也爲曙光存儲的未來發展創造了新的機會。

中科曙光存儲産品事業部副總經理 、曙光存儲公司副總裁 楊志雷

奔著算力存力協同發展的趨勢,中科曙光存儲産品事業部副總經理 、曙光存儲公司副總裁楊志雷表示,曙光ParaStor首創實現XDS智能加速技術,縮短數據傳輸IO路徑,減少CPU開銷,打造高效的存算協同。

針對以前常用AI訓練的緩存模式,GPU需先存儲數據到緩存,然後由CPU操控指令,GPU才能讀取數據。從CPU到緩存再到GPU,GPU數據調取效率太低。爲了助力加速AI流程,XDS技術開創性地實現數據直接加載到GPU,保證了存和算之間的通訊幾乎是無縫的,而且不需要通過更多的協議轉換,加速AI訓練的數據集加載與處理。與此同時,XDS技術值得一提的創新之處在于支持異構GPU直接存取,也支持多款算力端GPU直接存取。如此一來,面向AI場景,XDS加速訓練、推理業務流程帶來立竿見影的作用。

針對存力端的特定需求,XDS技術內嵌ParaBuffer加速引擎,在AI訓練計算節點與存儲系統之間構造大內存池,將系統整體I/O性能提升數倍。從真正意義上實現AI存算協同優化,大幅縮短訓練時間,由數十天降低至幾天。

針對大模型存儲在數據訪問協議多樣性上的挑戰,曙光ParaStor早已全面支持文件、塊、對象等多種存儲協議,實現統一的協議管理。ParaStor支持多副本及糾刪碼的冗余模式並存,支持多協議訪問。在提升系統可用性、可靠性及性能的同時,大幅度降低存儲成本。

針對AI存儲的數據安全性的挑戰,曙光ParaStor擁有全棧自研能力,從操作系統、存儲架構、軟件核心模塊、存儲介質等多層面保障數據安全。在數據存儲全棧安全的考量,帶給用戶更多放心與安心。

由此可見,XDS加速技術不僅帶來存儲效率提升,同時支持多存儲協議與智能分級,數據管理省心可靠,最終幫助大模型行業實現降本增效。

很顯然,隨著大模型行業發展深入,打造行業AI底座的道路上,XDS技術支持大模型應用的價值將得以進一步彰顯,AI未來已來,曙光存儲以長期以來的創新堅持,引領存儲未來趨勢。

“瘋狂星期四”加速升級全閃,

鍛造創新教育AI底座

在加速行業AI應用落地方面,科教行業呈現出了新變化。

之前,教育部大力推進人工智能、大數據等學科發展,又進一步擴大了高校教學對計算資源的需求,同時也帶動了存儲資源的建設。像清華大學、北京科技大學、複旦大學、湖州師範學院、福建師範大學、華南理工大學等科研院校機構,紛紛在AI領域豐富自己的能力,面向科研科教不斷進取。

此外,大模型的發展也加速了AI爲科學研究帶來更多可能性,AI for Science(AI4S)人工智能驅動的科研一時間備受關注。AI與科研的深度融合,針對自然界、人類社會的各種現象和規律,AI4S利用AI技術學習、模擬、預測和進行優化,以此尋求解決各種問題,從而推動科學突破與創新。目前,在生命科學、材料科學、能源、半導體、地球與環境等衆多領域及細分領域,AI4S已經都在不同程度地推進産研實踐。

據中科曙光存儲産品事業部副總經理 、曙光存儲公司副總裁楊志雷介紹,部分重點高校不僅有自己的先進計算實驗室,並且正朝著更大規模的數據中心發展,鍛造創新教育AI底座成爲大家的必然趨勢。同時在AI4S助力科學研究上,高效處理海量數據的需求也非常突出。

從實驗室走出的曙光更能深刻理解科教的數據存儲需求,憑借著多年的技術積累,發力科教行業,基于科教行業的場景需求,強化AI底座,並推出“瘋狂星期四”全閃升級促銷活動,加速升級全閃存儲,滿足科研院所和高校的AI數據存儲需求。

全閃升級活動細則包括:全閃存儲免費送!僅限科研教育行業用戶。活動有效期爲:2024年5月1日至2024年12月31日。

活動規則:買滿5PB機械硬盤容量,贈送3重大禮,提升5倍性能。

贈送1:150TB全閃存儲容量(NVMe SSD)

贈送2:分級存儲license授權

贈送3:IO模型分析套件

回饋科教用戶,價格不變,性能提升5倍+,這樣的促銷值得關注一下。

全球存儲觀察分析指出,雖然懂行的用戶都在卷算力,曙光存儲“瘋狂星期四”活動,讓更懂行的用戶聚焦存力,從而可以更好地助推産教融合發展。

值得關注的是,曙光存儲全棧自研,打造從部件到存儲節點到系統到整體存儲方案的四級安全體系。減少頻繁參數調優、服務器或網絡故障等原因導致的中斷影響,保障數據全生命周期內存儲系統的高可靠性。不僅穩定安全,而且中科曙光ParaStor分布式全閃存儲的整體擁有成本更具性價比。

面向未來發展,玩轉AI,科教行業升級全閃存儲勢在必行。

- END-

歡迎文末評論補充!

【全球存儲觀察 |全球雲觀察|科技明說|阿明觀察】專注科技公司分析,用數據說話,帶你看懂科技。本文和作者回複僅代表個人觀點,不構成任何投資建議。

1 阅读:44

阿明觀察

簡介:帶你讀懂科技上市公司,用數據說話,成就不凡。