薪科技快評

薪科技快評

基于昇騰910B訓練萬億參數的語言模型簡介

基于昇騰910B訓練萬億參數的語言模型Abstract在本工作中，作者開發了一個系統，該系統在Ascend 910 AI

2024-06-01 11:30
建設人工智能平台,主流GPU卡選型分析

國內外主流GPU卡性能分析！2024！大模型興起助推算力需求激增2024年，深度學習與人工智能技術飛速躍進，Transf

2024-06-01 11:25
國産飛騰CPU安全可靠技術測評

安全可靠CPU測評結果（飛騰篇）中國信息安全測評中心公告（2024年第1號）：公布依據《安全可靠測評工作指南（試行）》得

2024-05-31 09:20
大模型推理速度翻倍的秘密：硬件選型與GPU優化全攻略

部署大模型應用（如訓練、微調、RAG）時，前期硬件選型至關重要。即使已有方案，缺乏實踐經驗可能導致硬件評估困難。本文提供

2024-05-30 09:05
揭秘TensorCore黑科技：如何讓AI計算速度飛躍

揭秘 Tensor Core 底層：如何讓AI計算速度飛躍Tensor Core，加速深度學習計算的利器，專用于高效執行

2024-05-28 23:02
生成式AI的GPU網絡技術架構

生成式AI的GPU網絡引言：超大規模企業競相部署擁有64K+ GPU的大型集群，以支撐各種生成式AI訓練需求。盡管龐大T

2024-05-28 22:20
微服務架構五大設計模式詳解，助你領跑行業

微服務架構設計模式詳解(5種主流模式)微服務架構微服務，一種革命性的架構模式，主張將大型應用分解爲若幹小服務，通過輕量級

2024-05-28 22:08
AI芯片軟件定義硬件架構

軟件定義硬件架構AI 應用正促使芯片制造商和 OEM 重新審視重新配置硬件的可能性。摩爾定律放緩，軟件應用複雜性和規模激

2024-05-27 21:33
軟件技術架構全面詳解

軟件架構全面詳解軟件架構這個與建築設計架構類似，建築設計架構師負責設計建築物的整體結構、布局和功能分配。而軟件架構師，負

2024-05-27 21:09
人工智能超萬卡集群的核心設計原則和架構

超萬卡集群的核心設計原則和架構超萬卡集群建設方興未艾，當前主要依托英偉達GPU及其設備。英偉達GPU在大模型訓練中表現卓

2024-05-27 21:07
LinuxIO模型深度解析與實戰應用

linux的5種IO模型一、這裏IO是什麽操作系統設有用戶態與內核態，確保系統安全。應用程序默認在用戶態運行，而執行如I

2024-05-27 20:49
人工智能萬卡GPU集群的硬件和網絡架構

萬卡 GPU 集群互聯：硬件配置和網絡設計一、背景自從 OpenAI 推出 ChatGPT 以來，LLM 迅速成爲焦點關

2024-05-26 13:24
高性能負載均衡的分類及架構分析

如何選擇與部署適合的高性能負載均衡方案？當單服務器性能無法滿足需求，高性能集群便成爲提升系統處理能力的關鍵。其核心在于通

2024-05-22 08:22
揭秘數據中心、HPC與AI的網絡互連協議

數據中心、HPC領域、AI領域等場景互聯協議混戰當前，數據中心、高性能計算及AI領域正面臨全新數據設備互聯協議標准的激烈

2024-05-22 08:18
數據中心大型AI模型網絡需求

數據中心大型AI模型網絡需求隨著Transformer的崛起和2023年ChatGPT的大規模應用，業界逐漸形成共識：遵

2024-05-21 08:26
高性能GPU服務器硬件拓撲與組網全攻略

高性能GPU服務器硬件拓撲與集群組網01、術語與基礎大模型訓練常采用8卡GPU集群，涵蓋A100、A800、H100、H

2024-05-19 18:04
微服務架構技術棧深度解析

前言微服務是一種軟件設計、架構思想。當然，裏面也包含了相關技術點要解決當前要務。學習微服務，我們不能空口而談，一定要落實

2024-05-19 17:19
微服務APIGateway-微服務架構的關鍵入口

在微服務架構日益盛行的今天，API Gateway（API網關）已成爲其中不可或缺的一部分。API Gateway不僅作

2024-05-18 23:10
大模型MoE技術深度解讀,引領AI走向新高度

大模型系列之解讀MoEMixtral 8x7B的亮相，引領我們深入探索MoE大模型架構的奧秘。MoE究竟是什麽？一起揭開

2024-05-16 07:18
AI浪潮再起,2024年中國大模型産業深度解析

國內 AI大模型産業發展深度分析 2024人工智能技術的迅猛發展，使AI大模型成爲科技競爭的核心、産業變革的先鋒、經濟增

2024-05-14 09:29

薪科技評說，發現技術的點滴，記錄科學的飛躍！