大模型一體機是在“賣盒子”嗎？

如果要找一個海內外大模型商業化探索的差異點，“一體機”應該榜上有名。

微軟、谷歌、OpenAI等，主要通過基于雲的AI服務和API接口來實現商業化。當然也有硬件，比如英偉達推出的Jetson，就是面向邊緣計算和AI應用的一款設備，可以用來在邊緣場景中運行複雜的AI模型，但更多的是作爲一個通用的AI計算平台，而不是集成了特定大模型的一體機。

與之相比，“大模型一體機”在中國市場的熱度更高。主流AI大模型廠商、ICT服務商及ISV服務商，幾乎全部下場了。

AI大模型廠商，如百度的千帆大模型一體機、科大訊飛的星火一體機、智譜AI的智譜GLM昇騰大模型一體機。ICT廠商和ISV服務商也都在積極推出各種場景化一體機，比如新華三面向政企客戶的AIGC靈犀一體機，達觀數據面向企業市場的“曹植”大模型一體機，商湯科技的金融大模型檢索問答一體機，中軟國際面向政府市場的JointPilot“四問（問數、問視、問策、問服）”系列大模型一體機等。

大模型一體機，是一個非常有意思的賽道。

有人說，大模型一體機更符合國情，類似于“賣盒子”，也就是軟硬結合，將軟件帶硬件盒子一起賣給客戶，這在ToB/ToG市場很好用，因爲更符合“拍板領導”的認知範圍，不認可軟件的價值，只願意爲看得見摸得著的硬資産付費。

大模型一體機，通過將計算硬件和AI大模型及相關支持軟件，緊耦合封裝在一起，方便客戶使用大模型來實現AI應用，可以看作是AI版的“賣盒子”，是一種好的商業模式嗎？

一體機裏，除了大模型還有什麽？

首先有必要搞清楚，大模型一體機究竟在賣什麽？市面上的大模型一體機，主要由幾個部分構成：

硬件。大模型的訓練和推理，需要大量的算力資源，涉及高性能AI硬件。大模型一體機搭載AI硬件，並針對模型進行優化調校。尤其是國産芯片，有數據顯示，通過優化，可以將國産芯片性能提升20%-30%，吞吐量提升6-7倍，因此大模型一體機可以提供更高的算效。

2.大模型。滿足客戶使用大模型、開發AI應用的需求，大模型一體機中內置的大模型也各有特色。這裏簡單介紹兩種，一種是單一大模型的一體機，比如軟通動力聯合百川智能推出的“軟通-百川AI大模型一體機”，就預裝了百川大模型。另一種是開源開放的大模型一體機，提供豐富的基座大模型讓企業測試、調用，比如百度的千帆大模型一體機，除了內置百度自研的文心大模型，也提供Llama、Baichuan、ChatGLM等十余個主流開源大模型。

3.全棧工具。通用場景的大模型，是無法直接被特定領域、垂直場景來使用的。舉個例子，很多行業還沒有高質量的語料，一些知識經驗還沒有被文本化、數據化，導致大模型無法充分學習。所以，想要用好大模型，很多企業還需要有工程師來進行數據治理，建立高質量的行業語料和知識庫，做好提示詞工程，開發業務友好的插件……從零搭建起全棧AI開發能力，有著不小的工程量。而大模型一體機，針對垂直場景進行過優化微調，集成了易用的平台化工具，可以將原本幾個月的開發周期縮短到幾天、幾小時，實現特定行業專屬大模型的快速部署。

4.支持服務。不同于傳統軟件，大模型需要持續學習，根據人類反饋和數據集及時更新叠代，具有很強的時效性，需要服務商更快、更有針對性地響應。而作爲整體解決方案出售的大模型一體機，包含了一定程度的技術支持和服務，可以解決企業長期應用大模型的問題。

不難發現，相比單純售賣AI服務和API的商業模式，開箱即用的大模型一體機，能夠縮短部署周期、深度結合場景、打消落地門檻，是更符合當下産業現狀的一種選擇，也可以讓更多企業更快地用好大模型。

大模型一體機，不等于傳統盒子

國內企業紛紛推出大模型一體機時，我所在的一個行業群，有人表示：國內就是軟件不值錢，硬件值錢。

提供服務和解決方案的商業模式，優于“賣盒子”，是一個業內流傳已久的觀念。

尤其是在傳統企業軟件和雲計算領域，“賣盒子”被認爲是市場不夠成熟的無奈之選，因爲以前很多甲方的領導不了解軟件技術，覺得硬件更有科技含量。而在銷售方式上，賣盒子壁壘不高，拼的不是産品創新，而是客情關系和酒量。商業回報上，賣盒子涉及定制成本、人力維護成本，無法像軟件那樣通過規模化獲得非線性增長，幹的都是苦活累活。

既然大模型一體機，也是將大模型及相關軟件與硬件集成，作爲一個整體産品出售來“賣盒子”。這種商業模式究竟好不好呢？

這裏要明確，盡管都是將軟硬件集成在一起售賣，但此一時彼一時，大模型一體機並不能等同于傳統的“賣盒子”模式。

從市場源頭的需求驅動力來看，購買一體機的用戶，並非“不懂大模型”。

認爲“賣盒子”比“賣軟件服務”low，往往是覺得ToB市場的很多客戶不懂軟件，不明白爲什麽一張license要賣那麽貴，必須封裝到盒子裏才肯買單。

但今時今日，隨著數字化、智能化的深入，各行各業的企業決策者，很少有人不認可大模型的價值，不認可數據工程、知識工程等“軟實力”之于AI落地的意義。恰恰相反，大模型一體機的市場崛起，正是因爲對應用大模型、開發專屬大模型的迫切渴求。

如果說以前“賣盒子”有點買椟還珠的味道，那麽現在，一體機中大模型這顆“明珠”在企業市場的認可度，是毋庸置疑的。

除了“軟實力”的價值受到認可，大模型一體機的硬件，也更加多元化。

“賣盒子”的另一類訴求是，將硬件作爲企業資産的一部分，更好估價，導致了硬件過度堆砌、脫離業務實際需求的情況。顯然，大模型一體機市場，也並不是這樣的。

我們注意到，大模型一體機的供應商，普遍會提供多種部署方案，既有低成本的輕量級一體機，也有針對大中型客戶的定制化高配一體機，相當于中杯、大杯和超大杯。企業完全可以立足于業務場景的實際需求，選擇最適合自己的硬件版本，無需重度投入過多的硬件資源。

“不是高配一體機買不起，而是輕量一體機更有性價比”，價值導向、實用導向驅動的大模型一體機，拼的主要是産品力，在供給和銷售策略上也更合理、更市場化。

另外值得一提的是，“賣盒子”曾被認爲是迎合了中國企業缺乏“安全感”的心理，進行（沒有太大必要的）私有化本地部署。那麽，支持本地部署、強調數據隔離與安全保障的大模型一體機，有必要嗎？

相信了解大模型技術的讀者，都會很快做出判斷：很有必要。

大模型不同于傳統的軟件技術，其訓練和推理都會涉及大量重要隱私數據，又存在“幻覺”問題，對數據監管和內容安全的擔憂並非杞人憂天。

而大模型一體機的本地私有化部署，可以幫助企業實現數據隔離與網絡隔離，減少數據傳輸及存儲的風險，確保數據資産的安全性。不打消客觀存在的安全顧慮，大模型是很難落地到“最後一公裏”的。

所以，大模型一體機並不等于傳統的“賣盒子”，而是從複雜産業實際出發的一種選擇。

大模型一體機，到底誰在用？

當然，大模型一體機確有其用，並不意味著每一個開發者、每一家企業都適合。

相比大模型一體機少則幾萬、多則幾十萬的前期投入成本，通過API調用次數或計算資源計費，一個token只需要幾分錢，初始成本更低。那麽，這大模型一體機到底是誰在用啊？

有三類群體，應該將大模型一體機的集成方案，作爲重點考量：

一是風險敏感型。

包括數據隱私安全風險，以及供應鏈斷鏈風險。軟硬件協同優化的一體機，可以讓AI大模型在國産硬件上也有不錯的性能表現。對于有信創需求的企事業單位，是更優解。

公開報道顯示，基于昇騰AI硬件底座的軟通AI訓推一體化平台，就受到央國企、科技機構、教育、金融等領域客戶的認可。

二是長期運營型。

一位開發者朋友，在調用了GPT4-Turbo之後表示：“太燒錢了！” 他所用的非代碼調用場景，一次要花費0.5元，長期用是不可承受的，于是選擇了能力更低的GPT-3.5+其他模型的組合拳。

大模型API基于token使用量的計費方式，雖然初始階段看起來成本更低，但總體擁有成本（TCO）卻未必。實踐看來，企業應用AI，並不意味著所有任務都要使用雲端先進大模型的完整能力。

大模型一體機提供的更豐富的模型選型、本地化部署、優化過的性能保障，可能讓企業AI開發應用的全生命周期，打好“組合拳”。

三是非AI原生型。

大模型火爆之後，很多行業和企業才開始關注AI、使用AI，沒有積累相關的開發能力和人才，對技術也是一知半解，這時候想要在自身的業務場景中快速上馬大模型，可能要面臨短期內資源緊缺的溢價情況，被迫在算力市場、人才市場進行競價，試錯成本更高。這時候，通過大模型一體機的小時級一站式交付、即插即用，可以快速試錯。

比如一個普惠版的大模型一體機，不需要A100這類高端顯卡，就可以幫助企業打造一個專屬大模型，開發出小型的知識庫應用或AIGC類應用，讓業務智能化起來，讓大模型不再遙遠。

大模型的商業化探索還處于早期，用傳統的眼光去看待新興事物，未嘗不是一種刻舟求劍。大模型不一定要捆綁硬件來凸顯價值，但一定要結合硬件來充分釋放價值。

從這個角度來說，大模型一體機的商業內核，與以往的“賣盒子”有本質的不同，或許能爲企業市場帶來一種全新的商業機遇。

文采家

大模型一體機是在“賣盒子”嗎？

腦極體