DeepSeek AI 革命的成本:50,000 個 GPU 且還在持續成長

DeepSeek 在 AI 領域的崛起

DeepSeek 的迅速崛起表明一家敏捷、資金充足的人工智慧公司有潛力挑戰現有的行業領導者。隨著大眾對其里程碑事件的關注度不斷提升,背後的現實卻揭示出一幅由策略性資金支持、先進技術和競爭激烈的人才市場交織而成的複雜圖景。

策略性金融投資推動成長

根據SemiAnalysis的說法,DeepSeek 最近的發展可以歸因於對人工智慧基礎設施的數十億美元的投資以及詳盡的研究計劃。值得注意的是,馬斯克強調,在人工智慧領域競爭需要每年投入數十億美元——這個數字與 DeepSeek 的巨額財務承諾產生了共鳴。

儘管 DeepSeek 僅以 600 萬美元就成功訓練了其複雜的 AI 模型,令人印象深刻,但這個數字僅佔 GPU 預訓練成本。它很容易忽略關鍵的支出,包括資料管理、模型微調和基礎設施設定。截至目前,DeepSeek 在人工智慧相關活動上的總投資已超過 5 億美元,其特點是組織結構靈活,避免了官僚主義障礙,促進了快速進步和創新。

創新基礎設施和技術進步

DeepSeek 的一個突出特點是其強大的計算網絡,據稱它包含大約 50, 000 個 Nvidia Hopper GPU,包括 H800s、H100s 和最新的 H20 單元等型號。這些 GPU 在各個資料中心的策略性佈局支援了人工智慧研究、金融模擬和廣泛模型訓練中的關鍵任務。 SemiAnalysis 估計 DeepSeek 在伺服器上的資本投入接近 16 億美元,營運費用接近 9.44 億美元。

尖端人工智慧架構

DeepSeek 開發的創新 AI 架構,尤其是其多頭潛在註意力 (MLA),為其實現做出了重大貢獻。這種創新方法需要廣泛的研究和對 GPU 的嚴重依賴。與嚴重依賴運算輸出的競爭對手不同,DeepSeek 優先考慮演算法效率——重塑人工智慧領域對可擴展性的期望。這種範式轉變引發了人們對未來高端 GPU 必要性的質疑,可能會影響 Nvidia 等公司。

獨特的招募策略

與眾不同的是,DeepSeek 採用以國內為重點的招募策略,傾向於只從中國境內尋找人才。該公司優先考慮具有強大解決問題能力和技術實力的候選人,而不是傳統資格的候選人,並創建了一個利用北京大學和浙江大學等知名機構的招聘框架。據報道,頂尖研究人員的薪資待遇可能超過 130 萬美元,甚至超過了中國人工智慧領域 Moonshot 等主要參與者。

自給自足和獨立運營

DeepSeek 由最初以人工智慧為中心的中國對沖基金 High-Flyer 創立,並於 2023 年成為獨立實體,專注於人工智慧。這種不受外部投資者束縛的自主權可以提高靈活性和策略果斷性。儘管人們認為 DeepSeek 只是一個小眾玩家,但 SemiAnalysis 證實,DeepSeek 已向其 AI 生態系統投入了超過 5 億美元。

DeepSeek 的自給自足使其成為一個獨特的競爭者;與許多依賴第三方雲端服務的人工智慧新創公司不同,它經營自己的資料中心。這種獨立性提供了對資料管理和模型最佳化的完全控制,從而實現了沒有外部限制的更快迭代——這是快速發展的人工智慧領域的一個重要優勢。

硬體效率與競爭優勢

當 DeepSeek 公佈其 DeepSeek-V3 混合專家 (MoE) 模型的硬體效率時,人工智慧社群引起了關注,與美國同行相比,該模型所需的資源要少得多。隨後推出的 R1 車型將自己定位為 OpenAI 產品的競爭對手,鞏固了在該領域的聲譽。然而,成本效益創新的敘事隱藏著巨大的財務基礎——SemiAnalysis 指出,DeepSeek 已投入約 16 億美元用於硬體投資。

儘管 DeepSeek 因其所謂的具有成本效益的 AI 創新而獲得讚譽,但仔細觀察就會發現,事實卻截然相反。儘管據稱R1 模型僅用600 萬美元和2, 048 塊GPU 就完成了開發,但DeepSeek 的基礎設施規模(包括50, 000 塊Nvidia Hopper GPU)表明,該公司的大量投資為其AI 開發的性質描繪了一幅更為複雜的圖景。

常見問題

1. DeepSeek 與其他 AI 新創公司有何不同?

DeepSeek 以其自給自足而脫穎而出,它經營自己的資料中心,而不依賴第三方雲端服務。這使得可以完全控制資料管理並實現更快的迭代周期而不受外部瓶頸的影響,從而為人工智慧產業提供競爭優勢。

2. DeepSeek如何保證演算法效率?

DeepSeek 強調創新的 AI 架構,例如多頭潛在註意力 (MLA) 系統。透過專注於演算法效率而不是純粹的運算能力,該公司旨在重新定義人工智慧領域的可擴展性,從而減少對高階 GPU 的依賴。

3. DeepSeek 採用什麼招募策略?

DeepSeek 採用以國內為重點的招募策略,僅從中國境內尋找人才。它根據候選人的解決問題能力和技術技能而不是正式資格對候選人進行優先排序,通常以豐厚的薪酬待遇吸引來自名牌大學的頂尖人才。

來源和圖片

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *