DeepSeek AI revoliucijos kaina: 50 000 GPU ir augimas

DeepSeek kilimas dirbtinio intelekto kraštovaizdyje

Greitas „DeepSeek“ pakilimas parodo judrios, gerai finansuojamos AI įmonės potencialą mesti iššūkį nusistovėjusiems pramonės lyderiams. Visuomenės susižavėjimas auga aplink savo etapus, pagrindinė tikrovė atskleidžia sudėtingą gobeleną, kurį sudaro strateginė finansinė parama, pažangios technologijos ir labai konkurencinga talentų rinka.

Strateginės finansinės investicijos, skatinančios augimą

Remiantis SemiAnalysis, naujausia „DeepSeek“ trajektorija gali būti siejama su milijardais, investuotais į AI infrastruktūrą ir išsamias mokslinių tyrimų iniciatyvas. Pažymėtina, kad Elonas Muskas pabrėžė, kad norint konkuruoti dirbtinio intelekto srityje reikia kasmet investuoti milijardus – šis skaičius atitinka didelius „DeepSeek“ finansinius įsipareigojimus.

Nors įspūdinga teigti, kad „DeepSeek“ sugebėjo išmokyti savo sudėtingą AI modelį tik už 6 mln. USD, šis skaičius apima tik GPU išankstinio mokymo išlaidas. Tai patogiai nepaiso esminių išlaidų, įskaitant duomenų valdymą, modelio koregavimą ir infrastruktūros nustatymą. Iki šiol bendros „DeepSeek“ investicijos į su AI susijusią veiklą viršijo 500 mln.

Inovatyvi infrastruktūra ir technologijų pažanga

Išskirtinė „DeepSeek“ savybė yra tvirtas skaičiavimo tinklas, kurį tariamai sudaro apie 50 000 „Nvidia Hopper“ GPU, įskaitant tokius modelius kaip H800, H100 ir naujausius H20 įrenginius. Strateginis šių GPU išdėstymas įvairiuose duomenų centruose palaiko svarbias užduotis atliekant AI tyrimus, finansinį modeliavimą ir platų modelių mokymą.„SemiAnalysis“ apskaičiavo, kad „DeepSeek“ kapitalo investicijos į serverius siekia beveik 1, 6 mlrd. USD, o veiklos išlaidos beveik siekia 944 mln. USD.

Pažangiausia AI architektūra

Išradinga „DeepSeek“ sukurta AI architektūra, ypač jos daugiagalvis latentinis dėmesys (MLA), labai prisideda prie jos pasiekimo.Šis naujoviškas metodas reikalauja išsamių tyrimų ir labai priklauso nuo GPU. Skirtingai nuo konkurentų, kurie labai priklauso nuo skaičiavimo rezultatų, „DeepSeek“ teikia pirmenybę algoritminiam efektyvumui ir keičia lūkesčius dėl mastelio AI sektoriuje.Šis paradigmos pokytis kelia klausimų dėl būsimos aukščiausios klasės GPU būtinybės, galinčios turėti įtakos tokioms įmonėms kaip „Nvidia“.

Unikali įdarbinimo strategija

Išskirtinai „DeepSeek“ taiko į vietinę įdarbinimo strategiją, pirmenybę teikdama talentams išskirtinai iš Kinijos.Įmonė teikia pirmenybę kandidatams, turintiems stiprių problemų sprendimo įgūdžių ir techninių gabumų, o ne įprastų kvalifikacijų, sukurdama įdarbinimo sistemą, kuri būtų pritaikyta prestižinėms institucijoms, tokioms kaip Pekino ir Džedziango universitetai. Pranešama, kad geriausių mokslininkų kompensacijų paketai gali viršyti 1, 3 mln.

Savarankiškumas ir veiklos nepriklausomumas

„DeepSeek“, kurį įkūrė „High-Flyer“, Kinijos rizikos draudimo fondas, iš pradžių orientuotas į AI, 2023 m.tapo nepriklausomu subjektu, daugiausia dėmesio skiriančiu dirbtiniam intelektui.Ši autonomija, neapsunkinta išorės investuotojų, leidžia padidinti lankstumą ir strateginį ryžtą. Nepaisant suvokimo, kad yra nišinis žaidėjas, „SemiAnalysis“ patvirtina, kad „DeepSeek“ į savo AI ekosistemą įleido daugiau nei pusę milijardo dolerių.

DeepSeek savarankiškumas pažymi jį kaip unikalų varžovą; Skirtingai nuo daugelio dirbtinio intelekto įmonių, priklausančių nuo trečiųjų šalių debesijos paslaugų, ji valdo savo duomenų centrus.Ši nepriklausomybė suteikia visišką duomenų valdymo ir modelių optimizavimo kontrolę, todėl iteracijos vyksta greičiau, be išorinių apribojimų – tai esminis pranašumas sparčiai besivystančioje AI arenoje.

Aparatūros efektyvumas ir konkurencinis pranašumas

AI bendruomenė atkreipė dėmesį, kai „DeepSeek“ pristatė savo „DeepSeek-V3 Mixture-of-Experts“ (MoE) modelio aparatinės įrangos efektyvumą, kuris veikia su žymiai mažiau išteklių, palyginti su jo kolegomis JAV. Vėliau pristatytas R1 modelis, kuris yra OpenAI konkurentas, sustiprino jo reputaciją šioje srityje. Nepaisant to, pasakojimas apie ekonomiškas naujoves slepia didelį finansinį pagrindą – „SemiAnalysis“ pažymi, kad „DeepSeek“ skyrė maždaug 1, 6 mlrd. USD investicijoms į aparatinę įrangą.

Nors „DeepSeek“ sulaukė pripažinimo dėl tariamai ekonomiškų AI naujovių, atidžiau pažvelgus atskleidžiama kontrastinga istorija. Nors teigiama, kad R1 modelis buvo sukurtas naudojant tik 6 mln. USD ir 2 048 GPU, „DeepSeek“ infrastruktūros mastas su 50 000 „Nvidia Hopper“ GPU rodo, kad didelės bendrovės investicijos rodo sudėtingesnį jos AI kūrimo vaizdą.

Dažnai užduodami klausimai

1. Kuo „DeepSeek“ išsiskiria iš kitų AI startuolių?

„DeepSeek“ išsiskiria tuo, kad yra savarankiškas, valdo savo duomenų centrus, o ne pasikliauja trečiųjų šalių debesijos paslaugomis. Tai leidžia visiškai kontroliuoti duomenų valdymą ir greitesnius iteracijos ciklus be išorinių kliūčių, o tai suteikia konkurencinį pranašumą AI pramonėje.

2. Kaip DeepSeek užtikrina algoritminį efektyvumą?

„DeepSeek“ pabrėžia naujovišką AI architektūrą, pvz., „Multi-Head Latent Attention“ (MLA) sistemą. Daugiausia dėmesio skirdama algoritminiam efektyvumui, o ne vien skaičiavimo galiai, bendrovė siekia iš naujo apibrėžti DI sektoriaus mastelį, taip galbūt sumažindama priklausomybę nuo aukščiausios klasės GPU.

3. Kokias įdarbinimo strategijas taiko „DeepSeek“?

„DeepSeek“ taiko į vietinę įdarbinimo strategiją, apsirūpindama talentais tik iš Kinijos. Pirmenybė teikiama kandidatams pagal jų problemų sprendimo gebėjimus ir techninius įgūdžius, o ne formalią kvalifikaciją, dažnai pritraukiant geriausius talentus iš prestižinių universitetų su pelningais kompensacijų paketais.

Šaltinis ir vaizdai