How To

Цената на DeepSeek AI Revolution: 50 000 графични процесора и нарастване

February 3, 2025 1 минута четене Актуализирано: February 3, 2025

Възходът на DeepSeek в пейзажа на AI

Бързото издигане на DeepSeek илюстрира потенциала на една гъвкава, добре финансирана фирма за изкуствен интелект да предизвика утвърдени лидери в индустрията.Тъй като общественото очарование расте около основните етапи, основната реалност разкрива сложен гоблен, изтъкан със стратегическа финансова подкрепа, напреднала технология и силно конкурентен пазар на таланти.

Стратегически финансови инвестиции, стимулиращи растежа

Неотдавнашната траектория на DeepSeek може да се отдаде — според SemiAnalysis — на милиарди, инвестирани в AI инфраструктура и изчерпателни изследователски инициативи.За отбелязване е, че Илон Мъск подчерта, че конкуренцията в AI изисква годишни инвестиции в милиарди – цифра, която резонира с обширните финансови ангажименти на DeepSeek.

Въпреки че е впечатляващо да се твърди, че DeepSeek успя да обучи своя усъвършенстван AI модел само за $6 милиона, тази цифра отчита само разходите за предварително обучение на GPU.Той удобно пренебрегва важните разходи, включително управление на данни, фина настройка на модела и настройка на инфраструктурата.Към днешна дата общата инвестиция на DeepSeek в дейности, свързани с изкуствения интелект, е надхвърлила 500 милиона долара, характеризиращи се с гъвкава организационна структура, която избягва бюрократичните препятствия, насърчавайки бърз напредък и иновации.

Иновативна инфраструктура и технологичен напредък

Отличителна черта на DeepSeek е неговата стабилна изчислителна мрежа, за която се предполага, че включва около 50 000 Nvidia Hopper GPU, включително модели като H800s, H100s и най-новите H20 единици.Стратегическото разполагане на тези графични процесори в различни центрове за данни поддържа критични задачи при изследвания с изкуствен интелект, финансови симулации и обширно обучение за модели. SemiAnalysis изчислява, че капиталовата инвестиция на DeepSeek в сървъри е близо 1, 6 милиарда долара, като оперативните разходи почти достигат 944 милиона долара.

Авангардна AI архитектура

Изобретателната AI архитектура, разработена от DeepSeek, особено нейното латентно внимание с множество глави (MLA), значително допринася за постигането му.Този иновативен подход налага задълбочени изследвания и силно разчитане на GPU.За разлика от конкурентите, които силно зависят от изчислителните резултати, DeepSeek дава приоритет на ефективността на алгоритмите – преоформяйки очакванията за скалируемост в сектора на ИИ.Тази промяна на парадигмата повдига въпроси относно бъдещата необходимост от графични процесори от висок клас, които потенциално оказват влияние върху компании като Nvidia.

Уникална стратегия за набиране на персонал

Отличително, DeepSeek възприема стратегия за набиране на персонал, фокусирана върху вътрешния пазар, като предпочита да набира таланти изключително от Китай.Фирмата дава приоритет на кандидати със силни умения за решаване на проблеми и технически способности пред конвенционалните квалификации, създавайки рамка за набиране на персонал, която включва престижни институции като университетите в Пекин и Джъдзян.Съобщава се, че компенсационните пакети за най-добрите изследователи могат да надхвърлят 1, 3 милиона долара, надминавайки дори големи играчи като Moonshot в китайския AI домейн.

Самодостатъчност и оперативна независимост

Основан от High-Flyer, далновиден китайски хедж фонд, първоначално съсредоточен върху AI, DeepSeek стана независим субект през 2023 г., като се фокусира единствено върху изкуствения интелект.Тази автономия, необременена от външни инвеститори, позволява повишена гъвкавост и стратегическа решителност.Въпреки възприятията, че е нишов играч, SemiAnalysis потвърждава, че DeepSeek е налял над половин милиард долара в своята AI екосистема.

Самодостатъчността на DeepSeek го маркира като уникален претендент; за разлика от много стартиращи AI компании, зависими от облачни услуги на трети страни, тя управлява своите центрове за данни.Тази независимост позволява пълен контрол върху управлението на данни и оптимизациите на модела, което води до по-бързи итерации, лишени от външни ограничения – съществено предимство в бързо развиващата се арена на ИИ.

Хардуерна ефективност и конкурентно предимство

AI общността обърна внимание, когато DeepSeek разкри хардуерната ефективност на своя модел DeepSeek-V3 Mixture-of-Experts (MoE), който функционира със значително по-малко ресурси в сравнение със своите колеги в САЩ.Последвалото представяне на модела R1, който се позиционира като съперник на предложенията на OpenAI, затвърди репутацията му в тази област.Независимо от това, разказът за рентабилните иновации крие значителна финансова основа – SemiAnalysis отбелязва, че DeepSeek е отделил приблизително 1, 6 милиарда долара за хардуерни инвестиции.

Въпреки че DeepSeek спечели признание за своите предполагаеми рентабилни иновации с изкуствен интелект, по-внимателен поглед разкрива контрастираща история.Въпреки че се твърди, че моделът R1 е разработен само с $6 милиона и 2048 графични процесора, мащабът на инфраструктурата на DeepSeek с неговите 50 000 графични процесора Nvidia Hopper предполага, че значителните инвестиции на компанията представят по-сложна картина по отношение на естеството на нейното AI развитие.

Често задавани въпроси

1.Какво отличава DeepSeek от другите стартиращи AI компании?

DeepSeek се отличава със своята самодостатъчност, управлявайки свои собствени центрове за данни, вместо да разчита на облачни услуги на трети страни.Това позволява пълен контрол върху управлението на данни и по-бързи итерационни цикли без външни затруднения, осигурявайки конкурентно предимство в индустрията на ИИ.

2.Как DeepSeek осигурява ефективност на алгоритмите?

DeepSeek набляга на новаторската AI архитектура, като системата за латентно внимание с множество глави (MLA).Като се фокусира върху алгоритмичната ефективност, а не върху чистата изчислителна мощност, компанията цели да предефинира скалируемостта в сектора на изкуствения интелект, потенциално намалявайки зависимостта от графични процесори от висок клас.

3.Какви стратегии за набиране на персонал използва DeepSeek?

DeepSeek възприема стратегия за набиране на персонал, фокусирана върху вътрешния пазар, като набира талант изключително от Китай.Той дава приоритет на кандидатите въз основа на техните способности за решаване на проблеми и технически умения, а не на формални квалификации, като често привлича топ таланти от престижни университети с изгодни компенсационни пакети.

Източник и изображения