How To

Цена революции искусственного интеллекта DeepSeek: 50 000 графических процессоров и рост

February 3, 2025 1 минута чтения Обновлено: February 3, 2025

Рост популярности DeepSeek в сфере искусственного интеллекта

Стремительный взлет DeepSeek иллюстрирует потенциал гибкой, хорошо финансируемой компании ИИ, способной бросить вызов признанным лидерам отрасли.По мере того, как растет общественное восхищение ее вехами, скрытая реальность раскрывает сложную ткань, сотканную из стратегической финансовой поддержки, передовых технологий и высококонкурентного рынка талантов.

Стратегические финансовые инвестиции, стимулирующие рост

Недавняя траектория DeepSeek может быть отнесена — согласно SemiAnalysis — к миллиардам, инвестированным в инфраструктуру ИИ и исчерпывающим исследовательским инициативам.Примечательно, что Илон Маск подчеркнул, что конкуренция в области ИИ требует ежегодных инвестиций в миллиарды — цифра, которая резонирует с обширными финансовыми обязательствами DeepSeek.

Хотя утверждение, что DeepSeek удалось обучить свою сложную модель ИИ всего за 6 миллионов долларов, впечатляет, эта цифра учитывает только расходы на предварительное обучение GPU.Она удобно игнорирует важные расходы, включая управление данными, тонкую настройку модели и настройку инфраструктуры.На сегодняшний день общие инвестиции DeepSeek в деятельность, связанную с ИИ, превысили 500 миллионов долларов, что характеризуется гибкой организационной структурой, которая избегает бюрократических препон, способствуя быстрому прогрессу и инновациям.

Инновационная инфраструктура и технологические достижения

Отличительной особенностью DeepSeek является его надежная вычислительная сеть, которая, как утверждается, включает около 50 000 графических процессоров Nvidia Hopper, включая такие модели, как H800, H100 и новейшие блоки H20.Стратегическое размещение этих графических процессоров в различных центрах обработки данных поддерживает критически важные задачи в исследованиях ИИ, финансовом моделировании и обширном обучении моделей. SemiAnalysis оценивает, что капитальные вложения DeepSeek в серверы приближаются к 1, 6 млрд долларов, а эксплуатационные расходы почти достигают 944 млн долларов.

Современная архитектура искусственного интеллекта

Изобретательная архитектура ИИ, разработанная DeepSeek, в частности, ее Multi-Head Latent Attention (MLA), вносит значительный вклад в ее достижение.Этот инновационный подход требует обширных исследований и значительной зависимости от графических процессоров.В отличие от конкурентов, которые в значительной степени зависят от вычислительных результатов, DeepSeek отдает приоритет алгоритмической эффективности, изменяя ожидания масштабируемости в секторе ИИ.Этот сдвиг парадигмы поднимает вопросы о будущей необходимости высокопроизводительных графических процессоров, потенциально влияя на такие компании, как Nvidia.

Уникальная стратегия подбора персонала

DeepSeek четко придерживается стратегии подбора кадров, ориентированной на внутренний рынок, предпочитая привлекать таланты исключительно из Китая.Фирма отдает приоритет кандидатам с сильными навыками решения проблем и техническим мастерством по сравнению с обычными квалификациями, создавая структуру подбора кадров, которая охватывает такие престижные учреждения, как Пекинский и Чжэцзянский университеты.Сообщается, что компенсационные пакеты для ведущих исследователей могут превышать 1, 3 миллиона долларов, что превосходит даже таких крупных игроков, как Moonshot в китайской области искусственного интеллекта.

Самодостаточность и операционная независимость

Основанная High-Flyer, дальновидным китайским хедж-фондом, изначально сосредоточенным на ИИ, DeepSeek стала независимой организацией в 2023 году, сосредоточившись исключительно на искусственном интеллекте.Эта автономия, не обремененная внешними инвесторами, обеспечивает большую гибкость и стратегическую решительность.Несмотря на восприятие себя как нишевого игрока, SemiAnalysis подтверждает, что DeepSeek вложила более полумиллиарда долларов в свою экосистему ИИ.

Самодостаточность DeepSeek делает его уникальным претендентом; в отличие от многих стартапов ИИ, зависящих от сторонних облачных сервисов, он управляет своими центрами обработки данных.Эта независимость обеспечивает полный контроль над управлением данными и оптимизацией моделей, что приводит к более быстрым итерациям без внешних ограничений — существенное преимущество на быстро развивающейся арене ИИ.

Эффективность оборудования и конкурентное преимущество

Сообщество ИИ обратило внимание, когда DeepSeek представила аппаратную эффективность своей модели DeepSeek-V3 Mixture-of-Experts (MoE), которая функционирует с гораздо меньшими ресурсами по сравнению с ее американскими аналогами.Последующее введение модели R1, которая позиционирует себя как конкурент предложений OpenAI, укрепило ее репутацию в этой области.Тем не менее, повествование об экономически эффективных инновациях скрывает существенную финансовую основу — SemiAnalysis отмечает, что DeepSeek выделила около 1, 6 млрд долларов на инвестиции в оборудование.

В то время как DeepSeek получила признание за свои предполагаемые экономически эффективные инновации в области ИИ, более пристальный взгляд открывает контрастную историю.Хотя утверждается, что модель R1 была разработана всего за 6 миллионов долларов и 2048 графических процессоров, масштаб инфраструктуры DeepSeek с ее 50 000 графических процессоров Nvidia Hopper предполагает, что существенные инвестиции компании представляют более сложную картину относительно характера ее разработки ИИ.

Часто задаваемые вопросы

1.Что отличает DeepSeek от других стартапов в области ИИ?

DeepSeek отличается своей самодостаточностью, эксплуатируя собственные центры обработки данных, а не полагаясь на сторонние облачные сервисы.Это позволяет полностью контролировать управление данными и ускорять циклы итераций без внешних узких мест, обеспечивая конкурентное преимущество в отрасли ИИ.

2.Как DeepSeek обеспечивает эффективность алгоритма?

DeepSeek делает акцент на инновационной архитектуре ИИ, например, системе Multi-Head Latent Attention (MLA).Сосредоточившись на эффективности алгоритмов, а не на чистой вычислительной мощности, компания стремится переопределить масштабируемость в секторе ИИ, потенциально снижая зависимость от высокопроизводительных графических процессоров.

3.Какие стратегии подбора персонала использует DeepSeek?

DeepSeek использует стратегию подбора кадров, ориентированную на внутренний рынок, находя таланты исключительно в Китае.Компания отдает приоритет кандидатам на основе их способностей решать проблемы и технических навыков, а не формальной квалификации, часто привлекая лучших специалистов из престижных университетов с выгодными компенсационными пакетами.

Источник и изображения