DeepSeek запускает модель рассуждений с открытым исходным кодом DeepSeek-R1, чтобы конкурировать с o1 от OpenAI

DeepSeek представляет DeepSeek-R1: новую эру для ИИ с открытым исходным кодом

В революционном прорыве в области искусственного интеллекта DeepSeek, ведущая лаборатория ИИ в Китае, представила свои новейшие модели рассуждений с открытым исходным кодом: DeepSeek-R1 и DeepSeek-R1 Zero . Эти инновационные модели призваны демократизировать доступ к возможностям рассуждений высокого уровня, обеспечивая при этом конкурентоспособную производительность, которая бросает вызов существующим стандартам в отрасли.

DeepSeek утверждает, что DeepSeek-R1 равен OpenAI o1 с точки зрения производительности, что является смелым утверждением в условиях все более конкурентной среды ИИ. Он построен на основе ранее созданного DeepSeek V3 , демонстрируя заметное улучшение в различных сценариях рассуждений.

Сравнение производительности: DeepSeek-R1 против o1 от OpenAI

DeepSeek провел обширный сравнительный анализ, показав, что R1 не только работает наравне с o1, но и превосходит его в некоторых областях:

На Американском пригласительном экзамене по математике (AIME) 2024 года получен впечатляющий результат в 79,8% , что превышает результат o1 в 79,2% .
Достиг замечательного показателя успешной сдачи экзамена MATH-500 — 97,3% , превысив показатель o1 — 96,4% .
Получил рейтинг Codeforces 2029 , опередив 96,3% программистов-людей, а o1 набрал немного больше — 96,6%.

В общих оценках знаний R1 набрал 90,8% по тесту Massive Multitask Language Understanding (MMLU), немного отстав от o1, который набрал 91,8% . Эти впечатляющие результаты демонстрируют передовые возможности рассуждения R1, которые могут конкурировать с устоявшимися фирменными моделями.

Открытый доступ и удобство использования

Что особенно примечательно, так это то, что DeepSeek-R1 доступен на HuggingFace по лицензии MIT, что позволяет использовать его бесплатно, даже для коммерческих приложений. Кроме того, R1 может выполнять самопроверку фактов, устраняя один из самых существенных недостатков в моделях ИИ без рассуждений, в конечном итоге повышая его надежность в различных приложениях.

DeepSeek-R1 — это тяжеловесная модель, которая может похвастаться 671 миллиардом параметров , масштаб, который значительно расширяет ее возможности решения проблем. Для пользователей с менее требовательным оборудованием DeepSeek выпустила «дистиллированные» версии R1, доступные в размерах от 1,5 миллиардов до 70 миллиардов параметров , что делает их работоспособными на стандартных ноутбуках. DeepSeek-R1 также доступен через API DeepSeek, предлагая ценовое преимущество на 90%-95% ниже, чем o1 от OpenAI, что делает его привлекательным вариантом для разработчиков.

Инновации посредством обучения с подкреплением

Фундаментальное отличие DeepSeek-R1 заключается в применении обучения с подкреплением в сочетании с контролируемой тонкой настройкой, что отличает его от моделей типа o1, которые полагаются на цепочку мыслей. Это нововведение не только приводит к экономической эффективности, но и повышает эффективность модели.

Проблемы и ограничения регулирования

Тем не менее, DeepSeek-R1 сталкивается с некоторыми нормативными препятствиями, учитывая, что он разработан в Китае. Модель придерживается нормативных рамок, применяемых китайскими интернет-властями, гарантируя соответствие «основным социалистическим ценностям». Это влияет на спектр охватываемых тем, поскольку R1 намеренно избегает в своих ответах таких областей, как площадь Тяньаньмэнь и автономия Тайваня.

Преодоление разрыва на пути к AGI

Несмотря на эти ограничения, выпуск DeepSeek-R1 делает шаги к сокращению разрыва между моделями с открытым и закрытым исходным кодом в поисках Искусственного Общего Интеллекта (AGI). Это означает больше, чем просто техническое достижение; он демонстрирует огромный потенциал ИИ с открытым исходным кодом в области, где часто доминируют проприетарные системы. Объединяя высокую производительность с доступными вариантами развертывания, DeepSeek дает разработчикам и исследователям по всему миру возможность участвовать в эволюции ИИ.

По мере того, как гонка за ОИИ набирает обороты, DeepSeek-R1 служит убедительным напоминанием о том, что открытость и сотрудничество будут иметь решающее значение в формировании будущего технологий.

Часто задаваемые вопросы

1. Чем DeepSeek-R1 отличается от o1 от OpenAI?

DeepSeek-R1 использует обучение с подкреплением в сочетании с контролируемой тонкой настройкой, в отличие от o1 от OpenAI, который полагается на цепочку мыслительных процессов. Это приводит к снижению эксплуатационных расходов на 90-95% при сохранении конкурентоспособной производительности.

2. Существуют ли ограничения на использование DeepSeek-R1 в коммерческих целях?

Нет, DeepSeek-R1 доступен по лицензии MIT, что позволяет пользователям использовать модель бесплатно, даже в коммерческих приложениях. Это открывает широкий спектр возможностей для предприятий и разработчиков.

3. Каковы ограничения модели DeepSeek-R1?

Хотя DeepSeek-R1 может похвастаться впечатляющими возможностями, он подчиняется китайским интернет-правилам, которые могут ограничивать его ответы на деликатные темы, такие как площадь Тяньаньмэнь или автономия Тайваня. Это может ограничить его применимость в определенных контекстах.

Источник и изображения