DeepSeek lanza el modelo de razonamiento de código abierto DeepSeek-R1 para competir con o1 de OpenAI

DeepSeek presenta DeepSeek-R1: una nueva era para la IA de código abierto

En un avance revolucionario en inteligencia artificial, DeepSeek, un laboratorio líder de inteligencia artificial con sede en China, ha presentado sus últimos modelos de razonamiento de código abierto: DeepSeek-R1 y DeepSeek-R1 Zero . Estos modelos innovadores están diseñados para democratizar el acceso a capacidades de razonamiento de alto nivel y, al mismo tiempo, brindar un rendimiento competitivo que desafía los parámetros de referencia existentes en la industria.

DeepSeek afirma que DeepSeek-R1 iguala a o1 de OpenAI en términos de rendimiento, lo que es una afirmación audaz en el panorama de la IA cada vez más competitivo. Se basa en la base del DeepSeek V3 establecido anteriormente , y muestra una mejora notable en varios escenarios de razonamiento.

Comparación de rendimiento: DeepSeek-R1 frente a o1 de OpenAI

DeepSeek ha llevado a cabo una evaluación comparativa exhaustiva que reveló que R1 no solo tiene un rendimiento similar al de o1, sino que también se destaca en ciertas áreas:

Obtuvo una puntuación impresionante del 79,8% en el Examen de Matemáticas por Invitación Estadounidense de 2024 (AIME), superando el 79,2% de o1 .
Obtuvo una notable tasa de éxito del 97,3% en MATH-500, superando el 96,4% de o1 .
Obtuvo una calificación de 2029 en Codeforces , lo que lo coloca por delante del 96,3 % de los programadores humanos, con o1 obteniendo una puntuación ligeramente superior con un 96,6 %.

En las evaluaciones de conocimientos generales, R1 obtuvo un puntaje de 90,8 % en el parámetro Massive Multitask Language Understanding (MMLU), muy cerca de o1, que obtuvo un puntaje de 91,8 % . Estos impresionantes resultados muestran las capacidades avanzadas de razonamiento de R1 que pueden competir bien contra los modelos propietarios establecidos.

Acceso abierto y usabilidad

Lo que es particularmente destacable es que DeepSeek-R1 está disponible en HuggingFace bajo una licencia MIT, lo que permite su uso gratuito, incluso para aplicaciones comerciales. Además, R1 puede realizar autoverificaciones de datos, lo que soluciona una de las deficiencias más importantes de los modelos de IA sin razonamiento y, en última instancia, mejora su fiabilidad en diversas aplicaciones.

DeepSeek-R1 es un modelo de peso pesado, que cuenta con 671 mil millones de parámetros , una escala que mejora significativamente sus capacidades de resolución de problemas. Para los usuarios con hardware menos exigente, DeepSeek ha lanzado versiones «destiladas» de R1, disponibles en tamaños que van desde 1.5 mil millones a 70 mil millones de parámetros , lo que las hace operables en computadoras portátiles estándar. DeepSeek-R1 también es accesible a través de la API de DeepSeek, lo que ofrece una ventaja de precio de 90% a 95% más baja que o1 de OpenAI, lo que lo convierte en una opción atractiva para los desarrolladores.

Innovación a través del aprendizaje por refuerzo

Una distinción fundamental de DeepSeek-R1 radica en su aplicación del aprendizaje de refuerzo en combinación con el ajuste fino supervisado, lo que lo diferencia de modelos como o1 que se basan en la cadena de pensamiento. Esta innovación no solo genera rentabilidad, sino que también mejora la eficiencia del modelo.

Desafíos y limitaciones regulatorias

No obstante, DeepSeek-R1 enfrenta algunos obstáculos regulatorios, dado que está desarrollado en China. El modelo se adhiere a los marcos regulatorios impuestos por las autoridades de Internet de China, lo que garantiza el cumplimiento de los «valores socialistas fundamentales». Esto tiene implicaciones en la variedad de temas que cubre, ya que R1 evita deliberadamente áreas como la Plaza de Tiananmen y la autonomía de Taiwán en sus respuestas.

Cerrando la brecha hacia la IAG

A pesar de estas limitaciones, el lanzamiento de DeepSeek-R1 supone un avance para cerrar la brecha entre los modelos de código abierto y los de código cerrado en la búsqueda de la inteligencia artificial general (AGI). Significa más que un simple logro técnico; muestra el enorme potencial de la IA de código abierto en un ámbito que suele estar dominado por sistemas propietarios. Al combinar un alto rendimiento con opciones de implementación accesibles, DeepSeek permite a los desarrolladores e investigadores de todo el mundo participar en la evolución de la IA.

A medida que se intensifica la carrera por la IA general, DeepSeek-R1 sirve como un potente recordatorio de que la apertura y la colaboración serán fundamentales para dar forma al futuro de la tecnología.

Preguntas frecuentes

1. ¿Qué hace que DeepSeek-R1 sea diferente del o1 de OpenAI?

DeepSeek-R1 utiliza aprendizaje de refuerzo combinado con ajuste fino supervisado, a diferencia de o1 de OpenAI, que se basa en procesos de cadena de pensamiento. Esto conduce a una reducción de los costos operativos del 90-95% manteniendo al mismo tiempo un rendimiento competitivo.

2. ¿Existen restricciones para utilizar DeepSeek-R1 con fines comerciales?

No, DeepSeek-R1 está disponible bajo una licencia MIT, lo que permite a los usuarios utilizar el modelo de forma gratuita, incluso en aplicaciones comerciales. Esto abre una amplia gama de posibilidades tanto para empresas como para desarrolladores.

3. ¿Cuáles son las limitaciones del modelo DeepSeek-R1?

Si bien DeepSeek-R1 cuenta con capacidades impresionantes, está sujeto a las regulaciones de Internet chinas, que pueden restringir sus respuestas sobre temas delicados, como la Plaza de Tiananmen o la autonomía de Taiwán, lo que podría limitar su aplicabilidad en ciertos contextos.

Fuente e imágenes