DeepSeek lança modelo de raciocínio de código aberto DeepSeek-R1 para competir com o o1 da OpenAI

DeepSeek apresenta DeepSeek-R1: uma nova era para IA de código aberto

Em um avanço inovador em inteligência artificial, a DeepSeek, um laboratório de IA líder com sede na China, apresentou seus mais recentes modelos de raciocínio de código aberto: DeepSeek-R1 e DeepSeek-R1 Zero . Esses modelos inovadores são projetados para democratizar o acesso a recursos de raciocínio de alto nível, ao mesmo tempo em que fornecem desempenho competitivo que desafia os benchmarks existentes no setor.

A DeepSeek afirma que o DeepSeek-R1 é igual ao o1 da OpenAI em termos de desempenho, o que é uma afirmação ousada no cenário de IA cada vez mais competitivo. Ele é construído sobre a fundação do DeepSeek V3 previamente estabelecido , mostrando uma melhoria marcante em vários cenários de raciocínio.

Comparação de desempenho: DeepSeek-R1 vs. o1 da OpenAI

A DeepSeek conduziu uma extensa análise comparativa, revelando que o R1 não só tem um desempenho equivalente ao o1, mas também se destaca em certas áreas:

Alcançou uma pontuação impressionante de 79,8% no Exame Americano de Matemática Convidativo (AIME) de 2024, superando os 79,2% do o1 .
Alcançou uma notável taxa de sucesso de 97,3% em MATH-500, superando os 96,4% do o1 .
Obteve uma classificação Codeforces de 2.029 , ficando à frente de 96,3% dos programadores humanos, com o o1 pontuando um pouco mais alto, 96,6%.

Em avaliações de conhecimento geral, o R1 pontuou 90,8% no benchmark Massive Multitask Language Understanding (MMLU), logo atrás do o1, que pontuou 91,8% . Esses resultados impressionantes mostram as capacidades avançadas de raciocínio do R1 que podem competir bem contra modelos proprietários estabelecidos.

Acesso aberto e usabilidade

O que é particularmente notável é que o DeepSeek-R1 está disponível no HuggingFace sob uma licença do MIT, permitindo uso gratuito, mesmo para aplicações comerciais. Além disso, o R1 pode executar autoverificação de fatos, abordando uma das deficiências mais significativas em modelos de IA não racionais, aumentando, em última análise, sua confiabilidade em várias aplicações.

DeepSeek-R1 é um modelo pesado, ostentando 671 bilhões de parâmetros , uma escala que melhora significativamente suas capacidades de resolução de problemas. Para usuários com hardware menos exigente, a DeepSeek lançou versões “destiladas” do R1, disponíveis em tamanhos que variam de 1,5 bilhão a 70 bilhões de parâmetros , tornando-os operáveis em laptops padrão. O DeepSeek-R1 também é acessível através da API da DeepSeek, oferecendo uma vantagem de preço de 90% a 95% menor do que o o1 da OpenAI, tornando-o uma opção atraente para desenvolvedores.

Inovação através da aprendizagem por reforço

Uma distinção fundamental para o DeepSeek-R1 está na sua aplicação de aprendizado por reforço em combinação com ajuste fino supervisionado, diferenciando-o de modelos como o1 que dependem de cadeia de pensamento. Essa inovação não só leva à relação custo-benefício, mas também aumenta a eficiência do modelo.

Desafios e limitações regulatórias

No entanto, o DeepSeek-R1 enfrenta alguns obstáculos regulatórios, dado que é desenvolvido na China. O modelo adere às estruturas regulatórias impostas pelas autoridades de internet da China, garantindo a conformidade com os “valores socialistas essenciais”. Isso tem implicações na gama de tópicos abrangidos, pois o R1 evita deliberadamente áreas como a Praça da Paz Celestial e a autonomia de Taiwan em suas respostas.

Reduzindo a lacuna em direção à IAG

Apesar dessas limitações, o lançamento do DeepSeek-R1 avança em direção ao fechamento da lacuna entre modelos de código aberto e fechado na busca pela Inteligência Artificial Geral (AGI). Ele significa mais do que apenas uma conquista técnica; ele mostra o vasto potencial da IA de código aberto em uma arena frequentemente dominada por sistemas proprietários. Ao unir alto desempenho com opções de implantação acessíveis, o DeepSeek está capacitando desenvolvedores e pesquisadores globalmente a participar da evolução da IA.

À medida que a corrida pela AGI se intensifica, o DeepSeek-R1 serve como um poderoso lembrete de que a abertura e a colaboração serão essenciais para moldar o futuro da tecnologia.

Perguntas frequentes

1. O que torna o DeepSeek-R1 diferente do o1 da OpenAI?

O DeepSeek-R1 utiliza aprendizado por reforço combinado com ajuste fino supervisionado, diferente do o1 da OpenAI, que depende de processos de cadeia de pensamento. Isso leva a uma redução de custos operacionais de 90-95%, mantendo o desempenho competitivo.

2. Há alguma restrição quanto ao uso do DeepSeek-R1 para fins comerciais?

Não, o DeepSeek-R1 está disponível sob uma licença MIT, permitindo que os usuários utilizem o modelo gratuitamente, mesmo em aplicações comerciais. Isso abre uma ampla gama de possibilidades para empresas e desenvolvedores.

3. Quais são as limitações do modelo DeepSeek-R1?

Embora o DeepSeek-R1 ostente capacidades impressionantes, ele está sujeito às regulamentações da internet chinesa, que podem restringir suas respostas em tópicos sensíveis, como a Praça da Paz Celestial ou a autonomia de Taiwan. Isso pode limitar sua aplicabilidade em certos contextos.

Fonte e Imagens