DeepSeek pristato atvirojo kodo samprotavimo modelį DeepSeek-R1, kad galėtų konkuruoti su OpenAI o1

„DeepSeek“ pristato „DeepSeek-R1“: naują atvirojo kodo AI erą

Siekdama novatoriško dirbtinio intelekto pažangos, Kinijoje įsikūrusi pirmaujanti AI laboratorija „DeepSeek“ pristatė naujausius atvirojo kodo samprotavimo modelius: „DeepSeek-R1“ ir „DeepSeek-R1 Zero“ . Šie novatoriški modeliai sukurti siekiant demokratizuoti prieigą prie aukšto lygio samprotavimo galimybių, kartu užtikrinant konkurencingą našumą, kuris meta iššūkį esamiems pramonės etalonams.

„DeepSeek“ teigia, kad „DeepSeek-R1“ pagal našumą prilygsta „OpenAI“ o1 , o tai yra drąsus teiginys vis konkurencingesnėje AI aplinkoje. Jis sukurtas remiantis anksčiau sukurtu „DeepSeek V3“ pagrindu , o tai rodo žymų įvairių samprotavimo scenarijų pagerėjimą.

Našumo palyginimas: DeepSeek-R1 ir OpenAI o1

„DeepSeek“ atliko išsamią lyginamąją analizę, atskleidė, kad R1 ne tik prilygsta o1, bet ir išsiskiria tam tikrose srityse:

Pasiekė įspūdingą 79,8 % balą per 2024 m. Amerikos kviestinį matematikos egzaminą (AIME), pralenkdamas o1 79,2 % .
Pasiekė nepaprastą 97,3% sėkmės rodiklį naudojant MATH-500, viršijantį o1 96,4% .
Pasiektas 2 029 Codeforces įvertinimas , aplenkdamas 96,3 % programuotojų, o o1 surinko šiek tiek aukštesnį balą – 96,6 %.

Vertinant bendrąsias žinias, R1 surinko 90,8 % pagal Massive Multitask Language Understanding (MMLU) etaloną ir labai atsilieka nuo o1, kuris surinko 91,8 % . Šie įspūdingi rezultatai parodo pažangias R1 mąstymo galimybes, kurios gali gerai konkuruoti su nustatytais patentuotais modeliais.

Atvira prieiga ir naudojimas

Ypač verta atkreipti dėmesį į tai, kad „DeepSeek-R1“ galima įsigyti „HuggingFace“ pagal MIT licenciją, leidžiančią nemokamai naudoti net komercinėms programoms. Be to, R1 gali atlikti savitikrą, pašalindama vieną iš svarbiausių nepagrįstų AI modelių trūkumų ir galiausiai padidindama jos patikimumą įvairiose programose.

„DeepSeek-R1“ yra sunkaus svorio modelis, turintis 671 milijardą parametrų , o tai žymiai padidina jo problemų sprendimo galimybes. Naudotojams, turintiems mažiau reiklią aparatinę įrangą, „DeepSeek“ išleido „distiliuotas“ R1 versijas, kurių dydžiai svyruoja nuo 1,5 milijardo iki 70 milijardų parametrų , todėl jas galima naudoti standartiniuose nešiojamuosiuose kompiuteriuose. „DeepSeek-R1“ taip pat pasiekiama per „DeepSeek“ API, siūlanti nuo 90% iki 95% mažesnę kainą nei „OpenAI“ o1, todėl tai yra patraukli galimybė kūrėjams.

Inovacijos per stipresnį mokymąsi

Esminis „DeepSeek-R1“ skirtumas yra sustiprinimo mokymosi taikymas kartu su prižiūrimu koregavimu, išskiriant jį nuo modelių, tokių kaip o1, kurie remiasi minčių grandine. Ši naujovė ne tik padidina ekonominį efektyvumą, bet ir padidina modelio efektyvumą.

Reguliavimo iššūkiai ir apribojimai

Nepaisant to, „DeepSeek-R1“ susiduria su tam tikromis reguliavimo kliūtimis, atsižvelgiant į tai, kad jis sukurtas Kinijoje. Modelis atitinka Kinijos interneto institucijų vykdomas reguliavimo sistemas, užtikrinančias „pagrindinių socialistinių vertybių“ laikymąsi. Tai turi įtakos įvairioms nagrinėjamoms temoms, nes R1 savo atsakymuose sąmoningai vengia tokių sričių kaip Tiananmenio aikštė ir Taivano autonomija.

Atotrūkio mažinimas AGI link

Nepaisant šių apribojimų, DeepSeek-R1 išleidimas žengia žingsnius mažinant atotrūkį tarp atvirojo ir uždarojo kodo modelių, siekiant dirbtinio bendrojo intelekto (AGI). Tai reiškia ne tik techninį pasiekimą; jis demonstruoja didžiulį atvirojo kodo AI potencialą arenoje, kurioje dažnai dominuoja patentuotos sistemos. Sujungdama aukštą našumą su prieinamomis diegimo galimybėmis, „DeepSeek“ suteikia kūrėjams ir tyrinėtojams visame pasaulyje galimybę dalyvauti AI evoliucijoje.

Varžyboms dėl AGI stiprėjant, DeepSeek-R1 yra stiprus priminimas, kad atvirumas ir bendradarbiavimas bus labai svarbūs kuriant technologijų ateitį.

Dažnai užduodami klausimai

1. Kuo DeepSeek-R1 skiriasi nuo OpenAI o1?

DeepSeek-R1 naudoja sustiprinimo mokymąsi kartu su prižiūrimu koregavimu, skirtingai nei OpenAI o1, kuris remiasi minčių grandinės procesais. Tai leidžia sumažinti veiklos sąnaudas 90–95%, išlaikant konkurencingą našumą.

2. Ar yra kokių nors apribojimų naudoti DeepSeek-R1 komerciniais tikslais?

Ne, „DeepSeek-R1“ galima įsigyti pagal MIT licenciją, todėl vartotojai gali nemokamai naudoti modelį net komercinėse programose. Tai atveria plačias galimybes tiek verslui, tiek kūrėjams.

3. Kokie yra DeepSeek-R1 modelio apribojimai?

Nors „DeepSeek-R1“ gali pasigirti įspūdingomis galimybėmis, jam taikomi Kinijos interneto reglamentai, kurie gali apriboti jo atsakymus jautriomis temomis, tokiomis kaip Tiananmenio aikštė ar Taivano autonomija. Tai gali apriboti jo taikymą tam tikrose situacijose.