DeepSeek izlaiž atvērtā pirmkoda spriešanas modeli DeepSeek-R1, lai konkurētu ar OpenAI o1

DeepSeek iepazīstina ar DeepSeek-R1: jaunu atvērtā koda AI laikmetu

Revolucionārā mākslīgā intelekta attīstībā DeepSeek, vadošā mākslīgā intelekta laboratorija, kas atrodas Ķīnā, ir ieviesusi savus jaunākos atvērtā pirmkoda spriešanas modeļus: DeepSeek-R1 un DeepSeek-R1 Zero . Šie inovatīvie modeļi ir izstrādāti, lai demokratizētu piekļuvi augsta līmeņa spriešanas spējām, vienlaikus nodrošinot konkurētspējīgu veiktspēju, kas izaicina esošos etalonus nozarē.

DeepSeek apgalvo, ka DeepSeek-R1 veiktspējas ziņā ir vienāds ar OpenAI o1 , kas ir drosmīgs apgalvojums arvien pieaugošā AI vidē. Tas ir veidots uz iepriekš izveidotā DeepSeek V3 pamata , kas liecina par ievērojamu uzlabojumu dažādos argumentācijas scenārijos.

Veiktspējas salīdzinājums: DeepSeek-R1 pret OpenAI o1

DeepSeek ir veicis plašu salīdzinošo novērtēšanu, atklājot, ka R1 ne tikai darbojas līdzvērtīgi o1, bet arī izceļas noteiktās jomās:

Sasniedza iespaidīgu 79,8% punktu skaitu 2024. gada Amerikas ielūguma matemātikas eksāmenā (AIME), pārspējot o1 79,2% .
Sasniedza ievērojamu 97,3% panākumu līmeni ar MATH-500, pārsniedzot o1 96,4% .
Sasniedza Codeforces vērtējumu 2029 , apsteidzot 96,3% programmētāju, bet o1 ieguva nedaudz augstāku punktu skaitu — 96,6%.

Vispārējo zināšanu novērtējumos R1 ieguva 90,8% Massive Multitask Language Understanding (MMLU) etalona, kas cieši atpaliek no o1, kas ieguva 91,8% . Šie iespaidīgie rezultāti parāda R1 uzlabotās spriešanas spējas, kas var labi konkurēt ar vispāratzītiem patentētiem modeļiem.

Atvērtā piekļuve un lietojamība

Īpaši ievērības cienīgs ir tas, ka DeepSeek-R1 ir pieejams vietnē HuggingFace saskaņā ar MIT licenci, kas ļauj to bez maksas izmantot pat komerciāliem lietojumiem. Turklāt R1 var veikt pašfaktu pārbaudi, novēršot vienu no nozīmīgākajiem trūkumiem nepamatotajos mākslīgā intelekta modeļos, galu galā uzlabojot tā uzticamību dažādās lietojumprogrammās.

DeepSeek-R1 ir smagsvara modelis, kas var lepoties ar 671 miljardu parametru , kas ievērojami uzlabo tā problēmu risināšanas iespējas. Lietotājiem ar mazāk prasīgu aparatūru DeepSeek ir izlaidusi “destilētas” R1 versijas, kas pieejamas izmēros no 1,5 miljardiem līdz 70 miljardiem parametru , padarot tās darbināmas standarta klēpjdatoros. DeepSeek-R1 ir pieejams arī, izmantojot DeepSeek API, piedāvājot par 90% līdz 95% zemākas cenas priekšrocības nekā OpenAI o1, padarot to par pievilcīgu iespēju izstrādātājiem.

Inovācija, izmantojot pastiprinošu mācīšanos

DeepSeek-R1 būtiska atšķirība ir pastiprināšanas mācīšanās pielietojumā kombinācijā ar uzraudzītu precizēšanu, atšķirot to no tādiem modeļiem kā o1, kas balstās uz domu ķēdi. Šis jauninājums ne tikai nodrošina rentabilitāti, bet arī uzlabo modeļa efektivitāti.

Normatīvie izaicinājumi un ierobežojumi

Tomēr DeepSeek-R1 saskaras ar dažiem regulējošiem šķēršļiem, ņemot vērā, ka tas ir izstrādāts Ķīnā. Modelis atbilst Ķīnas interneta iestāžu noteiktajiem normatīvajiem regulējumiem, nodrošinot atbilstību “sociālisma pamatvērtībām”. Tam ir ietekme uz aptverto tēmu loku, jo R1 savās atbildēs apzināti izvairās no tādām jomām kā Tjaņaņmeņas laukums un Taivānas autonomija.

Atšķirības pārvarēšana AGI virzienā

Neskatoties uz šiem ierobežojumiem, DeepSeek-R1 izlaišana sper soļus, lai mazinātu plaisu starp atvērtā un slēgtā koda modeļiem mākslīgā vispārējā intelekta (AGI) meklējumos. Tas nozīmē vairāk nekā tikai tehnisku sasniegumu; tas demonstrē plašo atvērtā koda AI potenciālu arēnā, kurā bieži dominē patentētas sistēmas. Apvienojot augstu veiktspēju ar pieejamām izvietošanas iespējām, DeepSeek dod iespēju izstrādātājiem un pētniekiem visā pasaulē piedalīties AI attīstībā.

Pastiprinoties sacensībām par AGI, DeepSeek-R1 kalpo kā spēcīgs atgādinājums, ka atvērtība un sadarbība būs izšķiroša nozīme tehnoloģiju nākotnes veidošanā.

Bieži uzdotie jautājumi

1. Ar ko DeepSeek-R1 atšķiras no OpenAI o1?

DeepSeek-R1 izmanto pastiprināšanas mācīšanos apvienojumā ar uzraudzītu precizēšanu, atšķirībā no OpenAI o1, kas balstās uz domu ķēdes procesiem. Tas noved pie ekspluatācijas izmaksu samazināšanās par 90–95%, vienlaikus saglabājot konkurētspējīgu sniegumu.

2. Vai ir kādi ierobežojumi DeepSeek-R1 lietošanai komerciālos nolūkos?

Nē, DeepSeek-R1 ir pieejams ar MIT licenci, kas ļauj lietotājiem bez maksas izmantot modeli pat komerciālos lietojumos. Tas paver plašas iespējas gan uzņēmumiem, gan izstrādātājiem.

3. Kādi ir DeepSeek-R1 modeļa ierobežojumi?

Lai gan DeepSeek-R1 lepojas ar iespaidīgām iespējām, uz to attiecas Ķīnas interneta noteikumi, kas var ierobežot tā atbildes uz jutīgām tēmām, piemēram, Tjaņaņmeņas laukumu vai Taivānas autonomiju. Tas varētu ierobežot tā piemērojamību noteiktos kontekstos.