{"id":7396,"date":"2025-01-23T08:45:16","date_gmt":"2025-01-23T08:45:16","guid":{"rendered":"https:\/\/howtogeek.blog\/lt\/?p=7396"},"modified":"2025-01-23T08:45:16","modified_gmt":"2025-01-23T08:45:16","slug":"deepseek-launches-opensource-reasoning-model-deepseekr1-to-compete-with-openais-o1","status":"publish","type":"post","link":"https:\/\/howtogeek.blog\/lt\/deepseek-launches-opensource-reasoning-model-deepseekr1-to-compete-with-openais-o1\/","title":{"rendered":"DeepSeek pristato atvirojo kodo samprotavimo model\u012f DeepSeek-R1, kad gal\u0117t\u0173 konkuruoti su OpenAI o1"},"content":{"rendered":"<h2>\u201eDeepSeek\u201c pristato \u201eDeepSeek-R1\u201c: nauj\u0105 atvirojo kodo AI er\u0105<\/h2>\n<p>Siekdama novatori\u0161ko dirbtinio intelekto pa\u017eangos, Kinijoje \u012fsik\u016brusi pirmaujanti AI laboratorija \u201eDeepSeek\u201c pristat\u0117 naujausius atvirojo kodo samprotavimo modelius: <strong>\u201eDeepSeek-R1\u201c<\/strong> ir <strong>\u201eDeepSeek-R1 Zero\u201c<\/strong> . \u0160ie novatori\u0161ki modeliai sukurti siekiant demokratizuoti prieig\u0105 prie auk\u0161to lygio samprotavimo galimybi\u0173, kartu u\u017etikrinant konkurencing\u0105 na\u0161um\u0105, kuris meta i\u0161\u0161\u016bk\u012f esamiems pramon\u0117s etalonams.<\/p>\n<p>\u201eDeepSeek\u201c teigia, kad <strong>\u201eDeepSeek-R1\u201c<\/strong> pagal na\u0161um\u0105 prilygsta <strong>\u201eOpenAI\u201c o1 , o tai yra dr\u0105sus teiginys vis konkurencingesn\u0117je AI aplinkoje. Jis sukurtas remiantis anks\u010diau sukurtu <\/strong><strong>\u201eDeepSeek V3\u201c<\/strong> pagrindu , o tai rodo \u017eym\u0173 \u012fvairi\u0173 samprotavimo scenarij\u0173 pager\u0117jim\u0105.<\/p>\n<h2>Na\u0161umo palyginimas: DeepSeek-R1 ir OpenAI o1<\/h2>\n<p>\u201eDeepSeek\u201c atliko i\u0161sami\u0105 lyginam\u0105j\u0105 analiz\u0119, atskleid\u0117, kad R1 ne tik prilygsta o1, bet ir i\u0161siskiria tam tikrose srityse:<\/p>\n<ul>\n<li>Pasiek\u0117 \u012fsp\u016bding\u0105 <strong>79,8 %<\/strong> bal\u0105 per 2024 m. Amerikos kviestin\u012f matematikos egzamin\u0105 (AIME), pralenkdamas o1 <strong>79,2 %<\/strong> .<\/li>\n<li>Pasiek\u0117 nepaprast\u0105 <strong>97,3%<\/strong> s\u0117km\u0117s rodikl\u012f naudojant MATH-500, vir\u0161ijant\u012f o1 <strong>96,4%<\/strong> .<\/li>\n<li>Pasiektas <strong>2 029 Codeforces \u012fvertinimas<\/strong> , aplenkdamas 96,3 % programuotoj\u0173, o o1 surinko \u0161iek tiek auk\u0161tesn\u012f bal\u0105 \u2013 96,6 %.<\/li>\n<\/ul>\n<p>Vertinant bendr\u0105sias \u017einias, R1 surinko <strong>90,8 %<\/strong> pagal Massive Multitask Language Understanding (MMLU) etalon\u0105 ir labai atsilieka nuo o1, kuris surinko <strong>91,8 %<\/strong> . \u0160ie \u012fsp\u016bdingi rezultatai parodo pa\u017eangias R1 m\u0105stymo galimybes, kurios gali gerai konkuruoti su nustatytais patentuotais modeliais.<\/p>\n<h2>Atvira prieiga ir naudojimas<\/h2>\n<p>Ypa\u010d verta atkreipti d\u0117mes\u012f \u012f tai, kad <strong>\u201eDeepSeek-R1\u201c<\/strong> galima \u012fsigyti <a href=\"https:\/\/huggingface.co\/models\" rel=\"noopener noreferrer nofollow\" target=\"_blank\">\u201eHuggingFace\u201c<\/a> pagal MIT licencij\u0105, leid\u017eian\u010di\u0105 nemokamai naudoti net komercin\u0117ms programoms. Be to, R1 gali atlikti savitikr\u0105, pa\u0161alindama vien\u0105 i\u0161 svarbiausi\u0173 nepagr\u012fst\u0173 AI modeli\u0173 tr\u016bkum\u0173 ir galiausiai padidindama jos patikimum\u0105 \u012fvairiose programose.<\/p>\n<p><strong>\u201eDeepSeek-R1\u201c<\/strong> yra sunkaus svorio modelis, turintis <strong>671 milijard\u0105 parametr\u0173<\/strong> , o tai \u017eymiai padidina jo problem\u0173 sprendimo galimybes. Naudotojams, turintiems ma\u017eiau reikli\u0105 aparatin\u0119 \u012frang\u0105, \u201eDeepSeek\u201c i\u0161leido \u201edistiliuotas\u201c R1 versijas, kuri\u0173 dyd\u017eiai svyruoja nuo <strong>1,5 milijardo iki 70 milijard\u0173 parametr\u0173<\/strong> , tod\u0117l jas galima naudoti standartiniuose ne\u0161iojamuosiuose kompiuteriuose. <strong>\u201eDeepSeek-R1\u201c<\/strong> taip pat pasiekiama per \u201eDeepSeek\u201c API, si\u016blanti nuo 90% iki 95% ma\u017eesn\u0119 kain\u0105 nei \u201eOpenAI\u201c o1, tod\u0117l tai yra patraukli galimyb\u0117 k\u016br\u0117jams.<\/p>\n<h2>Inovacijos per stipresn\u012f mokym\u0105si<\/h2>\n<p>Esminis <strong>\u201eDeepSeek-R1\u201c skirtumas yra <\/strong><strong>sustiprinimo mokymosi<\/strong> taikymas kartu su pri\u017ei\u016brimu koregavimu, i\u0161skiriant j\u012f nuo modeli\u0173, toki\u0173 kaip o1, kurie remiasi min\u010di\u0173 grandine. \u0160i naujov\u0117 ne tik padidina ekonomin\u012f efektyvum\u0105, bet ir padidina modelio efektyvum\u0105.<\/p>\n<h2>Reguliavimo i\u0161\u0161\u016bkiai ir apribojimai<\/h2>\n<p>Nepaisant to, <strong>\u201eDeepSeek-R1\u201c<\/strong> susiduria su tam tikromis reguliavimo kli\u016btimis, atsi\u017evelgiant \u012f tai, kad jis sukurtas Kinijoje. Modelis atitinka Kinijos interneto institucij\u0173 vykdomas reguliavimo sistemas, u\u017etikrinan\u010dias \u201epagrindini\u0173 socialistini\u0173 vertybi\u0173\u201c laikym\u0105si. Tai turi \u012ftakos \u012fvairioms nagrin\u0117jamoms temoms, nes R1 savo atsakymuose s\u0105moningai vengia toki\u0173 sri\u010di\u0173 kaip Tiananmenio aik\u0161t\u0117 ir Taivano autonomija.<\/p>\n<h2>Atotr\u016bkio ma\u017einimas AGI link<\/h2>\n<p><strong>Nepaisant \u0161i\u0173 apribojim\u0173, DeepSeek-R1<\/strong> i\u0161leidimas \u017eengia \u017eingsnius ma\u017einant atotr\u016bk\u012f tarp atvirojo ir u\u017edarojo kodo modeli\u0173, siekiant dirbtinio bendrojo intelekto (AGI). Tai rei\u0161kia ne tik technin\u012f pasiekim\u0105; jis demonstruoja did\u017eiul\u012f atvirojo kodo AI potencial\u0105 arenoje, kurioje da\u017enai dominuoja patentuotos sistemos. Sujungdama auk\u0161t\u0105 na\u0161um\u0105 su prieinamomis diegimo galimyb\u0117mis, \u201eDeepSeek\u201c suteikia k\u016br\u0117jams ir tyrin\u0117tojams visame pasaulyje galimyb\u0119 dalyvauti AI evoliucijoje.<\/p>\n<p>Var\u017eyboms d\u0117l AGI stipr\u0117jant, <strong>DeepSeek-R1<\/strong> yra stiprus priminimas, kad atvirumas ir bendradarbiavimas bus labai svarb\u016bs kuriant technologij\u0173 ateit\u012f.<\/p>\n<h2>Da\u017enai u\u017eduodami klausimai<\/h2>\n<h3><strong>1. Kuo DeepSeek-R1 skiriasi nuo OpenAI o1?<\/strong><\/h3>\n<p>DeepSeek-R1 naudoja sustiprinimo mokym\u0105si kartu su pri\u017ei\u016brimu koregavimu, skirtingai nei OpenAI o1, kuris remiasi min\u010di\u0173 grandin\u0117s procesais. Tai leid\u017eia suma\u017einti veiklos s\u0105naudas 90\u201395%, i\u0161laikant konkurencing\u0105 na\u0161um\u0105.<\/p>\n<h3><strong>2. Ar yra koki\u0173 nors apribojim\u0173 naudoti DeepSeek-R1 komerciniais tikslais?<\/strong><\/h3>\n<p>Ne, \u201eDeepSeek-R1\u201c galima \u012fsigyti pagal MIT licencij\u0105, tod\u0117l vartotojai gali nemokamai naudoti model\u012f net komercin\u0117se programose. Tai atveria pla\u010dias galimybes tiek verslui, tiek k\u016br\u0117jams.<\/p>\n<h3><strong>3. Kokie yra DeepSeek-R1 modelio apribojimai?<\/strong><\/h3>\n<p>Nors \u201eDeepSeek-R1\u201c gali pasigirti \u012fsp\u016bdingomis galimyb\u0117mis, jam taikomi Kinijos interneto reglamentai, kurie gali apriboti jo atsakymus jautriomis temomis, tokiomis kaip Tiananmenio aik\u0161t\u0117 ar Taivano autonomija. Tai gali apriboti jo taikym\u0105 tam tikrose situacijose.<\/p>\n<p><a class=\"xiaomi\" href=\"https:\/\/allthings.how\/deepseek-releases-open-source-reasoning-model-deepseek-r1-to-rival-openais-o1\/\" rel=\"noopener noreferrer nofollow\" target=\"_blank\">\u0160altinis ir vaizdai<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>\u201eDeepSeek\u201c pristato \u201eDeepSeek-R1\u201c: nauj\u0105 atvirojo kodo AI er\u0105 Siekdama novatori\u0161ko dirbtinio intelekto pa\u017eangos, Kinijoje \u012fsik\u016brusi pirmaujanti AI laboratorija \u201eDeepSeek\u201c pristat\u0117 naujausius atvirojo kodo samprotavimo modelius: \u201eDeepSeek-R1\u201c ir \u201eDeepSeek-R1 Zero\u201c . \u0160ie novatori\u0161ki modeliai sukurti siekiant demokratizuoti prieig\u0105 prie auk\u0161to lygio samprotavimo galimybi\u0173, kartu u\u017etikrinant konkurencing\u0105 na\u0161um\u0105, kuris meta i\u0161\u0161\u016bk\u012f esamiems pramon\u0117s etalonams. \u201eDeepSeek\u201c teigia, kad [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[176,123],"class_list":["post-7396","post","type-post","status-publish","format-standard","hentry","category-how-to","tag-artificial-intelligence","tag-microsoft"],"acf":[],"_links":{"self":[{"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/posts\/7396","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/comments?post=7396"}],"version-history":[{"count":1,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/posts\/7396\/revisions"}],"predecessor-version":[{"id":7397,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/posts\/7396\/revisions\/7397"}],"wp:attachment":[{"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/media?parent=7396"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/categories?post=7396"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/tags?post=7396"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}