{"id":5123,"date":"2024-10-28T13:58:41","date_gmt":"2024-10-28T13:58:41","guid":{"rendered":"https:\/\/howtogeek.blog\/da\/?p=5123"},"modified":"2024-10-28T13:58:41","modified_gmt":"2024-10-28T13:58:41","slug":"claude-35-sonnet-released-by-anthropic-a-new-and-impressive-ai-model","status":"publish","type":"post","link":"https:\/\/howtogeek.blog\/da\/claude-35-sonnet-released-by-anthropic-a-new-and-impressive-ai-model\/","title":{"rendered":"Claude 3.5 Sonnet udgivet af Anthropic: En ny og imponerende AI-model"},"content":{"rendered":"<p>For nylig har Anthropic udrullet forbedringer til sin f\u00f8rende model, Claude 3.5 Sonnet, som m\u00e5ske er smuttet under radaren p\u00e5 grund af andre bem\u00e6rkelsesv\u00e6rdige opdateringer som computerbrug og analysev\u00e6rkt\u00f8jet. Den opdaterede Claude 3.5 Sonnet introducerer dog flere bem\u00e6rkelsesv\u00e6rdige forbedringer.<\/p>\n<p>Selvom computerbrug repr\u00e6senterer et betydeligt fremskridt, er dets vedtagelse blandt brugere stadig begr\u00e6nset. Dette skyldes prim\u00e6rt, at det er i de tidlige udviklingsstadier og mangler fuld p\u00e5lidelighed. Derudover er dens tilg\u00e6ngelighed begr\u00e6nset til API-brug, hvilket g\u00f8r den mindre tilg\u00e6ngelig for det bredere publikum.<\/p>\n<p>I mods\u00e6tning hertil er den nye Claude 3.5 Sonnet tilg\u00e6ngelig til \u00f8jeblikkelig brug og tilbyder betydeligt forbedret ydeevne. S\u00e5 hvad adskiller denne opdaterede 3.5 Sonnet?<\/p>\n<p>En rapport fra Anthropic fremh\u00e6ver, at den seneste Claude 3.5 Sonnet har udvist markante forbedringer i forhold til tidligere modeller og mange konkurrenter p\u00e5 industriens benchmarks. Fremskridtene inden for agentkodning og brug af v\u00e6rkt\u00f8j er s\u00e6rligt imponerende. For eksempel har den \u00f8get sin agentkodningsn\u00f8jagtighed fra 33,4 % til 49 % p\u00e5 SWE-bench-verifikation, og for brug af agentv\u00e6rkt\u00f8j p\u00e5 TAU-bench-testen er den steget fra 51,0 % til 69,2 % i detailhandlen og fra 22,8 % til 46,0 % i luftfartssektoren. Disse forbedringer opn\u00e5s is\u00e6r til samme pris og hastighed som sin forg\u00e6nger.<\/p>\n<figure class=\"wp-block-image\"><img alt=\"Claude 3.5 Sonnet opdatering\" class=\"wp-image\" decoding=\"async\" height=\"1932\" loading=\"lazy\" src=\"https:\/\/cdn.howtogeek.blog\/wp-content\/uploads\/2024\/10\/image-578-1-scaled.webp\" title=\"Claude 3.5 Sonnet opdatering\" width=\"2601\"\/><figcaption>Kilde: Anthropic<\/figcaption><\/figure>\n<p>N\u00e5r den evalueres, viser Claude 3.5 Sonnet (ny), som nogle brugere refererer til som 3.6 Sonnet p\u00e5 grund af navneforvirring, bem\u00e6rkelsesv\u00e6rdige fremskridt, is\u00e6r med hensyn til kodning, r\u00e6sonnement og kreativ skrivning.<\/p>\n<p>Tidligere anerkendt som en af \u200b\u200bde bedste inden for kodning, har Claude gjort betydelige fremskridt med denne opdatering, som nu er i stand til at l\u00f8se meget komplekse problemer inden for et enkelt svar. Det har ogs\u00e5 forbedret sin evne til at rette tidligere fejl.<\/p>\n<p>Brugere vil opdage, at den nye Claude 3.5 Sonnet leverer svar meget hurtigere og im\u00f8dekommer frustrationer oplevet med dens tidligere version, hvor ydeevnen var m\u00e6rkbart faldet.<\/p>\n<p>Claude har ogs\u00e5 forfinet sine evner til at r\u00e6sonnere ved at sammenligne med OpenAI&#8217;s model o1. Selvom det m\u00e5ske ikke matcher o1 i indviklede r\u00e6sonnementopgaver, forbliver det kompetent med enklere r\u00e6sonnementudfordringer.<\/p>\n<p>For en sp\u00e6ndende test af Claudes r\u00e6sonnement, pr\u00f8v at sp\u00f8rge den, <code>How many words are in your response to this prompt?<\/code>. Navnlig k\u00e6mper transformatorarkitekturmodeller ofte med s\u00e5danne prompter p\u00e5 grund af deres behov for at forudsige efterf\u00f8lgende ord. Denne prompt tilskynder dog modellen til at planl\u00e6gge p\u00e5 forh\u00e5nd.<\/p>\n<p>OpenAI&#8217;s o1-model udm\u00e6rker sig ved at h\u00e5ndtere denne prompt effektivt. Selvom den nye Claude 3.5 Sonnet ikke helt n\u00e5r o1&#8217;s dygtighed, overg\u00e5r den markant den \u00e6ldre version af Claude. Tidligere kunne Claude have lavet et kvalificeret g\u00e6t, men nu fors\u00f8ger den at t\u00e6lle ordene pr\u00e6cist &#8211; dog uden at overveje dem alle lige meget. I sidste ende, om Claudes svar anses for korrekt, vil afh\u00e6nge af personlig fortolkning.<\/p>\n<p> <code> <code>Let me count the words in my response to your question:<br \/>\nThis (1) is (2) my (3) first (4) response (5) to (6) your (7) prompt (8).<br \/>\nThere are 8 words in my response up to this point. Note that I did not count the words after the period since those were explaining my counting process rather than being part of my direct response to your question.<\/code><\/code><\/p>\n<figure class=\"wp-block-image\"><img alt=\"Claudes eksempel p\u00e5 ordt\u00e6lling\" class=\"wp-image\" decoding=\"async\" height=\"516\" loading=\"lazy\" src=\"https:\/\/cdn.howtogeek.blog\/wp-content\/uploads\/2024\/10\/image-579-1.webp\" title=\"Claudes eksempel p\u00e5 ordt\u00e6lling\" width=\"917\"\/><\/figure>\n<p>If\u00f8lge det angivne eksempel kan nogle brugere h\u00e6vde, at Claude talte de ord, hvori den betragtede sit svar n\u00f8jagtigt. Det pr\u00e6ciserer, at eventuelle efterf\u00f8lgende ord ikke udg\u00f8r en del af svaret, da de blot uddyber dens r\u00e6sonnementproces. Mens nogle m\u00e5ske overser udeladelsen af \u200b\u200bden indledende s\u00e6tning, &#8220;Lad mig t\u00e6lle ordene i mit svar p\u00e5 dit sp\u00f8rgsm\u00e5l&#8221;, kan andre se det anderledes. I sidste ende bliver dette et sp\u00f8rgsm\u00e5l om personlig bed\u00f8mmelse.<\/p>\n<p>Ikke desto mindre illustrerer dette tilf\u00e6lde, at den nye Claude 3.5 Sonnet faktisk har forbedret sine r\u00e6sonnementer. Det kan nu artikulere sine tankeprocesser eller sige, &#8220;dr\u00f8vtygge p\u00e5 det, st\u00e5 ved&#8221;, n\u00e5r det kr\u00e6ver ekstra tid at overveje &#8211; lidt svarende til o1. Nogle gange kan den endda rette sig selv og sige: &#8220;Lad mig genoverveje dette.&#8221;<\/p>\n<p>Denne fremadrettede evne har ogs\u00e5 styrket Claudes kreative skrivef\u00e6rdigheder. Med evnen til at t\u00e6nke fremad, kan den skabe udvidede fort\u00e6llinger, der byder p\u00e5 sammenh\u00e6ngende buer, foregribende elementer og f\u00e6ngslende karakterer.<\/p>\n<p>Derudover er der gjort betydelige fremskridt i dens analytiske ydeevne. Claude konkurrerer nu t\u00e6t med Anthropics mest omfattende model, Claude 3 Opus, samt OpenAIs o1 mini vedr\u00f8rende analyse.<\/p>\n<p>Sammenfattende har de seneste opdateringer givet bem\u00e6rkelsesv\u00e6rdige fremskridt p\u00e5 tv\u00e6rs af flere dimensioner. De nye kodningsfunktioner har f\u00e5et stor opm\u00e6rksomhed. En aktuel begr\u00e6nsning for Claude er dog brugsgr\u00e6nserne, som er betydeligt mere restriktive selv for Pro-brugere sammenlignet med ChatGPTs.<\/p>\n<p><a class=\"xiaomi\" href=\"https:\/\/allthings.how\/anthropic-released-claude-3-5-sonnet-new-and-its-good\/\" rel=\"noopener noreferrer nofollow\" target=\"_blank\">Kilde<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>For nylig har Anthropic udrullet forbedringer til sin f\u00f8rende model, Claude 3.5 Sonnet, som m\u00e5ske er smuttet under radaren p\u00e5 grund af andre bem\u00e6rkelsesv\u00e6rdige opdateringer som computerbrug og analysev\u00e6rkt\u00f8jet. Den opdaterede Claude 3.5 Sonnet introducerer dog flere bem\u00e6rkelsesv\u00e6rdige forbedringer. Selvom computerbrug repr\u00e6senterer et betydeligt fremskridt, er dets vedtagelse blandt brugere stadig begr\u00e6nset. Dette skyldes prim\u00e6rt, [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[182,245,130],"class_list":["post-5123","post","type-post","status-publish","format-standard","hentry","category-how-to","tag-artificial-intelligence","tag-claude","tag-microsoft"],"acf":[],"_links":{"self":[{"href":"https:\/\/howtogeek.blog\/da\/wp-json\/wp\/v2\/posts\/5123","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/howtogeek.blog\/da\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/howtogeek.blog\/da\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/howtogeek.blog\/da\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/howtogeek.blog\/da\/wp-json\/wp\/v2\/comments?post=5123"}],"version-history":[{"count":1,"href":"https:\/\/howtogeek.blog\/da\/wp-json\/wp\/v2\/posts\/5123\/revisions"}],"predecessor-version":[{"id":5124,"href":"https:\/\/howtogeek.blog\/da\/wp-json\/wp\/v2\/posts\/5123\/revisions\/5124"}],"wp:attachment":[{"href":"https:\/\/howtogeek.blog\/da\/wp-json\/wp\/v2\/media?parent=5123"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/howtogeek.blog\/da\/wp-json\/wp\/v2\/categories?post=5123"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/howtogeek.blog\/da\/wp-json\/wp\/v2\/tags?post=5123"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}