{"id":2696,"date":"2024-06-20T12:08:19","date_gmt":"2024-06-20T12:08:19","guid":{"rendered":"https:\/\/howtogeek.blog\/fi\/?p=2696"},"modified":"2024-06-20T12:08:19","modified_gmt":"2024-06-20T12:08:19","slug":"this-new-v2a-tool-from-google-deepmind-could-be-the-last-piece-of-the-puzzle-for-ai-generated-movies-fi","status":"publish","type":"post","link":"https:\/\/howtogeek.blog\/fi\/this-new-v2a-tool-from-google-deepmind-could-be-the-last-piece-of-the-puzzle-for-ai-generated-movies-fi\/","title":{"rendered":"T\u00e4m\u00e4 Google DeepMindin uusi V2A-ty\u00f6kalu voisi olla teko\u00e4lyn luomien elokuvien palapelin viimeinen pala"},"content":{"rendered":"<p>Kun ensimm\u00e4inen teko\u00e4lyll\u00e4 luotu video julkaistiin, kukaan ei osannut arvata, ett\u00e4 videota tuottavat teko\u00e4lyty\u00f6kalut tulevat niin pitk\u00e4lle niin lyhyess\u00e4 ajassa. Nyky\u00e4\u00e4n meill\u00e4 on kuitenkin lukemattomia alustoja, joiden avulla k\u00e4ytt\u00e4j\u00e4t voivat luoda korkealaatuisia, uskomattoman yksityiskohtaisia \u200b\u200bvideoita, kuten Synthesia ja Luma AI:n Dream Machine. On kuitenkin olemassa muutamia haasteita, jotka est\u00e4v\u00e4t n\u00e4it\u00e4 ty\u00f6kaluja siirtym\u00e4st\u00e4 valtavirtaan.<\/p>\n<p>Ja suurin ehk\u00e4 on \u00e4\u00e4nen luontiprosessi. Vaikka useimmat videontuotantoalustat voivat tuottaa hyv\u00e4laatuisia videoita, ne ovat enimm\u00e4kseen hiljaisia \u200b\u200bvideoita ilman \u00e4\u00e4nt\u00e4. Vaikka \u00e4\u00e4nt\u00e4 olisikin, se lis\u00e4t\u00e4\u00e4n yleens\u00e4 erikseen ja se ei vastaa k\u00e4ytt\u00e4jien odotuksia.<\/p>\n<p>Esimerkiksi, jos vierailet Luma AI:n Dream Machine -sivulla, voit n\u00e4hd\u00e4 eritt\u00e4in vaikuttavia videoita, mutta niihin liittyv\u00e4 \u00e4\u00e4ni on melko yleist\u00e4 ja heikkolaatuista. Mutta t\u00e4m\u00e4 saattaa muuttua Googlen uuden video-audio-tekniikan (V2A) my\u00f6t\u00e4.<\/p>\n<p>T\u00e4m\u00e4 lupaa tuoda laadukkaan \u00e4\u00e4nentoiston videoille suurelle yleis\u00f6lle, mik\u00e4 tarkoittaa, ett\u00e4 sen avulla voit vihdoin tuottaa teko\u00e4lyll\u00e4 luotuja elokuvia, joissa on oikea \u00e4\u00e4niraita ja \u00e4\u00e4ni, mik\u00e4 ylitt\u00e4\u00e4 kaikki t\u00e4ll\u00e4 hetkell\u00e4 tuotetut teko\u00e4lyn tuottamat videot.<\/p>\n<figure class=\"wp-block-image\"><figcaption>\n<p><span>Teko\u00e4lyn luoma \u00e4\u00e4ni<\/span><\/p>\n<\/figcaption><\/figure>\n<p><a class=\"youtube_link_to_unwrap\" href=\"https:\/\/www.youtube.com\/watch?v=VYjZlF6m3nQ\" referrerpolicy=\"strict-origin-when-cross-origin\">https:\/\/www.youtube.com\/watch?v=VYjZlF6m3nQ<\/a><\/p>\n<h2 id=\"what-is-google-deepminds-video-to-audio-research\">Mik\u00e4 on Google DeepMindin videosta \u00e4\u00e4neksi -tutkimus?<\/h2>\n<p>Googlen DeepMindin kehitt\u00e4m\u00e4 Video-to-Audio (V2A) -tekniikka on suunniteltu luomaan \u00e4\u00e4niraitoja teko\u00e4lyn luomille videoille. T\u00e4m\u00e4 tekniikka mahdollistaa videoiden ja \u00e4\u00e4nen generoinnin samanaikaisesti yhdist\u00e4m\u00e4ll\u00e4 luonnollisen kielen kehotteet videopikseleihin \u00e4\u00e4nien luomiseksi mit\u00e4 tahansa videossa tapahtuvaa toimintaa varten.<\/p>\n<p>T\u00e4m\u00e4 tekniikka voidaan yhdist\u00e4\u00e4 videoiden luomiseen k\u00e4ytettyjen teko\u00e4lymallien, kuten Veon, kanssa, ja se voi auttaa luomaan realistisia dialogeja ja \u00e4\u00e4nitehosteita sek\u00e4 dramaattisia, videota vastaavia tuloksia. Viel\u00e4 t\u00e4rke\u00e4mp\u00e4\u00e4 on, ett\u00e4 uusi V2A-tekniikka ei rajoitu vain teko\u00e4lyll\u00e4 luotuihin videoihin, vaan sit\u00e4 voidaan k\u00e4ytt\u00e4\u00e4 my\u00f6s \u00e4\u00e4niraitojen luomiseen perinteisell\u00e4 tavalla tuotetuille videoille. Siten voit k\u00e4ytt\u00e4\u00e4 sit\u00e4 mykk\u00e4elokuvien, arkistomateriaalin ja muiden kanssa.<\/p>\n<p>V2A-tekniikan avulla k\u00e4ytt\u00e4j\u00e4t voivat luoda rajattomasti \u00e4\u00e4niraitoja videoille ja jopa k\u00e4ytt\u00e4\u00e4 positiivisia ja negatiivisia kehotteita ohjaamaan \u00e4\u00e4nenmuodostusprosessia ja hankkimaan tarvittavat \u00e4\u00e4net helposti. T\u00e4m\u00e4 mahdollistaa my\u00f6s enemm\u00e4n joustavuutta, joten voit kokeilla erilaisia \u200b\u200bl\u00e4ht\u00f6j\u00e4 ja l\u00f6yt\u00e4\u00e4 parhaiten tietylle videolle.<\/p>\n<figure class=\"wp-block-image\"><figcaption>\n<p><span>\u00c4\u00e4nin\u00e4yte meduusasta, joka sykkii veden alla.<\/span> L\u00e4hde: Google<\/p>\n<\/figcaption><\/figure>\n<p><a class=\"youtube_link_to_unwrap\" href=\"https:\/\/www.youtube.com\/watch?v=9Q0-t8D9XFI\" referrerpolicy=\"strict-origin-when-cross-origin\">https:\/\/www.youtube.com\/watch?v=9Q0-t8D9XFI<\/a><\/p>\n<h2 id=\"how-does-the-v2a-technology-work\">Miten V2A-tekniikka toimii?<\/h2>\n<p>Googlen mukaan yritys kokeili diffuusiopohjaisia \u200b\u200bja autoregressiivisi\u00e4 tekniikoita ja totesi edellisen soveltuvimmaksi \u00e4\u00e4nentuotantoon. Se tuottaa eritt\u00e4in realistisia \u00e4\u00e4ni\u00e4 ja toimii koodaamalla videon pakattuun muotoon.<\/p>\n<p>T\u00e4m\u00e4n j\u00e4lkeen diffuusiomallilla erotetaan satunnainen kohina videosta luottaen luonnollisen kielen kehotteisiin ja videoon. Kehotteet auttavat luomaan realistisen \u00e4\u00e4nen, joka on t\u00e4ydellisesti synkronoitu videon kanssa. T\u00e4t\u00e4 seuraa \u00e4\u00e4nen dekoodaus, jonka j\u00e4lkeen se muunnetaan \u00e4\u00e4niaaltomuodoksi ja yhdistet\u00e4\u00e4n videoon.<\/p>\n<p>Googlen DeepMind tarjosi lis\u00e4tietoa teko\u00e4lyn kouluttamiseen, mink\u00e4 ansiosta k\u00e4ytt\u00e4j\u00e4t voivat ohjata \u00e4\u00e4nentuotantoprosessia kohti vaadittuja \u00e4\u00e4ni\u00e4 ja antaa alustalle mahdollisuuden tuottaa laadukkaampaa \u00e4\u00e4nt\u00e4. T\u00e4llaisiin tietoihin sis\u00e4ltyi puhutun dialogin transkriptioita ja yksityiskohtaisia \u200b\u200b\u00e4\u00e4nikuvauksia teko\u00e4lyn luomilla huomautuksilla.<\/p>\n<p>Kun V2A-tekniikka on koulutettu t\u00e4llaisiin tietoihin, se voi yhdist\u00e4\u00e4 erilaisia \u200b\u200bvisuaalisia kohtauksia tiettyihin \u00e4\u00e4nitapahtumiin.<\/p>\n<figure class=\"wp-block-image\"><img alt=\"\" class=\"wp-image\" decoding=\"async\" height=\"605\" loading=\"lazy\" src=\"https:\/\/cdn.howtogeek.blog\/wp-content\/uploads\/2024\/06\/Screenshot-2024-06-20-150052-1.webp\" title=\"\" width=\"1076\"\/><figcaption><span>V2A-tekniikan toiminta.<\/span> L\u00e4hde: Google<\/figcaption><\/figure>\n<h2 id=\"whats-on-the-horizon\">Mit\u00e4 on horisontissa?<\/h2>\n<p>DeepMindin V2A-tekniikka toimii paljon paremmin kuin muut V2A-ratkaisut, koska se ei aina vaadi tekstikehotetta ja pystyy ymm\u00e4rt\u00e4m\u00e4\u00e4n videopikseleit\u00e4. \u00c4\u00e4nil\u00e4ht\u00f6\u00e4 ei my\u00f6sk\u00e4\u00e4n tarvitse kohdistaa manuaalisesti videon kanssa. Teknologialla on kuitenkin edelleen tiettyj\u00e4 rajoituksia, jotka Google pyrkii voittamaan lis\u00e4tutkimuksilla.<\/p>\n<p>Esimerkiksi luodun \u00e4\u00e4nen laatu riippuu tulona k\u00e4ytetyn videon laadusta. Jos videossa on v\u00e4\u00e4ristymi\u00e4 tai artefakteja, teko\u00e4lymalli ei ymm\u00e4rr\u00e4 niit\u00e4, koska ne eiv\u00e4t sis\u00e4lly sen koulutukseen, mik\u00e4 lopulta heikent\u00e4\u00e4 \u00e4\u00e4nenlaatua.<\/p>\n<p>Lis\u00e4ksi yhti\u00f6 pyrkii parantamaan huulten synkronointia videoissa, joissa on ihmisen puhetta. V2A-tekniikka yritt\u00e4\u00e4 tuottaa puhetta sis\u00e4\u00e4ntulotranskripteill\u00e4 ja kohdistaa sen sitten videon hahmojen huulten liikkeisiin. Jos video ei kuitenkaan perustu transkriptioihin, \u00e4\u00e4nen ja huulten liikkeet eiv\u00e4t t\u00e4sm\u00e4\u00e4.<\/p>\n<p>Paremmilla \u00e4\u00e4nentoisto-ominaisuuksilla AI-mallit pystyv\u00e4t luomaan videoita, jotka eiv\u00e4t vain n\u00e4yt\u00e4 vaikuttavilta, vaan my\u00f6s kuulostavat hyv\u00e4lt\u00e4. Google on my\u00f6s integroimassa V2A-teknologiaansa SynthID:hen, joka merkitsee vesileiman kaikkeen teko\u00e4lyll\u00e4 luotuun sis\u00e4lt\u00f6\u00f6n. T\u00e4m\u00e4 voi auttaa est\u00e4m\u00e4\u00e4n sen v\u00e4\u00e4rink\u00e4yt\u00f6n ja varmistamaan t\u00e4ydellisen turvallisuuden.<\/p>\n<p>Lis\u00e4ksi yhti\u00f6 sanoo testaavansa V2A-tekniikkaansa tiukasti ennen sen julkistamista. Toistaiseksi Googlen esitt\u00e4mien ja tulevaisuuden lupausten perusteella t\u00e4m\u00e4 tekniikka on muodostumassa merkitt\u00e4v\u00e4ksi edistykseksi teko\u00e4lyn luomien videoiden \u00e4\u00e4nen luomisessa.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Kun ensimm\u00e4inen teko\u00e4lyll\u00e4 luotu video julkaistiin, kukaan ei osannut arvata, ett\u00e4 videota tuottavat teko\u00e4lyty\u00f6kalut tulevat niin pitk\u00e4lle niin lyhyess\u00e4 ajassa. Nyky\u00e4\u00e4n meill\u00e4 on kuitenkin lukemattomia alustoja, joiden avulla k\u00e4ytt\u00e4j\u00e4t voivat luoda korkealaatuisia, uskomattoman yksityiskohtaisia \u200b\u200bvideoita, kuten Synthesia ja Luma AI:n Dream Machine. On kuitenkin olemassa muutamia haasteita, jotka est\u00e4v\u00e4t n\u00e4it\u00e4 ty\u00f6kaluja siirtym\u00e4st\u00e4 valtavirtaan. Ja suurin [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[182,130],"class_list":["post-2696","post","type-post","status-publish","format-standard","hentry","category-how-to","tag-artificial-intelligence","tag-microsoft"],"acf":[],"_links":{"self":[{"href":"https:\/\/howtogeek.blog\/fi\/wp-json\/wp\/v2\/posts\/2696","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/howtogeek.blog\/fi\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/howtogeek.blog\/fi\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/howtogeek.blog\/fi\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/howtogeek.blog\/fi\/wp-json\/wp\/v2\/comments?post=2696"}],"version-history":[{"count":1,"href":"https:\/\/howtogeek.blog\/fi\/wp-json\/wp\/v2\/posts\/2696\/revisions"}],"predecessor-version":[{"id":2697,"href":"https:\/\/howtogeek.blog\/fi\/wp-json\/wp\/v2\/posts\/2696\/revisions\/2697"}],"wp:attachment":[{"href":"https:\/\/howtogeek.blog\/fi\/wp-json\/wp\/v2\/media?parent=2696"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/howtogeek.blog\/fi\/wp-json\/wp\/v2\/categories?post=2696"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/howtogeek.blog\/fi\/wp-json\/wp\/v2\/tags?post=2696"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}