{"id":2582,"date":"2024-06-20T12:08:09","date_gmt":"2024-06-20T12:08:09","guid":{"rendered":"https:\/\/howtogeek.blog\/lt\/?p=2582"},"modified":"2024-06-20T12:08:09","modified_gmt":"2024-06-20T12:08:09","slug":"this-new-v2a-tool-from-google-deepmind-could-be-the-last-piece-of-the-puzzle-for-ai-generated-movies-lt","status":"publish","type":"post","link":"https:\/\/howtogeek.blog\/lt\/this-new-v2a-tool-from-google-deepmind-could-be-the-last-piece-of-the-puzzle-for-ai-generated-movies-lt\/","title":{"rendered":"\u0160is naujas \u201eGoogle DeepMind\u201c V2A \u012frankis gali b\u016bti paskutin\u0117 AI sukurt\u0173 film\u0173 galvos\u016bkio dalis"},"content":{"rendered":"<p>Kai buvo i\u0161leistas pirmasis dirbtinio intelekto sukurtas vaizdo \u012fra\u0161as, niekas negal\u0117jo atsp\u0117ti, kad vaizdo \u012fra\u0161\u0105 generuojantys AI \u012frankiai pasieks taip toli per tok\u012f trump\u0105 laikotarp\u012f. Ta\u010diau \u0161iandien turime daugyb\u0119 platform\u0173, kurios leid\u017eia vartotojams kurti auk\u0161tos kokyb\u0117s, ne\u012ftik\u0117tinai i\u0161samius vaizdo \u012fra\u0161us, pvz., \u201eSynthesia\u201c ir \u201eLuma AI&#8217;s Dream Machine\u201c. Nepaisant to, vis dar yra keletas i\u0161\u0161\u016bki\u0173, d\u0117l kuri\u0173 \u0161ios priemon\u0117s negali b\u016bti naudojamos \u012fprastai.<\/p>\n<p>Ir galb\u016bt did\u017eiausias yra garso generavimo procesas. Nors dauguma vaizdo \u012fra\u0161\u0173 k\u016brimo platform\u0173 gali sukurti geros kokyb\u0117s vaizdo \u012fra\u0161us, da\u017eniausiai tai yra tyl\u016bs vaizdo \u012fra\u0161ai be jokio garso. Net jei yra garsas, jis paprastai pridedamas atskirai ir neatitinka vartotojo l\u016bkes\u010di\u0173.<\/p>\n<p>Pavyzd\u017eiui, jei apsilankysite \u201eLuma AI\u201c svajoni\u0173 ma\u0161inos puslapyje, galite pamatyti kelet\u0105 labai \u012fsp\u016bding\u0173 vaizdo \u012fra\u0161\u0173, ta\u010diau juos lydintis garsas yra gana bendras ir prastos kokyb\u0117s. Ta\u010diau tai gali pasikeisti naudojant nauj\u0105 \u201eGoogle\u201c vaizdo \u012fra\u0161o \u012f gars\u0105 (V2A) technologij\u0105.<\/p>\n<p>Tai \u017eada, kad geros kokyb\u0117s vaizdo \u012fra\u0161\u0173 garso generavimas bus prieinamas mas\u0117ms, o tai rei\u0161kia, kad pagaliau gal\u0117site sukurti dirbtinio intelekto sukurtus filmus su tinkamais garso takeliais ir garsu, pranokstan\u010diais visus \u0161iuo metu gaminamus AI sukurtus vaizdo \u012fra\u0161us.<\/p>\n<figure class=\"wp-block-image\"><figcaption>\n<p><span>AI sukurtas garsas, skirtas<\/span><\/p>\n<\/figcaption><\/figure>\n<p><a class=\"youtube_link_to_unwrap\" href=\"https:\/\/www.youtube.com\/watch?v=VYjZlF6m3nQ\" referrerpolicy=\"strict-origin-when-cross-origin\">https:\/\/www.youtube.com\/watch?v=VYjZlF6m3nQ<\/a><\/p>\n<h2 id=\"what-is-google-deepminds-video-to-audio-research\">Kas yra \u201eGoogle DeepMind\u201c vaizdo \u012fra\u0161o \u012f gars\u0105 tyrimas?<\/h2>\n<p>Vaizdo \u012fra\u0161o \u012f gars\u0105 (V2A) technologija, kuri\u0105 suk\u016br\u0117 \u201eGoogle DeepMind\u201c, skirta dirbtinio intelekto sukurt\u0173 vaizdo \u012fra\u0161\u0173 garso takeliams kurti. \u0160i technologija leid\u017eia generuoti vaizdo \u012fra\u0161us ir gars\u0105 vienu metu, derinant nat\u016bralios kalbos raginimus su vaizdo pikseliais, kad b\u016bt\u0173 generuojami garsai bet kokiems vaizdo \u012fra\u0161e atliekamiems veiksmams.<\/p>\n<p>\u0160i\u0105 technologij\u0105 galima susieti su AI modeliais, naudojamais vaizdo \u012fra\u0161ams generuoti, pvz., \u201eVeo\u201c, ir gali pad\u0117ti sukurti tikrovi\u0161kus dialogus ir garso efektus bei dramati\u0161kus vaizdo \u012fra\u0161\u0105 atitinkan\u010dius balus. Dar svarbiau, kad naujoji V2A technologija neapsiriboja vaizdo \u012fra\u0161ais, sukurtais naudojant AI, bet taip pat gali b\u016bti naudojama tradiciniu b\u016bdu sukurt\u0173 vaizdo \u012fra\u0161\u0173 garso takeliams generuoti. Taigi galite j\u012f naudoti nebyliam filmui, archyvinei med\u017eiagai ir kt.<\/p>\n<p>V2A technologija leid\u017eia vartotojams generuoti neribot\u0105 vaizdo \u012fra\u0161\u0173 garso takeli\u0173 skai\u010di\u0173 ir netgi naudoti teigiamus ir neigiamus raginimus, kad b\u016bt\u0173 galima vadovauti garso generavimo procesui ir lengvai gauti reikiamus garsus. Tai taip pat suteikia daugiau lankstumo, tod\u0117l galite eksperimentuoti su \u012fvairiais i\u0161\u0117jimais ir rasti tai, kas geriausia konkre\u010diam vaizdo \u012fra\u0161ui.<\/p>\n<figure class=\"wp-block-image\"><figcaption>\n<p><span>Po vandeniu pulsuojan\u010dios med\u016bzos garso pavyzdys.<\/span> \u0160altinis: Google<\/p>\n<\/figcaption><\/figure>\n<p><a class=\"youtube_link_to_unwrap\" href=\"https:\/\/www.youtube.com\/watch?v=9Q0-t8D9XFI\" referrerpolicy=\"strict-origin-when-cross-origin\">https:\/\/www.youtube.com\/watch?v=9Q0-t8D9XFI<\/a><\/p>\n<h2 id=\"how-does-the-v2a-technology-work\">Kaip veikia V2A technologija?<\/h2>\n<p>\u201eGoogle\u201c teigimu, bendrov\u0117 eksperimentavo su difuzija pagr\u012fstomis ir autoregresyviomis technikomis ir nustat\u0117, kad pirmoji yra tinkamiausia garso k\u016brimui. Tai sukuria labai tikrovi\u0161kus garsus ir veikia koduojant vaizdo \u012fra\u0161\u0105 \u012f suspaust\u0105 format\u0105.<\/p>\n<p>Po to difuzijos modelis naudojamas atsitiktiniam triuk\u0161mui atskirti nuo vaizdo, remiantis nat\u016bralios kalbos raginimais ir vaizdo \u012fra\u0161u. Raginimai padeda sukurti tikrovi\u0161k\u0105 gars\u0105, kuris puikiai sinchronizuojamas su vaizdo \u012fra\u0161u. Po to i\u0161\u0161ifruojamas garsas, po kurio jis konvertuojamas \u012f garso bangos form\u0105 ir sujungiamas su vaizdo \u012fra\u0161u.<\/p>\n<p>\u201eGoogle DeepMind\u201c suteik\u0117 daugiau informacijos, kad i\u0161mokyt\u0173 dirbtin\u012f intelekt\u0105, tod\u0117l vartotojai gali nukreipti garso generavimo proces\u0105 link reikiam\u0173 gars\u0173 ir leid\u017eia platformai gaminti auk\u0161tesn\u0117s kokyb\u0117s gars\u0105. Tokia informacija ap\u0117m\u0117 sakytinio dialogo nuora\u0161us ir detalius garso apra\u0161ymus su AI sukurtais komentarais.<\/p>\n<p>Apmokyta naudotis tokia informacija, V2A technologija gali susieti skirtingas vaizdines scenas su konkre\u010diais garso \u012fvykiais.<\/p>\n<figure class=\"wp-block-image\"><img alt=\"\" class=\"wp-image\" decoding=\"async\" height=\"605\" loading=\"lazy\" src=\"https:\/\/cdn.howtogeek.blog\/wp-content\/uploads\/2024\/06\/Screenshot-2024-06-20-150052-1.webp\" title=\"\" width=\"1076\"\/><figcaption><span>V2A technologijos veikimas.<\/span> \u0160altinis: Google<\/figcaption><\/figure>\n<h2 id=\"whats-on-the-horizon\">Kas yra horizonte?<\/h2>\n<p>\u201eDeepMind\u201c V2A technologija veikia daug geriau nei kiti V2A sprendimai, nes jai ne visada reikia teksto raginimo ir ji gali suprasti vaizdo pikselius. Garso i\u0161vesties taip pat nereikia rankiniu b\u016bdu derinti su vaizdo \u012fra\u0161u. Ta\u010diau vis dar yra tam tikr\u0173 technologijos apribojim\u0173, kuriuos \u201eGoogle\u201c siekia \u012fveikti atlikdama tolesnius tyrimus.<\/p>\n<p>Pavyzd\u017eiui, sugeneruoto garso kokyb\u0117 priklauso nuo vaizdo, naudojamo kaip \u012fvestis, kokyb\u0117s. Jei vaizdo \u012fra\u0161e yra i\u0161kraipym\u0173 ar artefakt\u0173, dirbtinio intelekto modelis nesugeba j\u0173 suprasti, nes jie n\u0117ra \u012ftraukti \u012f jo mokym\u0105, tod\u0117l garso kokyb\u0117 pablog\u0117ja.<\/p>\n<p>Be to, vaizdo \u012fra\u0161uose, kuriuose yra \u017emogaus kalba, bendrov\u0117 stengiasi pagerinti l\u016bp\u0173 sinchronizavim\u0105. V2A technologija bando generuoti kalb\u0105 naudodama \u012fvesties nuora\u0161us ir suderinti j\u0105 su vaizdo \u012fra\u0161o veik\u0117j\u0173 l\u016bp\u0173 judesiais. Ta\u010diau jei vaizdo \u012fra\u0161as nesiremia nuora\u0161ais, garso ir l\u016bp\u0173 judesiai nesutampa.<\/p>\n<p>Su geresn\u0117mis garso generavimo galimyb\u0117mis dirbtinio intelekto modeliai gal\u0117s generuoti vaizdo \u012fra\u0161us, kurie ne tik atrodo \u012fsp\u016bdingai, bet ir skamba puikiai. \u201eGoogle\u201c taip pat integruoja savo V2A technologij\u0105 su \u201eSynthID\u201c, kuri \u017eymi vandens \u017eenklus visam turiniui, sukurtam naudojant AI. Tai gali pad\u0117ti i\u0161vengti netinkamo jo naudojimo ir u\u017etikrinti visi\u0161k\u0105 saugum\u0105.<\/p>\n<p>Be to, bendrov\u0117 teigia, kad prie\u0161 i\u0161leisdama j\u0105 visuomenei grie\u017etai i\u0161bandys savo V2A technologij\u0105. Kol kas, atsi\u017evelgiant \u012f tai, k\u0105 \u201eGoogle\u201c demonstravo ir pa\u017ead\u0117jo atei\u010diai, \u0161i technologija formuojasi kaip didel\u0117 pa\u017eanga kuriant AI sukurtus vaizdo \u012fra\u0161us.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Kai buvo i\u0161leistas pirmasis dirbtinio intelekto sukurtas vaizdo \u012fra\u0161as, niekas negal\u0117jo atsp\u0117ti, kad vaizdo \u012fra\u0161\u0105 generuojantys AI \u012frankiai pasieks taip toli per tok\u012f trump\u0105 laikotarp\u012f. Ta\u010diau \u0161iandien turime daugyb\u0119 platform\u0173, kurios leid\u017eia vartotojams kurti auk\u0161tos kokyb\u0117s, ne\u012ftik\u0117tinai i\u0161samius vaizdo \u012fra\u0161us, pvz., \u201eSynthesia\u201c ir \u201eLuma AI&#8217;s Dream Machine\u201c. Nepaisant to, vis dar yra keletas i\u0161\u0161\u016bki\u0173, d\u0117l [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[1],"tags":[176,123],"class_list":["post-2582","post","type-post","status-publish","format-standard","hentry","category-how-to","tag-artificial-intelligence","tag-microsoft"],"acf":[],"_links":{"self":[{"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/posts\/2582","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/comments?post=2582"}],"version-history":[{"count":1,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/posts\/2582\/revisions"}],"predecessor-version":[{"id":2583,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/posts\/2582\/revisions\/2583"}],"wp:attachment":[{"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/media?parent=2582"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/categories?post=2582"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/howtogeek.blog\/lt\/wp-json\/wp\/v2\/tags?post=2582"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}