AI bendruomenės jaudulys išaugo, kai OpenAI gegužės mėnesį pristatė išplėstinį balso režimą. Pristatydama naujausią pavyzdinį modelį GPT-4o, bendrovė pabrėžė puikias daugiarūšio transporto funkcijas.
Tačiau keletą mėnesių tai buvo tik potencialo demonstravimas. Iš pradžių „OpenAI“ patikino vartotojus, kad „Advanced Voice Mode“ bus greitai pasiekiamas, tačiau tai užtruko žymiai ilgiau nei tikėtasi, o prieigą gavo ne visi iš karto. Be to, regėjimo ypatybių tuo metu nebuvo. Dabar „OpenAI“ pagaliau pristato „Vision“ išplėstiniame balso režime.
Šis atnaujinimas pasiekiamas šeštąją OpenAI iniciatyvos „12 dienų pristatymo“ dieną, per kurią Samas Altmanas ir kiti komandos nariai atskleidė įvairius atnaujinimus – tiek pagrindinius, tiek smulkius, kad paskleistų šventinę nuotaiką.
Tarp žinomiausių pastarojo meto pristatymų yra „ChatGPT Pro“ prenumerata, visas jų o1 samprotavimo modelio išleidimas, viešas „Sora“ pristatymas, jų vaizdo modelis ir patobulinta „Canvas“, prieinama visiems vartotojams.
„Vision“ pranešimas atidžiai seka „Google“ demonstruojamą atnaujintą „Project Astra“ versiją ir naują prototipą „Project Mariner“, pasižymintį pažangiomis galimybėmis. Tačiau „OpenAI“ vėl ėmėsi iniciatyvos, nes projektas „Astra“ vis dar nėra viešai prieinamas.
Pridėjus viziją išplėstiniame balso režime, vartotojai dabar gali tiesiogiai bendrinti tiesioginį vaizdo įrašą iš savo fotoaparato arba rodyti savo telefono ekraną „ChatGPT“. Šio atnaujinimo labai tikimasi, ypač dėl galimos naudos regėjimo negalią turintiems asmenims.
Šiandien atviroje demonstracijoje „OpenAI“ komanda pasinaudojo „ChatGPT“ parama, kad paruoštų kavą.
Šiuo metu išplėstinio balso režimo „Vision“ funkcija nustatyta paleisti tik „ChatGPT“ mobiliojoje programoje. Vartotojai tikisi, kad jis greitai bus pristatytas darbalaukio variantuose, nes tai sumažins kliūtis ieškant ChatGPT pagalbos atliekant kelias užduotis ar koduojant.
Šis išleidimas bus pasiekiamas visiems Teams naudotojams, o „Plus“ ir „Pro“ naudotojai visame pasaulyje, išskyrus ES esančius, galės pradėti juo naudotis jau šiandien; visas diegimas turėtų būti baigtas iki savaitės pabaigos. „Edu“ ir „Enterprise“ naudotojai turės laukti ilgiau, o prieigą tikimasi kitų metų pradžioje.
Nors ChatGPT išplėstinis balso režimas anksčiau buvo naudingas, jam trūko esminių regėjimo funkcijų, todėl jis negalėjo tapti tikrai praktišku asistentu. Išleidus viziją, nekantrauju pamatyti, kokį transformuojantį poveikį ji gali turėti.
Šventiniu žingsniu „OpenAI“ taip pat pristatė naują „ChatGPT“ Kalėdų senelio režimą, kuris bus pasiekiamas visame pasaulyje visose platformose – mobiliuosiuose, staliniuose kompiuteriuose ir žiniatinklyje. Šį režimą galima įjungti tiek išplėstiniame, tiek standartiniame balso režimuose. Kai pirmą kartą įjungsite Kalėdų Senelio režimą, OpenAI atnaujins išplėstinio balso režimo apribojimą, o tai reiškia, kad vis tiek galėsite mėgautis šventėmis, net jei pasieksite ribą. Ir jei išnaudotumėte išplėstinio balso režimo ribą, standartinis Kalėdų senelis visada bus šalia.
Parašykite komentarą