Vzrušení v komunitě umělé inteligence vzrostlo, když OpenAI v květnu představila Advanced Voice Mode. Během uvedení svého nejnovějšího vlajkového modelu GPT-4o společnost zdůraznila své pozoruhodné multimodální funkce.
Několik měsíců to však byla pouhá ukázka potenciálu. OpenAI zpočátku ujistila uživatele, že Advanced Voice Mode bude brzy k dispozici, ale trvalo to podstatně déle, než se očekávalo, a ne každý získal přístup okamžitě. Navíc v té době chyběly funkce vidění. Nyní OpenAI konečně představuje Vision v pokročilém hlasovém režimu.
Tato aktualizace přichází v šestý den iniciativy OpenAI, ’12 Days of Shipping‘, během které Sam Altman a další členové týmu odhalili různé aktualizace, velké i menší, aby šířili nějakou slavnostní náladu.
Mezi prominentní nedávné spuštění patří předplatné ChatGPT Pro, úplné zavedení jejich o1 uvažovacího modelu, veřejné spuštění Sora, jejich video model a vylepšené plátno dostupné všem uživatelům.
Oznámení Vision těsně následuje po ukázce Google upgradované verze Project Astra a nového prototypu Project Mariner s pokročilými funkcemi. OpenAI se však opět ujal vedení, protože Project Astra stále není veřejně dostupný.
S přidáním Vision v pokročilém hlasovém režimu mohou nyní uživatelé přímo sdílet živé video ze své kamery nebo zobrazit obrazovku svého telefonu na ChatGPT. Tato aktualizace je velmi očekávaná, zejména pro její potenciální výhody pro zrakově postižené jedince.
V přímé ukázce sdílené dnes využil tým OpenAI podporu ChatGPT k přípravě přelévané kávy.

V současné době je funkce Vision v pokročilém hlasovém režimu nastavena na spuštění výhradně v mobilní aplikaci ChatGPT. Uživatelé doufají v jeho rychlé zavedení ve variantách pro stolní počítače, protože to sníží překážky při hledání pomoci ChatGPT při multitaskingu nebo kódování.
Toto zavedení bude přístupné všem uživatelům Teams, zatímco uživatelé Plus a Pro po celém světě, s výjimkou těch v EU, jej mohou začít používat již dnes; Očekává se, že plné nasazení bude dokončeno do konce týdne. Uživatelé Edu a Enterprise budou muset čekat déle, přístup se očekává začátkem příštího roku.
Zatímco pokročilý hlasový režim ChatGPT byl dříve užitečný, postrádal základní funkce vidění, což z něj bránilo stát se skutečně praktickým asistentem. S uvolněním vize jsem dychtivý být svědkem transformačního dopadu, který může mít.
OpenAI také představilo nový Santa Mode v ChatGPT, který bude k dispozici globálně na všech platformách – mobilní, desktopové a webové. Tento režim lze aktivovat v pokročilém i standardním hlasovém režimu. Když poprvé aktivujete režim Santa, OpenAI obnoví váš limit pokročilého hlasového režimu, což znamená, že si stále můžete užívat slavnosti, i když jste dosáhli svého limitu. A pokud vyčerpáte svůj pokročilý hlasový režim, standardní Santa bude vždy k dispozici pro vás.
Napsat komentář ▼