Вълнението в AI общността нарасна, когато OpenAI представи Advanced Voice Mode през май. По време на представянето на най-новия си водещ модел, GPT-4o, компанията подчерта неговите забележителни мултимодални функции.
Но в продължение на няколко месеца това беше просто демонстрация на потенциал. Първоначално OpenAI увери потребителите, че Advanced Voice Mode ще бъде достъпен скоро, но отне значително повече време от очакваното и не всички получиха достъп веднага. Освен това по това време липсваха зрителни функции. Сега OpenAI най-накрая въвежда Vision в Advanced Voice Mode.
Тази актуализация пристига на шестия ден от инициативата на OpenAI, „12 дни на доставка“, по време на която Сам Алтман и други членове на екипа разкриха различни актуализации, както големи, така и второстепенни, за да разпространят празнично настроение.
Сред забележителните скорошни стартирания са абонаментът за ChatGPT Pro, пълното внедряване на техния модел за разсъждение o1, публичното стартиране на Sora, техния видео модел и подобрено платно, достъпно за всички потребители.
Съобщението на Vision следва непосредствено зад витрината на Google за подобрена версия на Project Astra и нов прототип, Project Mariner, включващ разширени възможности. Въпреки това OpenAI отново пое водеща роля, тъй като Project Astra все още не е публично достъпен.
С добавянето на Vision в разширен гласов режим, потребителите вече могат директно да споделят видео на живо от своята камера или да показват екрана на телефона си в ChatGPT. Тази актуализация е дългоочаквана, особено поради потенциалните ползи за хората с увредено зрение.
В директна демонстрация, споделена днес, екипът на OpenAI използва поддръжката на ChatGPT, за да приготви кафе за заливане.

Понастоящем функцията Vision в Advanced Voice Mode е настроена да стартира изключително в мобилното приложение ChatGPT. Потребителите се надяват на бързото му въвеждане във варианти за настолни компютри, тъй като това ще намали пречките при търсене на помощ от ChatGPT при многозадачност или кодиране.
Това внедряване ще бъде достъпно за всички потребители на Teams, докато потребителите на Plus и Pro в световен мащаб, с изключение на тези в ЕС, могат да започнат да го използват днес; пълното внедряване се очаква да приключи до края на седмицата. Потребителите на Edu и Enterprise ще трябва да чакат по-дълго, като достъпът се очаква в началото на следващата година.
Докато усъвършенстваният гласов режим на ChatGPT беше полезен преди, липсваше му основната функционалност за зрение, което му попречи да се превърне в наистина практичен помощник. С пускането на визията, аз съм нетърпелив да стана свидетел на трансформиращото въздействие, което може да има.
В празничен ход, OpenAI също така представи нов режим на Дядо Коледа в ChatGPT, който ще бъде достъпен глобално във всички платформи – мобилни, десктоп и уеб. Този режим може да се активира както в разширен, така и в стандартен гласов режим. Когато за първи път активирате режима на Дядо Коледа, OpenAI ще обнови лимита ви за разширен гласов режим, което означава, че все още можете да се наслаждавате на празненствата, дори ако сте достигнали лимита си. И ако изчерпите средствата си за разширен гласов режим, стандартният Дядо Коледа винаги ще бъде до вас.
Вашият коментар ▼