OpenAI, ChatGPT에서 향상된 음성 모드를 위한 Vision 기능 출시

OpenAI가 5월에 Advanced Voice Mode를 공개했을 때 AI 커뮤니티의 흥분은 고조되었습니다. 최신 플래그십 모델인 GPT-4o를 출시하는 동안 이 회사는 놀라운 멀티모달 기능을 강조했습니다.

그러나 몇 달 동안 그것은 단지 잠재력의 전시일 뿐이었습니다. OpenAI는 처음에 사용자에게 고급 음성 모드가 곧 제공될 것이라고 확신했지만 예상보다 상당히 오래 걸렸고 모든 사람이 즉시 액세스할 수 있는 것은 아니었습니다. 게다가 그 당시에는 비전 기능이 없었습니다. 이제 OpenAI는 마침내 고급 음성 모드에서 비전을 소개합니다.

이 업데이트는 OpenAI의 이니셔티브인 ’12 Days of Shipping’의 여섯 번째 날을 기념하여 공개되었습니다. 이 기간 동안 샘 알트먼과 다른 팀원들은 축제 분위기를 전파하기 위해 주요, 사소한 다양한 업데이트를 공개했습니다.

최근 출시된 주요 제품으로는 ChatGPT Pro 구독, o1 추론 모델의 전체 출시, 비디오 모델인 Sora의 공개 출시, 모든 사용자가 이용할 수 있는 향상된 Canvas 등이 있습니다.

Vision 발표는 Google이 Project Astra의 업그레이드 버전과 고급 기능을 갖춘 새로운 프로토타입인 Project Mariner를 선보인 직후에 이루어졌습니다. 그러나 OpenAI가 다시 한 번 선두를 차지했는데, Project Astra는 아직 공개적으로 제공되지 않았기 때문입니다.

Advanced Voice Mode에 Vision이 추가되어 사용자는 이제 카메라에서 라이브 비디오 피드를 직접 공유하거나 휴대전화 화면을 ChatGPT에 표시할 수 있습니다. 이 업데이트는 특히 시각 장애인에게 잠재적인 이점이 있어 큰 기대를 모으고 있습니다.

오늘 공유한 간단한 데모에서 OpenAI 팀은 ChatGPT의 지원을 활용하여 퍼오버 커피를 준비했습니다.

출처: OpenAI

현재 Advanced Voice Mode의 Vision 기능은 ChatGPT 모바일 애플리케이션에서만 독점적으로 출시될 예정입니다. 사용자는 데스크톱 버전에서 빠르게 도입되기를 기대하는데, 이는 멀티태스킹이나 코딩 중에 ChatGPT의 도움을 구할 때 방해가 줄어들기 때문입니다.

이 롤아웃은 모든 Teams 사용자가 이용할 수 있으며, EU를 제외한 전 세계의 Plus 및 Pro 사용자는 오늘부터 사용을 시작할 수 있습니다. 전체 배포는 이번 주 말까지 완료될 것으로 예상됩니다. Edu 및 Enterprise 사용자는 더 오래 기다려야 하며, 내년 초에 액세스할 수 있을 것으로 예상됩니다.

ChatGPT의 고급 음성 모드는 이전에 유용했지만 필수적인 비전 기능이 부족하여 진정으로 실용적인 보조자가 되지 못했습니다. 비전 릴리스와 함께 이것이 가져올 수 있는 혁신적인 영향을 목격하고 싶습니다.

축제의 일환으로 OpenAI는 ChatGPT에 새로운 산타 모드를 도입했습니다. 이 모드는 모바일, 데스크톱, 웹 등 모든 플랫폼에서 전 세계적으로 사용할 수 있습니다. 이 모드는 고급 및 표준 음성 모드에서 모두 활성화할 수 있습니다. 산타 모드를 처음 활성화하면 OpenAI가 고급 음성 모드 제한을 새로 고침하므로 제한에 도달하더라도 여전히 축제를 즐길 수 있습니다. 고급 음성 모드 허용 한도를 모두 소진하더라도 표준 산타가 항상 여러분을 위해 거기에 있습니다.

OpenAI, ChatGPT에서 향상된 음성 모드를 위한 Vision 기능 출시

관련 기사:

Instagram 충돌 문제를 해결하는 방법: 6가지 최고의 솔루션

YouTube 비디오 재생 불가 문제에 대한 상위 5가지 솔루션

답글 남기기 응답 취소