Desde el lanzamiento de ChatGPT (noviembre de 2022) podemos decir que casi no hay profesional en el mundo que no haya probado tener una conversación con la IA generativa de OpenAI.
Todos tuvimos grandes charlas, realizamos consultas puntuales y hasta pedimos información que utilizamos en nuestra diaria. Todo esto limitado a un chat de texto. Sin embargo, el día 13 de mayo salió a la luz “GPT-4o”, un nuevo modelo con interpretación visual y de audio incorporado.
Conocé el video oficial de lanzamiento aquí: https://openai.com/index/hello-gpt-4o/
¿Cuáles son las novedades?
Es verdad que existía anteriormente una versión de ChatGPT con audio incluído, sin embargo, las novedades de este nuevo modelo son evidentes:
- Capacidad de interpretar video en tiempo real
- Velocidad de respuesta de audio mucho más veloz y real
- Interpretación de más de 20 idiomas
Agregando también una calidad y performance superadora como se da en todos los lanzamientos de OpenAi:
Evaluación de performance de interpretación visual de GPT-4o.
¿Qué podemos hacer ahora?
Al igual que la versión de texto, los límites son casi inexistentes. OpenAI nos mostró solo algunas de sus posibilidades, tales como:
- Canto
- Preparación para entrevistas de trabajo
- Interpretación y descripción de espacios
- Traducción en tiempo real
- Sarcasmo
- Atención al cliente
- Bromas
- Explicación de conceptos matemáticos con ejemplos reales
- Enseñanza de idiomas
Esto es solo el comienzo de grandes cosas que podrá hacer la versión en video y voz de GPT-4o.
Conocé la noticia completa en https://openai.com/index/hello-gpt-4o/.
Si querés trabajar con IA generativa personalizada en tu empresa, no dudes en contactarte con Taligent: https://www.taligent.com.uy/.
Conecta