Tecnología

OpenAi sorprende con una inteligencia artificial generativa capaz de dialogar

  • Un grupo reducido de usuarios prueba un prodigio que irá extendiéndose poco a poco
  • La nueva tecnología detecta y responde a las emociones de sus interlocutores.
  • Las comunicaciones en lenguaje natural y en tiempo real velarán por la privacidad
Sam Altman, Foto de Open AI
Madridicon-related

Un privilegiado grupo de usuarios de ChatGPT Plus ya tiene acceso a la versión alfa del nuevo modo de voz de la inteligencia artificial generativa de OpenAi. Según se desvela a través de las redes sociales de X y de LinkedIn, la compañía de Sam Altman facilitará la comunicaciones en lenguaje natural y en tiempo real, con la posibilidad de poder interrumpir en cualquier momento la locución, mientras el sistema detecta y responde a las emociones de sus interlocutores.

Como ocurre con otras innovaciones, la compañía prevé extender el acceso de forma gradual en las próximas semanas, "con el objetivo de que todos los usuarios de ChatGPT Plus puedan disfrutar de esta función en otoño. Los usuarios que participen en la fase alfa recibirán una notificación en la aplicación de ChatGPT y un correo electrónico con instrucciones para utilizarla", según explican fuentes de la empresa. No obstante, el uso compartido de vídeo y pantalla deberá esperar para otra versión.

En línea con las prioridades estratégicas de OpenAI, la calidad y seguridad en las conversaciones serán dos de las líneas rojas de la sociedad. En el primer caso, el objetivo pasa por "proporcionar la mejor experiencia posible, se ha fortalecido la capacidad del modelo para soportar millones de conversaciones de voz simultáneas en tiempo real, manteniendo una baja latencia y una alta calidad". En cuanto a la seguridad, el pasado junio se informó de que "se estaban realizando mejoras en la capacidad del modelo para detectar y rechazar contenidos inapropiados". En concreto, durante los últimos dos meses, la firma "ha realizado pruebas de las capacidades de voz del modelo con más de 100 miembros externos, quienes hablan 45 idiomas diferentes y representan 29 regiones geográficas".

Con el objetivo de asegurar que el sistema respete la privacidad de las personas, "el modo de voz avanzado emplea cuatro voces preestablecidas desarrolladas en colaboración con actores de doblaje". De esa forma, se ha diseñado ChatGPT "para que no pueda imitar las voces de otras personas, ya sean particulares o figuras públicas, y se bloquearán las salidas que no coincidan con una de estas voces propuestas".

Para proteger los derechos, se han puesto en marcha nuevos filtros que detectarán y bloquearán solicitudes para generar música u otros audios protegidos por derechos de autor. Para garantizar que ChatGPT sea útil y beneficioso, "se han aplicado las mismas medidas de seguridad en todas las modalidades, tanto de texto como de voz, asegurando que GPT-4o cumpla con la legislación vigente y no genere ningún tipo de contenido perjudicial". A lo largo del mes de agosto, la compañía tiene previsto publicar un informe detallado sobre los esfuerzos realizados para optimizar la seguridad y potenciar la experiencia de este nuevo modo de voz avanzado.

Fuentes de la empresa recuerdan que la referida fase alfa "tiene como objetivo probar, aprender y perfeccionar el sistema, garantizando así la mejor experiencia posible". Además, al realizar un lanzamiento gradual, se permite una supervisión detallada del uso de la herramienta, lo que facilita la realización de ajustes y mejoras sobre las capacidades y la seguridad en función de los comentarios del público real".

WhatsAppFacebookFacebookTwitterTwitterLinkedinLinkedinBeloudBeloudBluesky