OpenAI lanza nuevo modelo de interacción

La empresa de investigación y despliegue de inteligencia artificial, OpenAI anunció este lunes el lanzamiento de GPT-4o, un nuevo modelo que puede razonar por medio de audio, visión y texto con respuesta a tiempo real.

En un comunicado, la compañía explicó que el modelo acepta entradas con cualquier combinación de textos, audios, imágenes y genera resultados compuestos en tan solo 232 milisegundos, lo que se asemeja a la respuesta promedio del ser humano.

Esta modificación “iguala el rendimiento de GPT-4 Turbo en texto en inglés y código, con una mejora significativa en otros idiomas, a la vez que es mucho más rápido y un 50 % más económico en la API”, resalta.

El nuevo modelo posee una mejor calidad en los procesos de visión y audio a comparación con los modelos ya existentes, debido a que procesa todas las entradas y salida por la misma “red neuronal”, lo que hace que se combinen eficientemente las modalidades aplicadas.

“Según las mediciones de los puntos de referencia tradicionales, GPT-4o logra un rendimiento de nivel GPT-4 Turbo en texto, razonamiento e inteligencia de codificación, al tiempo que establece nuevos récords en capacidades multilingües, de audio y de visión”, sostiene.

Nuevo proceso de seguridad de OpenAI
El GPT-4o también modificó su sistema de seguridad con un diseño que incluye técnicas para filtrar datos y refinar el comportamiento de la inteligencia. También proporciona nuevas barreras de seguridad en las salidas de voz.

“Nuestras evaluaciones de ciberseguridad, QBRN, persuasión y autonomía del modelo muestran que GPT-4o no obtiene una puntuación superior al riesgo medio en ninguna de estas categorías. Esta evaluación implicó ejecutar un conjunto de evaluaciones humanas y automatizadas durante todo el proceso de capacitación del modelo”, comparte.

Asimismo, expone la prueba de versiones anteriores y la atención de eventos de seguridad que, en el nuevo método, se evitará fácilmente. Este sistema también evitará respuestas que afecten la psicología social, que manifiesten prejuicios, que sean equitativos y precisos.

OpenAI anunció que en las próximas semanas el equipo de técnicos encargado de este proyecto trabajará en la infraestructura técnica y usabilidad de la inteligencia para actualizarla y proporcionar nuevos avances novedosos.

Share this content: