Cuando se nombra la inteligencia artificial (IA) muchas personas en lo primero que piensan es en ChatGPT, el chatbot de OpenAI al que se le puede pedir casi cualquier cosa: desde preguntarle dudas sobre todo lo que se nos pueda ocurrir hasta solicitarle que nos haga un resumen de un tema o de una noticia, que nos realice un trabajo o, desde hace unas semanas, que convierta fotos nuestras al estilo Ghibli, con ese formato anime, algo que se ha vuelto muy popular en las redes sociales.
Interpretar y manipular imágenes
Pues bien, desde el pasado miércoles OpenAI ha dado un paso más y ha anunciado que ChatGPT ya es capaz de interpretar y manipular imágenes, sin importar incluso que tengan baja calidad o que estén borrosas. Esa novedad ha llegado de la mano del lanzamiento ese mismo día de sus nuevos modelos de razonamiento o3 y o4-mini, que permiten al chatbot interpretar fotografías, esquemas, diagramas de libros o dibujos hechos a mano.
No sólo eso, sino que al mismo tiempo puede manipular las imágenes sobre la marcha: es capaz de girarlas, de ampliarlas y de editarlas. Así, según explica OpenAI en un comunicado, ChatGPT no se va a limitar a ver una imagen, sino que va a poder “pensar” con ella. Y todo ello gracias a que o3 es el modelo de razonamiento más potente que han creado hasta la fecha y es útil, sobre todo, en tareas visuales como el análisis de imágenes, tablas y gráficos, según afirman desde la empresa dirigida por Sam Altman.
Menos errores
Esa mejora se muestra en que, de acuerdo a las evaluaciones realizadas por expertos, o3 ha cometido un 20% menos de errores que el modelo o1 en funciones como la programación o la consultoría empresarial. También tiene mejor rendimiento que su predecesor, o3-mini, en áreas como la ciencia de datos. De este modo, tanto o3 como o4-mini siguen mejor las instrucciones y dan respuestas más naturales, personalizadas y similares a una conversación casual, asegura la compañía.
Open AI destaca que es la primera vez que sus modelos de razonamiento son capaces de utilizar y combinar de una forma dinámica todas las herramientas de que dispone ChatGPT, como la búsqueda en internet y el análisis de archivos y otros datos. Han entrenado a esos modelos para que puedan razonar sobre cuándo y cómo utilizar esas herramientas para producir respuestas detalladas en menos de un minuto y para resolver problemas más complejos.