OpenAI ha presentado ChatGPT Imágenes 2.0, una nueva versión de su sistema de generación visual con la que quiere ir más allá de la imagen llamativa y acercarse a usos mucho más cotidianos: carteles, infografías, materiales educativos, diseños con texto, piezas para redes sociales o recursos visuales listos para trabajar con ellos desde el primer momento. La compañía lo anunció el 21 de abril de 2026 y lo define como una nueva etapa en la creación de imágenes con Inteligencia Artificial.

La gran diferencia, según OpenAI, está en la precisión. ChatGPT Imágenes 2.0 promete seguir instrucciones más detalladas, colocar mejor los objetos dentro de la escena, generar texto más fiable dentro de la propia imagen y adaptarse a distintos formatos sin tanta pérdida de coherencia. En otras palabras, la empresa quiere que el usuario deje de recibir algo “parecido” a lo que pidió y empiece a recibir algo más cercano a una pieza realmente utilizable.

El anuncio también deja ver un cambio de enfoque. OpenAI ya no habla de la imagen como un simple adorno o como una demostración creativa, sino como una herramienta para explicar, enseñar, prototipar y presentar ideas. Ese matiz es importante porque acerca esta tecnología a un público mucho más amplio: no solo diseñadores o creadores visuales, sino también profesores, equipos de marketing, responsables de producto o usuarios que necesitan comunicar algo de forma visual y clara.

Uno de los puntos donde más insiste OpenAI es en la mejora del texto dentro de las imágenes, uno de los grandes puntos débiles de muchos generadores visuales hasta ahora. La compañía asegura que Imágenes 2.0 rinde mejor con texto pequeño, iconografía, interfaces, diagramas y composiciones densas, y que en la API puede trabajar con resoluciones de hasta 2K, aunque aclara que por encima de ese nivel los resultados siguen en beta y pueden ser inconsistentes en algunos casos.

También hay una apuesta fuerte por el uso multilingüe. OpenAI sostiene que este modelo mejora de forma clara en idiomas no latinos, especialmente en japonés, coreano, chino, hindi y bengalí, con una renderización más correcta y más integrada visualmente. Esto no significa solo traducir un par de palabras, sino producir materiales donde el idioma forme parte natural del diseño, algo especialmente útil para carteles, cómics, recursos explicativos o campañas dirigidas a distintos mercados.

Otra novedad práctica es la flexibilidad en el formato. ChatGPT Imágenes 2.0 puede generar imágenes en relaciones de aspecto que van desde 3:1 hasta 1:3, lo que permite adaptarse mejor a banners horizontales, pantallas móviles, pósteres, diapositivas o publicaciones verticales para redes sociales. OpenAI plantea esta mejora como una forma de reducir el trabajo posterior de recorte y adaptación.

La empresa también ha querido reforzar la parte más “inteligente” del sistema. Cuando el usuario emplea un modelo de razonamiento o Pro dentro de ChatGPT, Imágenes 2.0 puede dedicar más tiempo a estructurar la tarea, buscar información actualizada en la web, revisar sus propios resultados y generar varias imágenes a la vez. OpenAI afirma que, en ese modo, el sistema puede crear hasta ocho imágenes coherentes en una sola solicitud, manteniendo cierta continuidad entre personajes, objetos o escenas.

Esa capacidad convierte al modelo en algo más parecido a un colaborador visual que a un simple generador. Para un usuario generalista, eso puede traducirse en pedir de una vez una serie de creatividades para redes, varias versiones de un cartel, una secuencia de viñetas o varias propuestas visuales para una misma idea sin tener que reconstruir todo el proyecto imagen a imagen. OpenAI quiere precisamente colocar el producto en ese terreno: menos experimento aislado y más herramienta útil para trabajo real.

ChatGPT Imágenes 2.0 ya está disponible para todos los usuarios de ChatGPT, mientras que las funciones avanzadas basadas en razonamiento quedan reservadas a los usuarios de Plus, Pro y Business. OpenAI también ha integrado estas capacidades en Codex y en la API, donde el modelo aparece como gpt-image-2, pensado para que empresas y desarrolladores lo incorporen a sus propios productos y flujos de trabajo.

Aun así, OpenAI reconoce que el modelo sigue teniendo límites. La compañía admite que todavía puede fallar en tareas con una fuerte carga de lógica física, como instrucciones de origami o rompecabezas como el cubo de Rubik, y que conviene revisar con cuidado diagramas, flechas y etiquetas cuando la precisión tiene que ser muy alta. Es decir, el avance es importante, pero no convierte todavía la generación de imágenes en un sistema infalible.

La conclusión más clara del lanzamiento es que la carrera de la IA visual entra en una fase mucho más madura. OpenAI ya no compite solo por quién genera la imagen más vistosa, sino por quién consigue que esas imágenes sirvan realmente para trabajar, enseñar, vender o comunicar. Y ahí es donde ChatGPT Imágenes 2.0 quiere marcar distancias.

Lo último

×