
El modelo de generación de imágenes integrado en ChatGPT, identificado como GPT Image 1.5, ha experimentado avances en la precisión de edición, permitiendo que los cambios solicitados por el usuario se reflejen de manera exacta y que la imagen conserve elementos como la iluminación, la composición y la apariencia general. Tal como informó OpenAI en un comunicado recogido por diversos medios, una de las principales mejoras radica en el seguimiento de instrucciones adicionales, ya que el sistema ahora interpreta con mayor fidelidad las indicaciones sucesivas para trabajos de edición y composición visual.
Según publicó OpenAI, la actualización más reciente de su generador gráfico ha elevado la velocidad de creación de imágenes, alcanzando una rapidez cuatro veces superior a la de la versión anterior. La empresa señaló que estas mejoras están ya presentes en ChatGPT Imagen, que integra este nuevo modelo desde este martes, tanto para usuarios individuales como a través de la API; los servicios dirigidos a empresas y negocios recibirán acceso en una fecha posterior.
El medio reportó también que el nuevo sistema admite, por primera vez, la renderización precisa de texto dentro de las imágenes generadas. Esta capacidad permite que ChatGPT Imagen pueda elaborar menús, afiches o infografías en los que el texto aparece con fidelidad visual, incluso cuando es denso o utiliza letra pequeña. De acuerdo con OpenAI, las relaciones visuales entre los objetos representados mantienen coherencia, lo que facilita generar composiciones complejas y alineadas con las solicitudes del usuario.
El añadido de generación de texto visual sitúa a OpenAI en competencia directa con Google, cuya plataforma Nano Banana Pro (Gemini 3 Pro Image) ya ofrecía capacidades avanzadas en el conocimiento del mundo y en la integración precisa de texto en imágenes, según detalló la propia compañía. Google ha destacado que sus modelos también permiten crear imágenes informativas que incluyen explicaciones, diagramas y representaciones detalladas, recursos que OpenAI busca igualar y superar con esta actualización.
De acuerdo con la información difundida por OpenAI, aún persisten ciertas limitaciones en la tecnología de generación de imágenes. Entre los desafíos identificados figuran mantener la identidad individual de las personas en imágenes grupales, un aspecto relevante para aplicaciones que requieran precisión en la representación personal. Además, el modelo muestra restricciones en cuanto a la traducción de texto visual a determinados idiomas, como el chino, árabe o hebreo, donde la interpretación y el despliegue gráfico pueden no resultar completamente fieles.
En el comunicado, OpenAI resaltó que esta versión de ChatGPT Imagen busca simplificar la edición visual para usuarios que requieren ajustes específicos y mantener la coherencia en proyectos de diseño. Desde la compañía aseguraron: "Esto permite ediciones más precisas, así como composiciones originales más complejas, donde las relaciones entre los elementos se conservan según lo previsto". OpenAI enfatizó el objetivo de lograr resultados que respondan exactamente a las necesidades expresadas en las instrucciones de los usuarios.
El despliegue del nuevo modelo responde a la intensificación de la competencia entre plataformas de generación visual mediante inteligencia artificial. Mientras Google promocionó las capacidades de Gemini 3 en razón avanzada y comprensión contextual, OpenAI apuesta por la rapidez y la precisión en la edición y en la integración textual, características que, según la empresa, posicionan a ChatGPT Imagen como una herramienta versátil para la creación de material gráfico de alta calidad y utilidad práctica.
OpenAI detalló que la disponibilidad inmediata de estas funcionalidades en ChatGPT e API permitirá que tanto usuarios particulares como desarrolladores tengan acceso a un proceso de creación visual más ágil y ajustado a sus necesidades. Al mismo tiempo, se espera que la futura integración en versiones empresariales posibilite un aprovechamiento en sectores como el diseño gráfico, la publicidad, la educación y otros mercados donde la personalización visual y la calidad del texto representado son factores determinantes.
El anuncio de OpenAI se produjo luego de que la industria tecnológica intensificara el enfoque en la adaptación de modelos generativos a tareas cada vez más complejas, especialmente en el renderizado de información visual y textual de modo integrado. A medida que avanzan las posibilidades tecnológicas, las empresas buscan consolidar herramientas que respondan de forma más precisa a las demandas de los usuarios en un entorno digital donde la personalización y la inmediatez son condiciones prioritarias.


