ChatGPT estrea unha nova xeración da súa tecnoloxÃa de creación de imaxes
martes, 21 de abril do 2026
A xeración de imaxes mediante IA dá un novo salto coa chegada de ChatGPT Images 2.0, unha evolución da tecnoloxÃa de OpenAI que introduce melloras substanciais na capacidade para interpretar instrucións complexas, organizar elementos con precisión e xerar composicións con maior coherencia estética e funcional.
O modelo destaca pola súa fidelidade á hora de reproducir detalles finos, un dos puntos tradicionalmente máis débiles neste tipo de sistemas. A capacidade para integrar texto pequeno, iconografÃa, interfaces ou composicións densas permite obter resultados directamente utilizables, reducindo a distancia entre a intención inicial e o resultado final. Ademais, amplÃa a resolución ata os 2K na API e admite unha maior variedade de relacións de aspecto, o que facilita a súa adaptación a formatos como carteis, pantallas móbiles ou banners panorámicos.
Tamén se rexistran avances significativos no tratamento de linguas distintas do inglés. O modelo mellora a representación de textos complexos en idiomas con alfabetos non latinos, como xaponés, coreano, chinés, hindi ou bengalÃ, permitindo que o contido lingüÃstico forme parte orgánica do deseño visual. Esta evolución favorece a creación de materiais gráficos multilingües con maior coherencia e calidade.
No plano estilÃstico, a ferramenta logra unha reprodución máis precisa de diferentes linguaxes visuais, desde fotografÃa realista ata manga, pixel art ou estética cinematográfica. A mellora na iluminación, textura e composición contribúe a que as imaxes resultantes presenten unha aparencia máis intencional e menos asociada aos patróns tÃpicos da xeración automatizada.
Un dos elementos máis novidosos é a incorporación de capacidades de razoamento cando se empregan modelos con modo thinking. O sistema pode buscar información actualizada na web, verificar os seus propios resultados e xerar múltiples imaxes coherentes a partir dunha única solicitude. Isto permite desenvolver conxuntos visuais completos (como secuencias narrativas, propostas de deseño ou series gráficas) mantendo continuidade entre elementos e personaxes.
O modelo incorpora tamén un coñecemento máis recente do mundo (ata decembro de 2025), o que mellora a exactitude en contidos educativos, diagramas ou materiais explicativos. A súa capacidade para estruturar información e organizala visualmente con claridade reforza o seu papel como ferramenta de apoio á comunicación e á aprendizaxe.
A integración en contornos como Codex permite combinar a creación visual con procesos de deseño, prototipado e produción nunha mesma plataforma. Pola súa banda, a API con gpt-image-2 facilita a incorporación destas capacidades en produtos e servizos, especialmente en casos como publicidade localizada, contido educativo ou ferramentas de deseño.
A pesar dos avances, o sistema mantén limitacións en tarefas que requiren unha comprensión fÃsica complexa ou unha precisión extrema en certos detalles, como pregados complexos, crebacabezas ou patróns moi repetitivos. Tamén se recomenda revisar manualmente diagramas e etiquetaxes cando a exactitude sexa crÃtica.
ChatGPT Images 2.0 está dispoñible desde hoxe para usuarios de ChatGPT, Codex e a API, cun acceso ampliado ás funcións avanzadas para subscricións de pago.
