External Publication

Introducing gpt-image-2 - available today in the API and Codex

OpenAI Developer Community April 22, 2026

Translated with AI:

Dear Team,

I would like to congratulate your team on the recent improvements in image processing and generation. The progress of this functionality has been remarkably meaningful and opens up a wide range of practical possibilities.

Building on this advancement, I would like to suggest a potential expansion: the ability to work with longer-form videos derived from multiple sequential images.

For example, it would be extraordinarily compelling to allow users to submit a large sequence of images—such as comic book or manga pages containing more than 100 panels—and enable the AI to:

Interpret speech bubbles in order to understand the context and construct a coherent narrative script
Identify characters, expressions, and settings from the images
Generate motion between panels, transforming a static sequence into a fluid animation
Produce something akin to an animated adaptation in the style of anime production

Such a feature could represent a major breakthrough for content creators, artists, and even media companies, significantly reducing the effort required to transform visual stories into fully realized animations.

I believe that, given the capabilities already in place, this would be a natural and highly impactful next step.

Thank you for your attention and for the excellent work that has been carried out.

Prezados,

Gostaria de parabenizar a equipe pelas recentes melhorias relacionadas ao processamento e geração de imagens. A evolução dessa funcionalidade tem sido bastante relevante e abre diversas possibilidades práticas.

Aproveitando esse avanço, gostaria de sugerir uma possível expansão: a capacidade de trabalhar com vídeos mais extensos a partir de múltiplas imagens sequenciais.

Por exemplo, seria extremamente interessante permitir que o usuário enviasse uma sequência grande de imagens — como páginas de quadrinhos ou mangás (com mais de 100 quadros) — e a IA fosse capaz de:

Interpretar os balões de fala para compreender o contexto e construir um roteiro coerente
Identificar personagens, expressões e ambientes a partir das imagens
Gerar movimento entre os quadros, transformando a sequência estática em uma animação fluida
Produzir algo semelhante a uma adaptação animada, no estilo de produção de animes

Essa funcionalidade poderia representar um grande avanço para criadores de conteúdo, artistas e até empresas de mídia, reduzindo significativamente o esforço necessário para transformar histórias visuais em animações completas.

Acredito que, com os recursos atuais já implementados, essa evolução seria um passo natural e de grande impacto.

Agradeço pela atenção e pelo excelente trabalho que vem sendo desenvolvido.

Discussion in the ATmosphere