Introducing gpt-image-2 - available today in the API and Codex
Translated with AI:
Dear Team,
I would like to congratulate your team on the recent improvements in image processing and generation. The progress of this functionality has been remarkably meaningful and opens up a wide range of practical possibilities.
Building on this advancement, I would like to suggest a potential expansion: the ability to work with longer-form videos derived from multiple sequential images.
For example, it would be extraordinarily compelling to allow users to submit a large sequence of images—such as comic book or manga pages containing more than 100 panels—and enable the AI to:
- Interpret speech bubbles in order to understand the context and construct a coherent narrative script
- Identify characters, expressions, and settings from the images
- Generate motion between panels, transforming a static sequence into a fluid animation
- Produce something akin to an animated adaptation in the style of anime production
Such a feature could represent a major breakthrough for content creators, artists, and even media companies, significantly reducing the effort required to transform visual stories into fully realized animations.
I believe that, given the capabilities already in place, this would be a natural and highly impactful next step.
Thank you for your attention and for the excellent work that has been carried out.
Prezados,
Gostaria de parabenizar a equipe pelas recentes melhorias relacionadas ao processamento e geração de imagens. A evolução dessa funcionalidade tem sido bastante relevante e abre diversas possibilidades práticas.
Aproveitando esse avanço, gostaria de sugerir uma possível expansão: a capacidade de trabalhar com vídeos mais extensos a partir de múltiplas imagens sequenciais.
Por exemplo, seria extremamente interessante permitir que o usuário enviasse uma sequência grande de imagens — como páginas de quadrinhos ou mangás (com mais de 100 quadros) — e a IA fosse capaz de:
- Interpretar os balões de fala para compreender o contexto e construir um roteiro coerente
- Identificar personagens, expressões e ambientes a partir das imagens
- Gerar movimento entre os quadros, transformando a sequência estática em uma animação fluida
- Produzir algo semelhante a uma adaptação animada, no estilo de produção de animes
Essa funcionalidade poderia representar um grande avanço para criadores de conteúdo, artistas e até empresas de mídia, reduzindo significativamente o esforço necessário para transformar histórias visuais em animações completas.
Acredito que, com os recursos atuais já implementados, essa evolução seria um passo natural e de grande impacto.
Agradeço pela atenção e pelo excelente trabalho que vem sendo desenvolvido.
Discussion in the ATmosphere