A OpenAI apresentou recentemente o ChatGPT Images 2.0, uma evolução do modelo de geração de imagens com inteligência artificial, que foi divulgada na última terça-feira (21). Esta nova versão se destaca por sua capacidade de atender a solicitações mais complexas, integrando um modo de "raciocínio" que facilita a busca de referências visuais online.
O modelo é descrito como de "estado da arte" pela empresa, que enfatiza um avanço significativo na compreensão de instruções detalhadas e na posição de objetos nas criações.
O que há de novo no Images 2.0?
O gerador de imagens agora apresenta maior precisão e inteligência. Ele consegue lidar com prompts mais extensos, seguindo diretrizes complexas e inovando com um modo de "raciocínio" que se destina a ajudar em buscas na web e na execução de tarefas desafiadoras.
Os usuários podem agora criar textos mais longos e densos, além de garantir que os elementos sejam posicionados de forma fiel ao solicitado. O recurso ainda suporta múltiplos idiomas simultaneamente e permite a utilização de várias proporções de imagem, o que é ideal para posts em redes sociais ou cartazes.
Possibilidades com o novo modelo
Com o ChatGPT, é viável realizar uma variedade de tarefas, especialmente voltadas para criação gráfica.
Acessibilidade
O Images 2.0 está disponível para todos os usuários do ChatGPT e também na API da OpenAI. Contudo, o acesso ao modo de raciocínio pode depender do nível de assinatura.
Vantagem competitiva
A OpenAI se destaca no mercado de geradores de imagens com seu novo modelo. Segundo a plataforma de benchmark LMArena, que avalia diversas IAs, o Images 2.0 líder absoluto na conversão de texto para imagem, superando concorrentes como o Nano Banana 2, do Google.
Se você está interessado em explorar essa poderosa ferramenta da OpenAI, não deixe de conferir os diversos comandos para criar e editar imagens no ChatGPT.