OpenAI lança novo modelo de imagens no ChatGPT e reforça disputa no setor de IA

A OpenAI anunciou um novo modelo de geração de imagens integrado ao ChatGPT, em mais um movimento para ampliar as funções da inteligência artificial além do texto. Segundo a empresa, a atualização melhora a criação de imagens do zero, aprimora a edição de fotos enviadas pelos usuários e aumenta a capacidade do sistema de seguir instruções com mais precisão.

A nova tecnologia passa a atuar de forma mais ampla dentro do ChatGPT, permitindo que o usuário peça ajustes específicos em uma imagem sem comprometer elementos importantes da composição original. De acordo com a OpenAI, o sistema foi desenvolvido para manter detalhes como iluminação, enquadramento e aparência das pessoas, ao mesmo tempo em que executa alterações mais pontuais ou transforma completamente o estilo visual de uma imagem.

A empresa afirma que o novo modelo também avançou na interpretação de comandos mais detalhados, o que tende a reduzir erros comuns em ferramentas desse tipo. Entre os ganhos destacados estão a renderização mais precisa de textos dentro das imagens, a melhor organização de múltiplos elementos em uma mesma cena e maior consistência visual em processos de edição feitos em sequência.

Em outra frente, a OpenAI informa que a geração de imagens foi incorporada de forma nativa ao GPT-4o, modelo multimodal da companhia. Na prática, isso permite que texto e imagem sejam processados dentro do mesmo contexto de conversa, o que amplia a possibilidade de refinar resultados ao longo da interação. A proposta, segundo a empresa, é tornar a ferramenta mais útil para tarefas concretas, como produção de material publicitário, desenvolvimento de catálogos, criação de identidades visuais e adaptação de imagens para diferentes usos.

O lançamento também sinaliza uma tentativa de posicionar o ChatGPT como uma plataforma mais completa de produção visual. A OpenAI afirma que o novo recurso está sendo liberado para usuários da plataforma e para desenvolvedores por meio da API, com o nome GPT Image 1.5. A companhia sustenta que a meta é entregar resultados mais próximos da intenção do usuário, com menos necessidade de repetição de comandos e maior aproveitamento prático das imagens geradas.

Apesar do avanço, a empresa reconhece que o sistema ainda enfrenta limitações. Entre os pontos que seguem em aperfeiçoamento estão a geração de peças mais longas, como cartazes, além da necessidade de evolução contínua nos mecanismos de segurança. A OpenAI diz que as imagens geradas recebem marcação de procedência e passam por políticas de moderação voltadas a restringir conteúdos sensíveis ou que violem suas regras de uso.

No cenário mais amplo da inteligência artificial, o anúncio reforça a corrida entre empresas de tecnologia para oferecer ferramentas cada vez mais completas, capazes de reunir texto, imagem e interação em um mesmo ambiente. Ao apostar em geração visual com foco em precisão e edição conversacional, a OpenAI tenta consolidar o ChatGPT não apenas como um assistente de texto, mas como uma ferramenta multifuncional para criação de conteúdo.

Deixe um comentário Cancelar resposta