O Gemini Google é um chatbot de inteligência artificial projetado para executar diversas tarefas cotidianas, mas enfrenta dificuldades na geração de imagens profissionais, especialmente para uso em plataformas como o LinkedIn. Mesmo ao receber uma fotografia real de referência e um comando minucioso que inclui informações sobre o objetivo da imagem, a descrição da pessoa e o cenário, a IA do Google não consegue fornecer resultados satisfatórios. Recentemente, realizamos um teste comparativo com o ChatGPT, que utilizou a mesma tarefa. Confira os detalhes do teste e os resultados obtidos pelo TecMania em relação ao Gemini Google.
O primeiro passo do teste consistiu em selecionar uma foto que serviria como base para as alterações. Em seguida, formulamos um prompt detalhado, incluindo o objetivo da imagem: “Quero criar uma foto profissional para ser utilizada como imagem de perfil no meu LinkedIn”. Descrevemos a pessoa na foto de referência e solicitamos ao Gemini Google que utilizasse essa imagem, mas com alterações no estilo.
O comando foi: “Use esta foto real como base e faça as seguintes alterações: mantenha a mesma pessoa retratada na imagem, que é uma mulher branca, com cabelo liso e escuro, óculos, olhos castanhos e um sorriso, vestida com um casaco preto, usando um colar prata, com uma expressão sorridente. Crie um estilo semelhante ao das fotografias tiradas em estúdios profissionais, com um cenário azul neutro ao fundo, para transmitir uma imagem profissional. A imagem deve ser feita somente do ombro para cima, como na foto de referência.”
Apesar do comando detalhado, o Gemini não conseguiu realizar os ajustes desejados, criando uma nova foto que não correspondia à pessoa real. Testamos várias alterações no prompt para tentar melhorar os resultados.
Com o comando: “Use esta foto como base para criar uma imagem profissional que eu possa usar no meu LinkedIn. A imagem deve ter um estilo semelhante ao das fotografias feitas em estúdios profissionais. A pessoa na imagem é uma mulher branca, com cabelo liso e escuro, óculos, olhos castanhos e um sorriso no rosto, vestida com um casaco preto e um colar prata. Manter uma expressão sorridente e o enquadramento deve ser apenas do ombro para cima. O fundo deve ser neutro, azul, para transmitir uma imagem profissional. A imagem tem que ser realista e ter qualidade similar à de uma câmera profissional.”
No entanto, o chatbot de IA não conseguiu utilizar a foto de referência e gerou mais uma imagem artificial. Em um terceiro teste, com o mesmo estilo de prompt, mais detalhado, o Gemini não atendeu às expectativas novamente, criando uma nova imagem sem preservar a foto base.
Quando comparamos o desempenho do Gemini com o ChatGPT, a diferença ficou clara. O ChatGPT apresentou resultados mais adequados para a tarefa de gerar uma foto profissional. Em um teste semelhante, o chatbot da OpenAI entendeu o comando detalhado e usou uma foto de referência com sucesso.
O ChatGPT mostrou-se eficaz como um editor de imagens, obtendo um resultado que se aproximava do desejado para uso profissional. Essa comparação evidencia a limitação da IA do Google nesse tipo de tarefa, ressaltando a superioridade do ChatGPT.