Nova ferramenta permite criar imagens personalizadas sem necessidade de interferência textual
O Google anunciou recentemente o lançamento do Whisk, uma ferramenta inovadora de inteligência artificial que possibilita aos usuários gerar imagens utilizando outras imagens como referência, eliminando a necessidade de inúmeras textuais incluídas.
Com o Whisk, os usuários podem fornecer imagens que sugerem o assunto, a cena e o estilo da imagem desejada. É possível utilizar diversas imagens para cada uma dessas categorias, permitindo diferentes tipos. Para aqueles que não possuem imagens específicas, a ferramenta oferece a opção de gerar sugestões por meio de inteligência artificial. Embora o uso do texto seja opcional, os usuários podem adicionar detalhes adicionais para refinar o resultado.
Após a seleção das imagens, o Whisk gera uma nova imagem acompanhada de um prompt textual correspondente. Os usuários têm a opção de favoritar, baixar ou refinar a imagem gerada, editando os prompts de texto conforme desejado. Essa funcionalidade permite uma iteração rápida e divertida, incentivando a criatividade dos usuários na busca pelo resultado ideal.
O Google destaca que o Whisk foi projetado para “exploração visual rápida, e não para edições perfeitas em pixel”. A empresa regularmente que a ferramenta pode apresentar imprecisões em algumas tentativas, mas oferece recursos para que os usuários ajustem os prompts e obtenham melhores resultados. O Whisk utiliza a versão mais recente do modelo de geração de imagens do Google, o Imagen 3.
Além do Whisk, o Google anunciou o Veo 2, uma nova versão de seu modelo de geração de vídeos, que promete uma compreensão mais apurada da “linguagem única da cinematografia”. O Veo 2 será disponibilizado inicialmente no VideoFX do Google, com expansão prevista para o YouTube Shorts e outros produtos ao longo do próximo ano.
Essas inovações refletem o compromisso do Google em melhorias de ferramentas de criação visual, tornando-as mais acessíveis e intuitivas para os usuários, e ampliando as possibilidades de expressão criativa por meio da inteligência artificial.