A tecnologia GauGAN da Nvidia já tinha mostrado as suas capacidades com a possibilidade de transformar rabiscos em imagens realistas. Desde essa altura foi usado no Nvidia Canvas, mas parece que a empresa quer tirar mais da sua tecnologia de Inteligência Artificial, com o lançamento de uma nova versão desta tecnologia que é capaz de transformar uma descrição escrita numa imagem.
A Nvidia apresentou a tecnologia GauGAN pela primeira vez em 2019, mas só recentemente é que foi incorporada num produto que está disponível ao público. Chama-se Canvas e permite transformar desenhos simples em imagens realistas.
A Nvidia não se ficou pelo Canvas e continuou a fazer evoluir a tecnologia GauGAN, que agora chegou à versão 2.0. A grande novidade é que esta tecnologia permite escrever descrições breves e transformá-las automaticamente em imagens realistas.
Como se pode ver pelo vídeo acima, basta escrever alguma coisa no campo apropriado para ser gerada imediatamente uma imagem baseada nessas palavras. Se acrescentar um adjectivo ou substituir um substantivo, a imagem muda logo.
Para personalizar ainda mais os resultados, os utilizadores podem combinar as funcionalidades de desenho e de descrição. A descrição pode servir de base e o desenho pode servir para adicionar mais detalhe à imagem. Pode mudar-se a forma, tamanho e a textura de qualquer objecto que esteja na imagem.
Para conseguir estes resultados a funcionalidade de texto para imagem da tecnologia GauGAN 2 da Nvidia usa um modelo de Inteligência Artificial que põe duas redes a competir entre si, que competem entre si para gerar a imagem (generative adversarial network-based AI model). Segundo a Nvidia, este modelo de IA foi treinado com 10 milhões de imagens de paisagens para conseguir interpretar a grande maioria das descrições dos utilizadores.
Pode experimentar uma demonstração desta tecnologia GauGAN 2 da Nvidia no seu browser aqui.