Sexta feira passada a OpenIA lançou uma feature que causou um furdunço épico no mundo, quando eles melhoraram o sistema de geração de imagens do ChatGPT.
O chat GPT já gerava imagens usando o Dall E mas o bagulho agora ficou sério, mano.
A nova feature de geração de imagens do GPT é de cair o * da bunda, realmente. Estava estudando o conceito dela e diferente do sistema de difusão estável, do Midjourney e similares, ele provavelmente usa um sistema de criação de imagem, onde ele vai criando a imagem um pixel de cada vez, como se estivesse escrevendo, mas com pixels, num modelo multimodal autorregressivo por pixel chamado “Transfusion” com atenção bidirecional.
Esse sistema deve usar um processamento CAVALAR, não gosto nem de imaginar o volume de matemática nesses modelos. A ideia desse sistema de geração vem de um paper da galera de pesquisa em AI da Meta publicado em agosto do ano passado.
Estou a uns dias fora da internet, então já posso supor que deve estar lotada dessas taras de botar tudo com estética do estudio Ghibli ainda. Eu não gosto dessas trends, e pra falar a verdade, nem gosto dessa estética do Miazaki.
Mas vi no Reddit uma que achei muito legal, que é a de encontrar imagens que pareçam ter potencial para virar uma “pintura renascentista”. Por acaso hoje caminhando na praia me deparei com uma trave cheia de urubus e testei como isso poderia ficar com uma cara de pintura antiga.
Note que não é uma filtragem de uma imagem para outra. Eu mandei ele se inspirar na minha foto para gerar uma imagem que pareça uma pintura.
Ficaria bom para a capa de um disco de trash metal chamado “carniça”.
Aqui estão algumas das imagens bem legais dessa trend renascentista que é muito mais legal que brincar de encher o saco lá do véio Miazaki.
O que eu acho legal nela é que você tem que andar com o radar ligado para achar algo por aí que pareça dramático o bastante ou com uma composição suficientemente maneira para parecer com uma pintura que poderia estar no Louvre.