A Adobe está a dar o salto para o vídeo de IA generativa. O Firefly Video Model tem sido desvendado aos poucos, desde o início deste ano, e foi lançado em Outubro sob a forma de um conjunto de novas ferramentas integradas no Premiere Pro.
O vídeo está curto? A Adobe resolve
A Generative Extend foi lançada em versão beta para o Premiere Pro e pode ser usada para aumentar o tempo total de um vídeo a partir do final ou do início de uma filmagem que tenha ficado ligeiramente curta. Esta ferramenta também permite ajustes a meio de um vídeo, como corrigir linhas de visão deslocadas ou movimentos inesperados.
Os clips de vídeo só podem ser aumentados em dois segundos, pelo que o Generative Extend só é realmente adequado para pequenos ajustes – contudo, pode substituir a necessidade de refazer as filmagens para corrigir pequenos problemas. Os vídeos aumentados podem ser gerados a 720 ou 1080p, ambos a 24 fps. Esta ferramenta também pode ser usada com áudio para ajudar a suavizar as edições, embora com limitações: consegue aumentar o tempo de efeitos sonoros e som ambiente até dez segundos, mas não é capaz de gerar diálogos ou música.
Criar vídeo a partir de texto ou de fotos
As ferramentas Text-to-Video e Image-to-Video, anunciadas pela primeira vez em Setembro, foram agora disponibilizadas na Web, através da aplicação Firefly. A primeira funciona de forma semelhante a outros geradores de vídeo como o Runway ou o Sora, da OpenAI: os utilizadores só precisam de escrever uma descrição em texto do que querem gerar. Este recurso pode emular uma variedade de estilos, como um filme “real” normal, animação 3D e stop motion; depois, os clips gerados podem ser ainda mais refinados ao usar uma selecção de ‘controlos de câmara’ que simulam técnicas de filmagem como ângulos, movimento e distância.
Já o Image-to-Video vai um passo mais além e permite adicionar uma imagem de referência ao lado de um prompt de texto para dar mais controlo sobre os resultados. A Adobe sugere que isto pode ser usado para fazer b-roll a partir de imagens e fotografias, ou ajudar a visualizar novas filmagens, carregando uma imagem estática de um vídeo existente.
Mas ainda não …
Apesar de serem tecnologias impressionantes, tão cedo não será possível fazer filmes inteiros com recurso a estas ferramentas. A duração máxima dos vídeos gerados a partir da Text-to-Video e da Image-to-Video é, actualmente, de cinco segundos, e a qualidade máxima é de 720p a 24 fps. Ambas demoram cerca de noventa segundos a gerar um clip, mas a Adobe promete que irá actualizar o software para reduzir o tempo de renderização.
Por mais restritas que sejam, a Adobe diz que as ferramentas alimentadas pelo seu modelo de IA para vídeo são «comercialmente seguras», uma vez que são treinadas em conteúdo que a marca teve permissão para usar. Desta forma, a viabilidade comercial dos vídeos criados através das ferramentas da Adobe pode ser um factor decisivo para angariar mais alguns utilizadores. Outra vantagem é que estes vídeos podem receber credenciais de conteúdo (CC) para deixar claro que foram criados através de IA, quando forem publicados online.