Ana Ryu/Visual China Group/Getty Images
Uma placa da Microsoft é vista na sede da empresa em 19 de março de 2023 em Seattle, Washington.
Nova Iorque
CNN
–
A Mona Lisa agora pode fazer mais do que apenas sorrir, graças à nova tecnologia de IA da Microsoft.
Na semana passada, os pesquisadores da Microsoft detalharam um novo modelo de IA que desenvolveram que pode capturar uma imagem estática de um rosto e um clipe de áudio de alguém falando e criar automaticamente um vídeo realista dessa pessoa falando. Os vídeos – que podem ser criados a partir de rostos reais, bem como caricaturas ou obras de arte – são completos com sincronizações labiais convincentes e movimentos faciais e de cabeça naturais.
Em um vídeo experimental, os pesquisadores mostraram como animaram a Mona Lisa para recitar uma canção rap cômica da atriz Anne Hathaway.
As saídas do modelo de IA são chamadas Vasa-1, divertidos e um tanto contraditórios em sua realidade. A Microsoft disse que a tecnologia poderia ser usada para educação, “melhorando a acessibilidade para indivíduos com desafios de comunicação”, ou talvez para criar companheiros virtuais para humanos. Mas também é fácil ver como a ferramenta pode ser abusada e usada para se passar por pessoas reais.
É uma preocupação que vai além da Microsoft: à medida que surgem mais ferramentas para criar imagens, vídeos e clipes de áudio atraentes gerados por IA, Especialistas estão preocupados E a sua utilização indevida pode levar a novas formas de desinformação. Alguns também temem que a tecnologia possa perturbar ainda mais as indústrias criativas, desde filmes até publicidade.
Neste momento, a Microsoft disse que não planeja lançar o modelo VASA-1 ao público imediatamente. A mudança é semelhante à forma como o parceiro da Microsoft, OpenAI, aborda as preocupações circundantes Ferramenta de vídeo gerada por inteligência artificialSora: OpenAI provocou Sora em fevereiro, mas até agora só o disponibilizou para alguns usuários profissionais e professores de segurança cibernética para fins de teste.
“Nos opomos a qualquer comportamento para criar conteúdo enganoso ou prejudicial a pessoas reais”, disseram pesquisadores da Microsoft em um blog. Mas acrescentaram que a empresa “não tem planos de lançar” o produto publicamente “até garantirmos que a tecnologia seja usada de forma responsável e de acordo com os regulamentos apropriados”.
Os pesquisadores disseram que o novo modelo de IA da Microsoft foi treinado em vários vídeos de rostos de pessoas enquanto falavam e foi projetado para reconhecer movimentos faciais e de cabeça naturais, incluindo “movimento dos lábios, expressão (não labial), olhar fixo e piscar, entre outros”. ” outras coisas”. O resultado é um vídeo mais realista quando o VASA-1 movimenta uma imagem estática.
Por exemplo, em um vídeo de teste com um clipe de alguém parecendo agitado, aparentemente enquanto jogava videogame, o rosto falante tinha sobrancelhas franzidas e lábios franzidos.
A ferramenta de IA também pode ser direcionada para produzir um vídeo onde o sujeito olha em uma determinada direção ou expressa uma determinada emoção.
Olhando de perto, ainda há sinais de que os vídeos são gerados por máquina, como piscar de olhos pouco frequentes e movimentos exagerados das sobrancelhas. Mas a Microsoft disse acreditar que seu modelo “supera significativamente” outras ferramentas semelhantes e “abre caminho para interações em tempo real com avatares realistas que imitam comportamentos de conversação humanos”.
More Stories
O próximo mini drone 4K da DJI cabe na palma da sua mão
Vazamentos revelam o nome e design do suposto dispositivo PS5 Pro
Os jogadores reclamam do longo tempo de matchmaking no PS5 conforme os números do Concord caem