The Finals, o FPS multijogador destrutível e lucrativo de ex-desenvolvedores de Battlefield, está atualmente no meio de uma versão beta aberta que permite a qualquer um dar uma olhada em sua jogabilidade esmagadora, esmagadora e lucrativa. Você também poderá ouvir – e poderá notar algo um pouco estranho nos locutores do game show no jogo. É isso mesmo: são vozes geradas por IA, não atores humanos.
Andreas Almstrom, designer de som do Embark Studios, confirmou a decisão de usar a tecnologia de IA de conversão de texto em fala em um episódio de podcast sobre a produção de The Finals em julho, que foi Recentemente descoberto por Gianni Matragrano. Matragrano também é ator de videogame, tendo aparecido em Genshin Impact, Evil West, Trepang2 e muito mais.
“Então, aqui está a grande questão: o que as dublagens fizeram?” Almstrom respondeu quando o apresentador do podcast perguntou quem fez as dublagens nas finais. “A questão é que usamos IA com algumas exceções.”
“Todos os sons do piloto, como latidos, e ambos os nossos comentaristas usam conversão de texto em fala baseada em IA”, explicou Almstrom, com “coisas que chamamos de vocalizações” – incluindo os rosnados e grunhidos que os personagens dos jogadores fazem quando correm , pule e pule. Jumping – apresentado pelos desenvolvedores do Embark. Não é por falta de tentativa: “Ainda não conseguimos fazer com que a IA execute esse tipo de tarefas”, disse Almstrom.
Gerenciar configurações de cookies
Almstrom afirmou que a decisão de usar vozes geradas por IA se resumia à capacidade da tecnologia de fornecer vozes próximas o suficiente das vozes humanas, ao mesmo tempo em que era capaz de gerá-las em um tempo relativamente curto em comparação com atores humanos na cabine.
“A razão pela qual seguimos esse caminho é porque a conversão de texto em voz por IA está finalmente se tornando muito poderosa”, disse Almstrom. “Isso nos leva longe o suficiente em termos de qualidade e nos permite ser muito reativos a novas ideias e manter as coisas realmente atualizadas.”
O objetivo de chegar “longe o suficiente” pode ser ouvido com bastante clareza em um clipe dos locutores das finais compartilhado por Matragrano, com uma ênfase visivelmente estranha em certas palavras e um estranho fluxo de frases – ouça “A equipe que arrecada dinheiro suficiente primeiro” vitórias” a partir de 0:08 No clipe abaixo, onde a falta de pausa nas “primeiras vitórias” é quase mesclada em uma palavra: Heroísmo irreal, este não é.
“Se parece um pouco estranho, ainda combina bem esteticamente com a fantasia de um game show virtual”, acrescentou Almstrom no podcast, aparentemente evitando críticas ao estranho desempenho de voz da IA. Pessoalmente, não estou convencido – não parece uma emissora virtual futurística, apenas um programa de conversão de texto em fala que não sabe lidar com palavras simples como um ser humano normal faz, muito menos um ator profissional.
Então acho que as finais serão disputadas com vozes de IA…? pic.twitter.com/PIAbR43ZrT
-Gianni Matragrano (@GetGianni) 28 de outubro de 2023
Gerenciar configurações de cookies
Matragrano contestou as afirmações de Almstrom de que leva “meses” para gravar uma narração para um novo modo de jogo criado por um designer – algo que Almstrom disse que levou “horas” com IA – em resposta, os atores humanos estão acostumados a gravar sessões de alta qualidade em um curto espaço de tempo. período de tempo. Um dia ou dois.
Claro, isso sem mencionar as preocupações éticas óbvias em torno do processo de geração de inteligência artificial e de sua utilização no lugar de atores pagos – algo que tem sido um ponto importante nas recentes greves do SAG-AFTRA, com o sindicato expressando preocupação com as réplicas digitais de atores sendo usados sem consentimento informado ou pagamento apropriado.
“Você pode literalmente conseguir um VO profissional por menos do que o total geral, fazer algumas sessões de gravação e terá todo o áudio que precisa”, disse Matragrano. “Na verdade, tornamos tudo muito fácil. Então, ficará bem e não será algo que mesmo os jogadores que não se importam com a ética da IA continuem reclamando.
Em outro caso recente de uso de IA em um videogame, a CD Projekt Red usou a tecnologia para recriar a voz do falecido ator polonês Miłogost Reczek – cortesia da família do ator – para o reaparecimento do ripperdoc de Cyberpunk 2077, Viktor Vektor, no filme deste ano. expansão Fantasma Liberdade. Em outro lugar, God of War Ragnarok usou uma técnica semelhante para registrar a idade do diálogo gravado pelo ator de Atreus, Sunny Suljic, para combinar com seu sotaque pré-púbere.
Recriar a voz de um ator falecido – mesmo com sua permissão – e converter diálogos originalmente executados por um humano ainda soa muito diferente de substituir atores humanos inteiros em seu jogo, mas é uma situação que Almstrom pelo menos espera que se torne mais comum.
“Estamos realmente nos aproximando de um novo amanhecer quando se trata de sons de videogame”, disse o designer de som.
Não importa o que você pense sobre as vozes da IA nas Finais, de uma forma ou de outra, para melhor ou para pior, é sem dúvida verdade.
“Viciado em zumbis amigo dos hipsters. Aspirante a solucionador de problemas. Entusiasta de viagens incuráveis. Aficionado por mídia social. Introvertido.”
More Stories
O próximo mini drone 4K da DJI cabe na palma da sua mão
Vazamentos revelam o nome e design do suposto dispositivo PS5 Pro
Os jogadores reclamam do longo tempo de matchmaking no PS5 conforme os números do Concord caem