La nueva IA de Microsoft es capaz de replicar cualquier voz humana y los usuarios se preocupan por las consecuencias de esta tecnología

Un equipo de investigadores de Microsoft anunció una IA capaz de imitar cualquier voz humana con apenas unos segundos de muestra. Dicha tecnología, como señalan en Techspot, se basa en la herramienta EnCodec, un sistema de audio con el que Meta busca acabar con el reinado del MP3. Así, a través de un entrenamiento con 60.000 horas de voz de más de 7.000 hablantes, este grupo ha conseguido que la IA sea capaz de replicar a la perfección aspectos como el timbre o el tono emocional de un hablante. Y, para ello, apenas necesitan una muestra de audio de tres segundos.

Como señala la nota de Techspot, la mayoría de las muestras proceden de audiolibros de dominio público. Por ello, los investigadores de la Universidad de Cornell tuvieron acceso a un amplio registro tanto de audios como de hablantes, una situación que agilizó los procesos de investigación. Tal y como detallan, la Ia es capaz de replicar la “naturalidad del habla”, una razón a la que hay que sumar la “similitud con el hablante” que existe en cada una de las muestras. Por ello, señalan que puede “preservar la emoción del hablante”. Sin embargo, esta situación ha generado cierta inquietud por el posible uso indebido de la herramienta.

La IA puede dar lugar a falsificaciones, estafas y suplantación de la identidad

Como de costumbre, hay que analizar los aspectos positivos y los negativos. En el primer campo, lo cierto es que contar con una IA capaz de replicar las voces permite que sea posible escuchar a personas que ya han fallecido, una noticia alegre para muchos usuarios; sin embargo, entre los aspectos negativos se encuentran posibilidades como la suplantación de identidad, las posibles estafas tras solicitar datos personales haciéndote pasar por otra persona o las falsificaciones de testimonios.

Por ello, los investigadores de Microsoft han querido recalcar que están trabajando en un modelo de detección que identifica si “un clip ha sido sintetizado por Vall-E (el nombre de la IA)”. Así, utilizarán esto como base para seguir investigando con las posibilidades de la inteligencia artificial, una herramienta que también alerta a los actores de doblaje. Si consigue prosperar, y las compañías desean sacar partido de ello, es posible que puedan utilizarla como una alternativa barata al trabajo de estos profesionales.

Si quieres estar al tanto de otras noticias como esta y te gustaría comentarlas junto a otros miembros de la comunidad, únete al servidor de Discord de 3DJuegos para estar al día de todas nuestras novedades.

Imagen principal de Kelly Sikkema (Unsplash)

Ver todos los comentarios en https://www.3djuegos.com

VER 6 Comentarios

Portada de 3DJuegos

VÍDEO ESPECIAL

4.461 visualizaciones

20 MEJORES PELICULAS VIDEOJUEGOS

El cine y los videojuegos, los videojuegos y el cine: qué relación tan estrecha. Existen muchos, muchíiiisimos videojuegos basados en películas, pero también pasa al contrario. Vemos varios ejemplos.