La nueva IA de Microsoft es capaz de replicar cualquier voz humana y los usuarios se preocupan por las consecuencias de esta tecnología

Audio Ia
6 comentarios Facebook Twitter Flipboard E-mail

Un equipo de investigadores de Microsoft anunció una IA capaz de imitar cualquier voz humana con apenas unos segundos de muestra. Dicha tecnología, como señalan en Techspot, se basa en la herramienta EnCodec, un sistema de audio con el que Meta busca acabar con el reinado del MP3. Así, a través de un entrenamiento con 60.000 horas de voz de más de 7.000 hablantes, este grupo ha conseguido que la IA sea capaz de replicar a la perfección aspectos como el timbre o el tono emocional de un hablante. Y, para ello, apenas necesitan una muestra de audio de tres segundos.

Como señala la nota de Techspot, la mayoría de las muestras proceden de audiolibros de dominio público. Por ello, los investigadores de la Universidad de Cornell tuvieron acceso a un amplio registro tanto de audios como de hablantes, una situación que agilizó los procesos de investigación. Tal y como detallan, la Ia es capaz de replicar la “naturalidad del habla”, una razón a la que hay que sumar la “similitud con el hablante” que existe en cada una de las muestras. Por ello, señalan que puede “preservar la emoción del hablante”. Sin embargo, esta situación ha generado cierta inquietud por el posible uso indebido de la herramienta.

La IA puede dar lugar a falsificaciones, estafas y suplantación de la identidad

Como de costumbre, hay que analizar los aspectos positivos y los negativos. En el primer campo, lo cierto es que contar con una IA capaz de replicar las voces permite que sea posible escuchar a personas que ya han fallecido, una noticia alegre para muchos usuarios; sin embargo, entre los aspectos negativos se encuentran posibilidades como la suplantación de identidad, las posibles estafas tras solicitar datos personales haciéndote pasar por otra persona o las falsificaciones de testimonios.

Por ello, los investigadores de Microsoft han querido recalcar que están trabajando en un modelo de detección que identifica si “un clip ha sido sintetizado por Vall-E (el nombre de la IA)”. Así, utilizarán esto como base para seguir investigando con las posibilidades de la inteligencia artificial, una herramienta que también alerta a los actores de doblaje. Si consigue prosperar, y las compañías desean sacar partido de ello, es posible que puedan utilizarla como una alternativa barata al trabajo de estos profesionales.

Si quieres estar al tanto de otras noticias como esta y te gustaría comentarlas junto a otros miembros de la comunidad, únete al servidor de Discord de 3DJuegos para estar al día de todas nuestras novedades.

Imagen principal de Kelly Sikkema (Unsplash)

Comentarios cerrados
VÍDEO ESPECIAL

12.876 visualizaciones

100 DETALLES OCULTOS de RED DEAD REDEMPTION 2

¿Qué detalles ocultos guarda Red Dead Redemption 2? En el video de hoy os presentamos más de 100 curiosidades distintas acerca de la aventura de Arthur Morgan y de John Marston que nos presentó Rockstar Games en 2018.