Imágenes generadas por Google Vlogger

Google revoluciona la IA con una nueva herramienta que da vida a las fotos

Con solo un audio y una fotografía cualquiera podrá crear humanos falsos que interactuen por Internet

Google ha lanzado una nueva tecnología que revolucionará el mundo. Los investigadores de la compañía han desarrollado un nuevo modelo de inteligencia artificial que puede transformar una única imagen fija de una persona en un avatar que habla y se mueve. Se llama Vlogger y sus resultados sorprendentemente realistas nos abocan a una distopía que podría cambiar la forma de relacionarnos. 

En un documento técnico, el equipo de Google describe a Vlogger como un "marco novedoso para sintetizar humanos a partir de audio", y agrega que "es precisamente la automatización y el realismo conductual lo que buscamos en este trabajo... una interfaz multimodal para un agente conversacional encarnado". Este "agente", continúan, está en última instancia "diseñado para respaldar conversaciones naturales con un usuario humano".

Entonces, en otras palabras, el objetivo de estos investigadores es crear personas falsas de apariencia realista que interactúen de una manera "humana" con seres humanos reales en el otro extremo.

En el artículo, los investigadores proponen que este modelo, que requiere sólo una imagen y un clip de audio deseado como entradas, podría usarse para "mejorar la comunicación en línea, la educación o los asistentes virtuales personalizados". Vlogger también puede editar vídeos en movimiento, lo que, según los investigadores, "facilitará los procesos creativos".

Sin embargo, no mencionan que una herramienta que podría generar videoclips completamente sintéticos, en movimiento y hablando a partir de una sola imagen, parece propicia para el abuso por parte de malos actores.

De hecho, son los avances que Google afirma haber realizado en su creación de Vlogger los que lo hacen tan hipotéticamente peligroso.

Los deepfakes de IA, por ejemplo, ya son un problema creciente. Pero si bien generar un deepfake es más fácil que nunca debido a la disponibilidad pública de herramientas de IA generativa, crear un video deepfake particularmente convincente generalmente requiere una combinación de múltiples herramientas de IA. Pero cuando se utiliza el modelo Vlogger, los usuarios solo deben proporcionar el audio deseado para el video y una foto, lo que probablemente agilizaría el proceso en general.

Es más, según Google, Vlogger "no requiere formación para cada persona" que anima su tecnología. En pocas palabras, eso significa que Vlogger no requiere entrenamiento específico para las personas que lo usen, lo que permitiría fabricar un video falso realista a partir de una sola imagen de casi cualquier persona, incluidas personas comunes y corrientes que no están en el ojo público. ¿Qué puede salir mal?