Probamos una Inteligencia Artificial que separa una cancion POR PISTAS (alucinante!)
A ver, hoy vamos a hablar de una cosa muy loca.
Hay una inteligencia artificial que es capaz de separar una canción por pistas
Y creo que vamos a ser capaces de utilizarla
Osea es una inteligencia artificial que tu le metes el mp3 de la canción ya grabada con todo mezclado
y lo separa en bajo, batería guitarra, voz...
Osea esto es lo que decían de que una tecnología lo suficientemente avanzada sería indistinguible de la magia
Para mí esto es magia
Yo he llegado aquí por este tuit de Alexandre Défossez
Y dice que básicamente ha introducido la arquitectura Demucs
Adaptando el Conv-Tasnet
Lo cual hace que sea un método mejor que el Wave-U-Net, Open-Umix o el Spleeter
No sé que quiere decir nada de esto, vale
Pero sí sé que tiene un link que te lleva un repositorio de Git Hub
Aquí te viene cómo lo han hecho con un montón de terminología que no aspiro a comprender
Y vienen unas maravillosas instrucciones
Vamos a aplicarlas
Voy a descargarme el repositorio
Voy a descargarme un software que se llama anaconda
(Musica) By anaconda don't
Y ahora vamos a escribir este comando en terminal
(Música)
Vale, ahora vamos a escribir el comando que nos dice
Phyton 3, guión eme demux. separate...
No sé que significa nada de esto, vale, yo solo estoy siguindo las instrucciones que me dicen.
Después de mucho pensarlo, creo que la canción con la que deberíamos probarlo es...
(Música) "Video killed the radio star"
¡Es nuestro querido Hans Zimmer cuando era teclista de grupos New Wave!
Cuanto han cambiado las cosas, Hans
La canción "Video killed the radio star" habla de como la televisión revolucionó la industria de la música
Así que es perfecta para ser la primera prueba que hagamos con una inteligencia artificial
que seguramente revolucione muchas cosas en el mundo de la música
Entonces metemos la canción, le damos a enter y que sea lo que Dios quiera...
No sé cuánto puede tardar esto, osea puede que tarde... 4 horas
100%. Ah.
Me ha hecho 4 pistas: Bajo, batería otros y vocales.
(Música) Video killed the radio star...
¡Ha funcionado!
Esa es la voz. Vale ahora a ver el bajo...
(Sonido de bajo con unas pocas impurezas)
¡Esto te sirve para sacarte los bajos de las canciones!
¡Esto te sirve para practicar!
(Sigue sonando el bajo) (Risas)
¡Pero esto es una locura!
¡El trabajo de la gente que tiene que sacarse canciones
y arreglarlas y hacerse partituras se acaba de volver 1000 veces más fácil!
Esta es la batería
(Sonido de batería con impurezas)
El bombo lo ha cogido muy bien
(Sonido de batería con impurezas)
Luego hay un sonido ahí arriba que se le está haciendo un poco bola.
Lo voy a comprar; no es una pasada pero lo voy a comprar
Y en other
(Voz, guitarras, impurezas)
Pues las guitarras, los coros...
("Video killed the radio star" con impurezas)
¡Esto es una locura!
(Voz masculina) (Impurezas)
Se le cuela parte de la voz
Donde en la pista de voz dejabamos de oír la voz es porque la había metido en others porque se le ha hecho bola
Voy a meter estas 4 pistas en logic
¡Mira, Mira Esto es lo que ha hecho la puñetera inteligencia artificial!
Este es el bombo
Este es el bajo, esto es others y esto es la voz!
Esto es magia, esto a mí me habría dado la vida cuando yo era estudiante
Esto me va a dar a mí la vida para los videos
¡Dios, esto es una locura!
Imaginate cuando hagan esto para una sinfonía
con todos los instrumentos imaginate cuando hagan esto, ¡Esto es increíble!
Ya es habitual samplear canciones, ya es habitual trabajar con referencias
Pero esto es el puñetero "Next level"
Esto es que de pronto, te digo: Yo quiero la batería que usa Imagine Dragons en esta canción
Y quiero La-Batería que usa Imagine Dragons en esta canción, esa
Y la I.A. me la saca, me la pone en mi canción y que significa esto para el futuro de los remixes
Y para el futuro de la música electrónica, y para el futuro de todo
O para practicar
Osea, tu imaginate que coges, lo separas todo por pistas
Y luego quitas la batería
y luego te pones a ensayar la batería de la canción
y la tienes, in batería
Osea, necesito muy fuerte probar esto con varias canciones
Vamos a probar "Malamente" de Rosalía
(Música) Malamente... ¡sí, sí!
Que tiene que si palmas, que si efectos de sonido, a ver si se le hace bola a la I.A.
A ver, entonces ponemos el mismo código de antes y ponemos Malamente
Vale, vamos a ver que ha hecho con malamente, vamos a ver que ha hecho con el bajo
(Sonido muy grave) (Que para nada suena a bajo)
No sé si lo oís, es como un subgrave profundísimo de las tinieblas
A ver que ha hecho con la percusión
(Bombo grave y palmas flamencas)
(Palmas de Jaime)
¡Lo ha hecho muy bien!, Aver que ha hecho con la voz
(Voz de rosalía con muy pocas impurezas y unas pocas palmas)
Y luego en other
(Sintetizador y unas pocas palmas)
El sinte
(Sintetizador, un poco de voz y unas pocas palmas)
Hay un poco de sangrado de las voces, osea no es perfecto, no es pulcro
Pero te quiero decir que esto acaba de empezar a existir, estas I.A.'s
De aquí solo va para arriba, esto es una realidad
Había un tío que comentaba en tuiter:
Esto podría significar que tú estás en un directo, viendo a alguien en concierto
Con unos cascos especiales que a tiempo real te hacen esto
Y la mezcla que han hecho los técnicos para el concierto no es la que tu escuchas
Porque dices, separame a tiempo real la batería y bajala un poco porque se han venido muy arriba
Esta tecnología da miedo en el mejor sentido de las cosas que dan miedo
Bueno, antes de continuar haciendo ejemplos de esta fantasía
Vamos a pedirle a Carlos de Dot CSV, el canal de inteligencia artficial
que está pasando, como funciona esto y que nos ubique un poco
Carlos, explicanos como todas estas inteligencias artificiales nos van dejar sin trabajo
A este tipo de problema se le conoce como separación ciega de fuentes
dentro de este campo el problema más característico es el que se conoce como "Cocktail party effect"
Claro, en este caso estamos hablando de "Music source separation"
donde lo que estamos haciendo es separar una canción en sus diferentes componentes, sus diferentes pistas de audio
En este caso, de los 2 modelos que se proponen en el paper
Demux, funciona con un tipo muy especial de red neuronal que se llama U-Net
Este tipo de redes funciona a grandes rasgos tomando los datos de entrada, en nuestro caso va a ser una canción
Y comprimiéndolas y codificándolas para después decodificarlas de la manera que nosotros queramos
Y será a partir de suministrarle muchos ejemplos de entrada y de salida
Que la red irá aprendiendo a discriminar los diferentes sonidos de la canción
Que normalmente este tipo de redes suelen ser aplicadas en problemas con imágenes
Donde buscamos por ejemplo separar los distintos elementos que aparecen en ella
solo que en este caso aplicándolo sobre audio.
Un archivo de onda de audio no es exactamente lo mismo que una imagen
En el sentido de que aquí tenemos una dimensión temporal muy importante a tener en cuenta
Y es por eso que a la arquitectura de esta red también se le ha añadido otro módulo
Que es especialista en modelar este tipo de datos temporales
Y ahora sí, este es el diseño de la red neuronal que tras entrenarse
es capaz de separar tus canciones en diferentes pistas de audio.
(Susurros sobre la fiesta)
(Sonido de carta de ajustes)
Y así es, gracias Carlos por la explicación
Vale para enseñaros fragmentos más largos y ver realmente lo que puede hacer esta I.A.
vamos a hacerlo con música de epidemic sound para que no nos salte el copyright
Me gustaría probar Reggaeton, a ver si es capaz de coger un beat de Reggaeton
Vale, me he bajado este reggaeton de epidemic sound
(Música reggaeton)
Tiene el beat de reggaeton fundamental
El pum, pa tum, pa tum...
Como en epidemic puedes bajarte las canciones por pistas vamos a que la I.A.
y vamos a comprobar cuanto se parecen a las pistas originales que forman la canción
Vale lo metemos, se pone a convertirlo
Este es el bajo original
(Bajo sintetizado grave)
Y este es el bajo que nos ha sacado la I.A.
(Bajo parecido con impurezas)
A ver, not bad, not bad
Desde luego las notas estan ahí, las notas que da el bajo están ahí
Si eres arreglista te sirve para sacarte el bajo de oído mucho más fácil que sin separarlo
Luego estas 2 serían la instrumental original
(Acordeón y guitarra)
Esto es lo que nos ha sacado la I.A.
(Acordeón y guitarra con impurezas)
Algo las ha separado pero se le ha colado mucha voz dentro
(Acordeón y guitarra con impurezas)
Y luego la letra
(Voces con un poco de sangrado de la percusión)
Esto sirve muy bien para entender la letra de algunas canciones que con la mezcla no te enteras bien de lo que dicen
Así que oye, esto a los de genius lyrics les viene de p
Esto es la percusión original
(Beat de reggaeton muy claro)
Y esto es la percusión que nos ha separado la I.A.
(Percusión casi igual a la original)
(Risas de Jime)
(Percusión casi igual a la original)
O my God, el puñetero beat de reggaeton entero
Entero y perfecto
(Percusión casi igual a la original)
Osea esto es una pasada
Esto está para que yo ahora casi cojo esto, me lo pongo en mi canción
y puedo ponerle los instrumentos que quiera por encima y puedo tocar otra cosa
(Jaime tocando un sinte con la pista de la I.A.)
Puedo hacer mi propia canción sobre esta base de reggaeton
Un ejercicio que haces en producción musical es intentar imitar canciones
Intentas decir: Mira creo que ahí al fondo se oye un pad no se como ecualizado no se cuantos
Intentas imitarlo, esto ya lo hace solo
Tu podrías separarte la canción que quieras imitar por pistas y podrías ir imitando cada pista y ya está
Esque es increíble, de aquí para arriba, esque el siglo XXI, yo no quiero estar en el siglo XXII
Yo estoy muy agusto en el siglo XXI
Es un siglo en el que todavía te puedes maravillar con esto porque no the ha cambiado la vida
Solamente estás viendo la que se les viene encima a los del siglo XXII
Entonces en el XXI está muy bien verlo desde lejos y decir: Madre mía la que se viene
de falsificación de vídeo, de audio
Había un tío que decía que vivíamos en la era en la que las cosas que oyes grabadas puedes confiar mas o menos que son reales Antes no existían cosas grabadas y a partir de ahora no vas a poder confiar en las cosas grabadas
No sé si habéis visto todas las I.A.'s que imitan caras, de presidentes, de famosos
Que crean imágenes de personas que nunca han existido
mezclando facetas de personas reales como si fuera una especie de Frankenstein
Osea lo impresionante es que esto no lo hayan hecho ordenadores de la CIA, sabes
Que lo estoy haciendo yo, en mi portátil, porque el modelo está disponible para que lo use cualquiera
El reggaeton que hemos usado hoy y en general la música que uso en todos mis videos es de
-EPIDEMIC SOUND-
Eepidemic es un servicio de suscripción mensual en el que por 13 € al mes
tu puedes usar toda su librería musical de todos los géneros y estilos que tienen que son cientos en
en los videos que subas a redes sociales
y las tienes ya separadas por pistas
Como lo que te hace la IA pero te viene ya hecho
y es música muy buena que le da un salto de calidad a tus vídeos
sin que les salte ningún detector de copyright y sin que tengas ningún problema legal
y tú puedes monetizar tu contenido y hacer lo que quieras con él
Y si luego deshaces tu suscripción, no pasa nada, esa música que le has puesto a tus vídeos se queda ahí sin ningún problema
Como ya sabéis, en mis vídeos no podría poner música de fondo si no fuera por epidemic sound
así que he hecho un álbum dentro de su plataforma que se llama "La banda sonora de Jaime Altozano"
Y ahí he puesto 15 canciones que son de mis preferidas, canciones como esta:
(Música)
O esta
(Música)
O esta
(Música)
canciones que habeis oido decenas de veces en mis vídeos y que ahora podeis encontrar en Epidemic Sound junto a una lista infinita de canciones
Que podéis usar en vuestros vídeos simplemente pagando la suscripción mensual
-PRIMER MES GRATIS- con el link en la descripción
Así que nada, se nos vienen unos años muy interesantes
en los que de pronto hay aplicaciones de la inteligencia artificial en el mundo de la música que puedes ejecutar desde tu portátil
Cada vez va a haber más, cada vez van a ser más sorprendentes y cada vez van a dar más miedo y hablaremos de todas ellas aquí
Espero que este vídeo os haya dado un pequeño escalofrío vital, que por lo menos a mí me lo ha dado
Para bien y para mal y nos vemos la semana que viene.
Hasta pronto.
-Subtitulado por Divercoop. Oficial-
-Gracias por ver el vídeo-