Jaime Altozano, Probamos una Inteligencia Artificial que separa una cancion POR PISTAS (alucinante!)

Probamos una Inteligencia Artificial que separa una cancion POR PISTAS (alucinante!)

A ver, hoy vamos a hablar de una cosa muy loca.

Hay una inteligencia artificial que es capaz de separar una canción por pistas

Y creo que vamos a ser capaces de utilizarla

Osea es una inteligencia artificial que tu le metes el mp3 de la canción ya grabada con todo mezclado

y lo separa en bajo, batería guitarra, voz...

Osea esto es lo que decían de que una tecnología lo suficientemente avanzada sería indistinguible de la magia

Para mí esto es magia

Yo he llegado aquí por este tuit de Alexandre Défossez

Y dice que básicamente ha introducido la arquitectura Demucs

Adaptando el Conv-Tasnet

Lo cual hace que sea un método mejor que el Wave-U-Net, Open-Umix o el Spleeter

No sé que quiere decir nada de esto, vale

Pero sí sé que tiene un link que te lleva un repositorio de Git Hub

Aquí te viene cómo lo han hecho con un montón de terminología que no aspiro a comprender

Y vienen unas maravillosas instrucciones

Vamos a aplicarlas

Voy a descargarme el repositorio

Voy a descargarme un software que se llama anaconda

(Musica) By anaconda don't

Y ahora vamos a escribir este comando en terminal

(Música)

Vale, ahora vamos a escribir el comando que nos dice

Phyton 3, guión eme demux. separate...

No sé que significa nada de esto, vale, yo solo estoy siguindo las instrucciones que me dicen.

Después de mucho pensarlo, creo que la canción con la que deberíamos probarlo es...

(Música) "Video killed the radio star"

¡Es nuestro querido Hans Zimmer cuando era teclista de grupos New Wave!

Cuanto han cambiado las cosas, Hans

La canción "Video killed the radio star" habla de como la televisión revolucionó la industria de la música

Así que es perfecta para ser la primera prueba que hagamos con una inteligencia artificial

que seguramente revolucione muchas cosas en el mundo de la música

Entonces metemos la canción, le damos a enter y que sea lo que Dios quiera...

No sé cuánto puede tardar esto, osea puede que tarde... 4 horas

100%. Ah.

Me ha hecho 4 pistas: Bajo, batería otros y vocales.

(Música) Video killed the radio star...

¡Ha funcionado!

Esa es la voz. Vale ahora a ver el bajo...

(Sonido de bajo con unas pocas impurezas)

¡Esto te sirve para sacarte los bajos de las canciones!

¡Esto te sirve para practicar!

(Sigue sonando el bajo) (Risas)

¡Pero esto es una locura!

¡El trabajo de la gente que tiene que sacarse canciones

y arreglarlas y hacerse partituras se acaba de volver 1000 veces más fácil!

Esta es la batería

(Sonido de batería con impurezas)

El bombo lo ha cogido muy bien

(Sonido de batería con impurezas)

Luego hay un sonido ahí arriba que se le está haciendo un poco bola.

Lo voy a comprar; no es una pasada pero lo voy a comprar

Y en other

(Voz, guitarras, impurezas)

Pues las guitarras, los coros...

("Video killed the radio star" con impurezas)

¡Esto es una locura!

(Voz masculina) (Impurezas)

Se le cuela parte de la voz

Donde en la pista de voz dejabamos de oír la voz es porque la había metido en others porque se le ha hecho bola

Voy a meter estas 4 pistas en logic

¡Mira, Mira Esto es lo que ha hecho la puñetera inteligencia artificial!

Este es el bombo

Este es el bajo, esto es others y esto es la voz!

Esto es magia, esto a mí me habría dado la vida cuando yo era estudiante

Esto me va a dar a mí la vida para los videos

¡Dios, esto es una locura!

Imaginate cuando hagan esto para una sinfonía

con todos los instrumentos imaginate cuando hagan esto, ¡Esto es increíble!

Ya es habitual samplear canciones, ya es habitual trabajar con referencias

Pero esto es el puñetero "Next level"

Esto es que de pronto, te digo: Yo quiero la batería que usa Imagine Dragons en esta canción

Y quiero La-Batería que usa Imagine Dragons en esta canción, esa

Y la I.A. me la saca, me la pone en mi canción y que significa esto para el futuro de los remixes

Y para el futuro de la música electrónica, y para el futuro de todo

O para practicar

Osea, tu imaginate que coges, lo separas todo por pistas

Y luego quitas la batería

y luego te pones a ensayar la batería de la canción

y la tienes, in batería

Osea, necesito muy fuerte probar esto con varias canciones

Vamos a probar "Malamente" de Rosalía

(Música) Malamente... ¡sí, sí!

Que tiene que si palmas, que si efectos de sonido, a ver si se le hace bola a la I.A.

A ver, entonces ponemos el mismo código de antes y ponemos Malamente

Vale, vamos a ver que ha hecho con malamente, vamos a ver que ha hecho con el bajo

(Sonido muy grave) (Que para nada suena a bajo)

No sé si lo oís, es como un subgrave profundísimo de las tinieblas

A ver que ha hecho con la percusión

(Bombo grave y palmas flamencas)

(Palmas de Jaime)

¡Lo ha hecho muy bien!, Aver que ha hecho con la voz

(Voz de rosalía con muy pocas impurezas y unas pocas palmas)

Y luego en other

(Sintetizador y unas pocas palmas)

El sinte

(Sintetizador, un poco de voz y unas pocas palmas)

Hay un poco de sangrado de las voces, osea no es perfecto, no es pulcro

Pero te quiero decir que esto acaba de empezar a existir, estas I.A.'s

De aquí solo va para arriba, esto es una realidad

Había un tío que comentaba en tuiter:

Esto podría significar que tú estás en un directo, viendo a alguien en concierto

Con unos cascos especiales que a tiempo real te hacen esto

Y la mezcla que han hecho los técnicos para el concierto no es la que tu escuchas

Porque dices, separame a tiempo real la batería y bajala un poco porque se han venido muy arriba

Esta tecnología da miedo en el mejor sentido de las cosas que dan miedo

Bueno, antes de continuar haciendo ejemplos de esta fantasía

Vamos a pedirle a Carlos de Dot CSV, el canal de inteligencia artficial

que está pasando, como funciona esto y que nos ubique un poco

Carlos, explicanos como todas estas inteligencias artificiales nos van dejar sin trabajo

A este tipo de problema se le conoce como separación ciega de fuentes

dentro de este campo el problema más característico es el que se conoce como "Cocktail party effect"

Claro, en este caso estamos hablando de "Music source separation"

donde lo que estamos haciendo es separar una canción en sus diferentes componentes, sus diferentes pistas de audio

En este caso, de los 2 modelos que se proponen en el paper

Demux, funciona con un tipo muy especial de red neuronal que se llama U-Net

Este tipo de redes funciona a grandes rasgos tomando los datos de entrada, en nuestro caso va a ser una canción

Y comprimiéndolas y codificándolas para después decodificarlas de la manera que nosotros queramos

Y será a partir de suministrarle muchos ejemplos de entrada y de salida

Que la red irá aprendiendo a discriminar los diferentes sonidos de la canción

Que normalmente este tipo de redes suelen ser aplicadas en problemas con imágenes

Donde buscamos por ejemplo separar los distintos elementos que aparecen en ella

solo que en este caso aplicándolo sobre audio.

Un archivo de onda de audio no es exactamente lo mismo que una imagen

En el sentido de que aquí tenemos una dimensión temporal muy importante a tener en cuenta

Y es por eso que a la arquitectura de esta red también se le ha añadido otro módulo

Que es especialista en modelar este tipo de datos temporales

Y ahora sí, este es el diseño de la red neuronal que tras entrenarse

es capaz de separar tus canciones en diferentes pistas de audio.

(Susurros sobre la fiesta)

(Sonido de carta de ajustes)

Y así es, gracias Carlos por la explicación

Vale para enseñaros fragmentos más largos y ver realmente lo que puede hacer esta I.A.

vamos a hacerlo con música de epidemic sound para que no nos salte el copyright

Me gustaría probar Reggaeton, a ver si es capaz de coger un beat de Reggaeton

Vale, me he bajado este reggaeton de epidemic sound

(Música reggaeton)

Tiene el beat de reggaeton fundamental

El pum, pa tum, pa tum...

Como en epidemic puedes bajarte las canciones por pistas vamos a que la I.A.

y vamos a comprobar cuanto se parecen a las pistas originales que forman la canción

Vale lo metemos, se pone a convertirlo

Este es el bajo original

(Bajo sintetizado grave)

Y este es el bajo que nos ha sacado la I.A.

(Bajo parecido con impurezas)

A ver, not bad, not bad

Desde luego las notas estan ahí, las notas que da el bajo están ahí

Si eres arreglista te sirve para sacarte el bajo de oído mucho más fácil que sin separarlo

Luego estas 2 serían la instrumental original

(Acordeón y guitarra)

Esto es lo que nos ha sacado la I.A.

(Acordeón y guitarra con impurezas)

Algo las ha separado pero se le ha colado mucha voz dentro

(Acordeón y guitarra con impurezas)

Y luego la letra

(Voces con un poco de sangrado de la percusión)

Esto sirve muy bien para entender la letra de algunas canciones que con la mezcla no te enteras bien de lo que dicen

Así que oye, esto a los de genius lyrics les viene de p

Esto es la percusión original

(Beat de reggaeton muy claro)

Y esto es la percusión que nos ha separado la I.A.

(Percusión casi igual a la original)

(Risas de Jime)

(Percusión casi igual a la original)

O my God, el puñetero beat de reggaeton entero

Entero y perfecto

(Percusión casi igual a la original)

Osea esto es una pasada

Esto está para que yo ahora casi cojo esto, me lo pongo en mi canción

y puedo ponerle los instrumentos que quiera por encima y puedo tocar otra cosa

(Jaime tocando un sinte con la pista de la I.A.)

Puedo hacer mi propia canción sobre esta base de reggaeton

Un ejercicio que haces en producción musical es intentar imitar canciones

Intentas decir: Mira creo que ahí al fondo se oye un pad no se como ecualizado no se cuantos

Intentas imitarlo, esto ya lo hace solo

Tu podrías separarte la canción que quieras imitar por pistas y podrías ir imitando cada pista y ya está

Esque es increíble, de aquí para arriba, esque el siglo XXI, yo no quiero estar en el siglo XXII

Yo estoy muy agusto en el siglo XXI

Es un siglo en el que todavía te puedes maravillar con esto porque no the ha cambiado la vida

Solamente estás viendo la que se les viene encima a los del siglo XXII

Entonces en el XXI está muy bien verlo desde lejos y decir: Madre mía la que se viene

de falsificación de vídeo, de audio

Había un tío que decía que vivíamos en la era en la que las cosas que oyes grabadas puedes confiar mas o menos que son reales Antes no existían cosas grabadas y a partir de ahora no vas a poder confiar en las cosas grabadas

No sé si habéis visto todas las I.A.'s que imitan caras, de presidentes, de famosos

Que crean imágenes de personas que nunca han existido

mezclando facetas de personas reales como si fuera una especie de Frankenstein

Osea lo impresionante es que esto no lo hayan hecho ordenadores de la CIA, sabes

Que lo estoy haciendo yo, en mi portátil, porque el modelo está disponible para que lo use cualquiera

El reggaeton que hemos usado hoy y en general la música que uso en todos mis videos es de

-EPIDEMIC SOUND-

Eepidemic es un servicio de suscripción mensual en el que por 13 € al mes

tu puedes usar toda su librería musical de todos los géneros y estilos que tienen que son cientos en

en los videos que subas a redes sociales

y las tienes ya separadas por pistas

Como lo que te hace la IA pero te viene ya hecho

y es música muy buena que le da un salto de calidad a tus vídeos

sin que les salte ningún detector de copyright y sin que tengas ningún problema legal

y tú puedes monetizar tu contenido y hacer lo que quieras con él

Y si luego deshaces tu suscripción, no pasa nada, esa música que le has puesto a tus vídeos se queda ahí sin ningún problema

Como ya sabéis, en mis vídeos no podría poner música de fondo si no fuera por epidemic sound

así que he hecho un álbum dentro de su plataforma que se llama "La banda sonora de Jaime Altozano"

Y ahí he puesto 15 canciones que son de mis preferidas, canciones como esta:

(Música)

O esta

(Música)

O esta

(Música)

canciones que habeis oido decenas de veces en mis vídeos y que ahora podeis encontrar en Epidemic Sound junto a una lista infinita de canciones

Que podéis usar en vuestros vídeos simplemente pagando la suscripción mensual

-PRIMER MES GRATIS- con el link en la descripción

Así que nada, se nos vienen unos años muy interesantes

en los que de pronto hay aplicaciones de la inteligencia artificial en el mundo de la música que puedes ejecutar desde tu portátil

Cada vez va a haber más, cada vez van a ser más sorprendentes y cada vez van a dar más miedo y hablaremos de todas ellas aquí

Espero que este vídeo os haya dado un pequeño escalofrío vital, que por lo menos a mí me lo ha dado

Para bien y para mal y nos vemos la semana que viene.

Hasta pronto.

-Subtitulado por Divercoop. Oficial-

-Gracias por ver el vídeo-

Try LingQ and learn from Netflix shows, Youtube videos, news articles and more.

Probamos una Inteligencia Artificial que separa una cancion POR PISTAS (alucinante!) Wir haben eine künstliche Intelligenz getestet, die einen Song NACH TRACKS trennt (erstaunlich!) We tested an Artificial Intelligence that separates a song BY HINTS (amazing!) Ми протестували штучний інтелект, який розділяє пісні за треками (дивовижно!).