El Algoritmo de YouTube YA NO EXISTE | Redes Neuronales
Si me estás escuchando ahora mismo, lo más seguro es que hayas visto este vídeo aquí,
aquí o aquí.
YouTube te lo ha recomendado.
Y esto es muy bueno para mi como youtuber.
Alrededor de un tercio de mis visitas provienen de gente a las que se la ha sugerido uno de
mis vídeos.
Un tercio.
No es ninguna tontería.
Por eso mismo muchos youtubers se preocupan por entender cómo funciona este sistema de
recomendaciones; cómo elige qué vídeos va a mostrarle a los usuarios.
Vamos con un ejemplo: imagina que este sistema quiere valorar recomendarle uno de estos dos
vídeos a un cierto usuario.
Uno es mío y el otro es de CdeCiencia.
La peña piensa que el sistema funciona haciendo una especie de preguntas y después puntuando
las respuestas siguiendo unas normas.
Los vídeos con más puntos serían los que saldrían recomendados.
Por ejemplo, una pregunta podría ser “¿qué canal tiene más seguidores?”
y el que más tuviera se llevaría más puntos.
Otra podría ser “¿qué canal retiene mejor a su audiencia?”, más puntos acorde con
esto.
“¿Es la edad y el género del usuario similar a quienes suelen ver estos canales?”
Puntos positivos o negativos dependiendo de cómo concuerden.
Incluso es posible que haya preguntas más finas, como “¿se dice en el vídeo alguna
palabrota?”.
Puntos negativos si es así.
“¿Aparece una cara en la miniatura del vídeo?”
Puntos positivos si es así.
Por supuesto me estoy inventando si la puntuación es negativa o positiva, pero no es descabellado
que estas preguntas se estén haciendo… Especialmente esta: “¿Es la duración del
vídeo superior o inferior a diez minutos?”
Puntos positivos si es superior, puntos negativos si es inferior.
Wow, esta es una pregunta de vida o muerte.
Puede afectar tanto a la puntuación de mi vídeo como para que no llegue a recomendarse
a nadie.
¿Quién ha escrito esta regla?
Bueno, pues igual que el resto: la gente de YouTube.
Puede que hayan decidido que lo mejor para su negocio es mostrarle videos largos a la
gente en vez de cortos, pues en los largos pueden meter más anuncios...
Ahora, si yo como youtuber me entero de que por hacer vídeos cortos el sistema me está
perjudicando, entonces valoro cambiarme de estrategia: Seguir haciendo el mismo contenido
pero de una duración mayor.
Así el sistema me recomendará, tendré más visitas y más dinero para seguir haciendo
vídeos.
Y esta es una pregunta concreta: si consigo descifrar todas las normas de puntuación
que sigue el sistema, es decir, el famoso Algoritmo de Youtube, entonces tendré la
receta para hacer el vídeo perfecto.
Es por esto por lo que muchos youtubers desean descodificar el Algoritmo de Youtube.
Es el maldito Santo Grial.
Incluso para algunos es la puerta para aprovecharse del sistema, explotar sus debilidades para
que recomiende sus vídeos más de lo que debería.
¿Qué ocurre?
Que esta búsqueda es inútil.
Porque el algoritmo de youtube, las supuestas normas que obedece la máquina… ya no existen.
No están.
El antiguo algoritmo fue desenchufado hace bastante y fue sustituido por algo mucho más
poderoso.
Gente, os presento a las redes neuronales artificiales.
El “machine learning”, el Aprendizaje Automático.
Sistemas capaces de aprender a hacer tareas muy complicadas sin la necesidad de que nadie
les indique los pasos a seguir.
Esto no es ninguna suposición: los propios ingenieros de YouTube hicieron público que
las utilizan para hacer las recomendaciones.
Hoy quiero enseñaros cómo estas redes funcionan, al menos de una manera superficial, para que
entendáis que ni la propia de gente YouTube sabe las normas por las que se rigen sus recomendaciones…
Sencillamente porque no hay normas.
Atentos, ¡es muy ingenioso!
Una red neuronal está formada por lo que podemos llamar neuronas: unas unidades capaces
de recibir números, sumarlos y después mandarle esos números a otras neuronas modificándolos,
tal vez amplificándolo en una cierta dirección o reduciendolos una cierta cantidad en otra
(algo parecido a lo que hacen nuestras neuronas).
Una red neuronal es un conjunto de estas neuronas estructuradas en capas.
Se envían números, los agrupan y los vuelven a enviar modificados; una especie de cadena
alteradora de números.
Hay muchas maneras de construir una red neuronal, pero en nuestro ejemplo concreto la red empieza
en un lugar: una neurona de inicio en la que nosotros introducimos un cierto valor.
Después esta neurona se enlazaría con muchas otras y comenzaría este juego de enviar múltiples
versiones del número modificado para que se sumen, y vuelvan a modificarse un montón
de veces.
El proceso termina cuando estos números acaban en una neurona final, que suma todos los valores
en un resultado.
La red neuronal en su conjunto es una máquina de convertir valores en otros: meto un número
y saco otro distinto.
¡Como una calculadora!
De hecho, imagínate que necesitaras una máquina que supiera hacerte una raíz cuadrada; un
sistema al que le metes un número cualquiera y él te expulsa correctamente su raíz cuadrada.
Una red neuronal podría ser una candidata.
Pero ¿cómo puedo conseguir que la red haga esto?
¿cómo puedo conseguir que toda esa combinación de sumas y modificaciones consigan llevar
cualquier número desde su valor inicial hasta su raíz cuadrada?
¿Cómo?
Es la hora de que la red aprenda.
La clave está en los enlaces entre neuronas: es en estos caminos en los que los números
se modifican, y la cuestión es que somos nosotros los que podemos decidir cuánto lo
hacen en cada uno de ellos.
Pensad que cada enlace tiene una especie de ruedecita que girándola de un modo u otro
podemos conseguir que el número que viaje cambie.
Tal vez aumente un cincuenta por ciento o un noventa, o se reduzca un setenta o un veinte.
Como si bajaramos o subieramos el volumen de la música.
La cuestión es que en una red neuronal suele haber muchísimos enlaces, por lo que delante
de nosotros tenemos un panel enorme de ruedecitas.
Fijaos: imaginad que pudiera calibrar todas y cada una de estas ruedecitas de la manera
correcta.
Imaginad que pudiera coordinar todo este conjunto de sumas y modificaciones para que al meter
cualquier número me saliera su raíz cuadrada.
Es como si la red neuronal fuera una orquesta en la que cada músico va a su bola.
Si consiguiera dirigirla correctamente podría hacer que tocaran una bella sinfonía.
Podría hacer que la red me hiciera raíces cuadradas.
Obviamente hacer esta coordinación a mano, probando cada una de las ruedecitas hasta
dar en el clavo, es una tarea de locos… Sin embargo, aquí nuestras amigas las matemáticas
nos ayudan.
Solo hace falta una cosa: un grupo de ejemplos, una lista de raíces cuadradas ya hechas para
poder averiguar la calibración de las ruedecitas.
Una vez tienes eso, estos algoritmos de aprendizaje se encargan del resto, utilizando los ejemplos
para mover todas las ruedas en la posición óptima.
La red podría servir para cualquier cosa, en esencia es una máquina de transformar
unos números en otros.
Pero al utilizar la lista de ejemplos y sintonizar la red correctamente la hemos convertido en
una calculadora de raíces cuadradas.
Hemos hecho que la red aprenda a hacer una tarea concreta.
Y, eh, ¡va de maravilla!
No solo calcula bien los ejemplos de la lista.
Esa es la gracia, solo los necesitábamos para que la red aprendiera: ahora funciona
con cualquier valor.
Es una buena calculadora.
La pregunta aquí es: ¿he programado alguna ley dentro de la red?
¿he introducido algún conjunto de reglas para calcular la raíz cuadrada?
No.
No hecho nada de eso.
He metido unos ejemplos y la red solita a pillado como se hace.
Aquí no hay reglas ni normas; aquí no hay ningún “algoritmo para calcular la raíz
cuadrada”.
La red suma y modifica números de una manera precisa y me expulsa el resultado correcto.
Sin más.
En cierto sentido, una red neuronal es una especie de batidora prodigiosa en la que metes
todos los ingredientes de un pastel, aprietas el botón de encendido y por la acción de
las cuchillas y el calor por fricción cuando la apagas tienes la tarta hecha dentro.
¿Ha seguido la batidora la receta de la tarta al pie de la letra?
¿Se ha tamizado la harina, montado las claras, y horneado a la temperatura estricta?
Nope.
La batidora ha combinado y modificado correctamente los ingredientes para crear el pastel.
Sin reglas ni normas de por medio.
Y a eso me refiero cuando digo que el algoritmo de youtube ya no existe, porque quién controla
ahora las recomendaciones es una de estas redes neuronales.
Y youtube no es el único que las usa: la mayoría de coches autónomos utilizan redes
neuronales para conducir solos, el LHC utiliza también de una red neuronal para seleccionar
buenas colisiones de entre millones en cuestión de microsegundos,
Incluso instagram utiliza una red neuronal para reconocer la forma de tu cara a tiempo
real y colocarte estas orejas de perrito.
¡Tienes una red neuronal programada en tu móvil!
Pero volviendo a la red neuronal de YouTube… Bueno, no es una.
Son dos.
La primera selecciona de los millones de vídeos de YouTube unos candidatos para que luego
la segunda red los puntúe con más precisión, haciendo un “top cien los mejores vídeos”
y recomendándote los que estén más arriba.
Cada red funciona de una manera muy parecida a la que os he enseñado: entran un vídeo
y un usuario y sale una puntuación.
Y cuando digo “vídeo” y “usuario” me refiero a cientos de números que reflejan
propiedades de ti, de mi y de mi video.
Y es que estas redes no son precisamente pequeñas.
Recomendar vídeos de manera personalizada es una tarea muy complicada y para eso se
necesitan miles de neuronas con miles de millones de ruedecitas que ajustar.
Y hablando de eso, ¿cómo aprende esta red a recomendar vídeos?
Bueno, al igual que nuestra red aprendió a hacer raíces cuadradas enseñándole ejemplos,
YouTube hace lo mismo: Alimenta a la red con una selección de los vídeos que vemos...
Y lo hace constantemente.
La red aprende con nosotros a cada segundo.
Esta es otra razón por la que es absurdo pensar que hay un “algoritmo de youtube”:
la red y las decisiones que toma están continuamente evolucionando.
Y sugerir vídeos a millones de personas es una tarea más complicada que hacer raíces
cuadradas, por lo que no podemos estar seguros de que la red neuronal de YouTube ya haya
alcanzado la manera perfecta de hacer su labor.
Dicho de mala manera, puede que ahora esté atrapada en un estado de aprendizaje intermedio,
y que aún le falte una cierta cantidad de vídeos para llegar al funcionamiento óptimo.
Puedes pensar que la red es una pelota que quiere llegar al fondo de un valle, pero que
se ha quedado en una pequeña curva porque se piensa que ese es el punto más bajo del
lugar.
La pelota necesitará de unos toquecitos más para salir de allí y rodar hasta el lugar
perfecto.
Luego hay cierto riesgo de que el comportamiento de las recomendaciones cambie súbitamente,
perjudicando el trabajo de muchos compañeros en el proceso… Y la verdad es que no descarto
que esto ya haya ocurrido.
Este año hemos visto como muchos grandes de esta plataforma han avisado de que algo
raro estaba pasando, y les pedían a la gente de YouTube que deshicieran los cambios que
habían implementado.
Un poco ingenuo por dos motivos.
El primero es que los ingenieros de YouTube no tienen control en cómo la red neuronal
elige sus recomendaciones, lo único que pueden hacer es alimentarla con los vídeos correctos
y reforzar ciertos comportamientos.
Y, segunda (la más empresarial), si la red neuronal sigue enchufada es porque cumple
con su objetivo: recomendarte vídeos lo suficientemente bien como para retenerte dentro de YouTube
y que te comas más anuncios.
Si la red consigue mejorar la retención aunque sea un poquito mejor que el algoritmo que
le precedía, entonces la red se va a quedar, por muchos youtubers que tengan que cerrar
sus canales.
Nada más, gente.
Creo que ahora es el momento de pedir una cantidad absurda de likes para hacer una segunda
parte o una movida así...
Cuando lo que realmente se pretende es que la red neuronal me puntúe por encima de mis
compañeros.
Mirad, si os ha molado est video o el resto que tengo sobre las maravillas del Universo
enseñadselos a vuestros colegas y ya está.
Nos vemos la semana que viene con un poquito más de ciencia.
Y como siempre muchas gracias por verme.