×

Nous utilisons des cookies pour rendre LingQ meilleur. En visitant le site vous acceptez nos Politique des cookies.


image

La statistique expliquée à mon chat, La variable aléatoire du grenier

La variable aléatoire du grenier

Voici mon chat, Albert.

L'autre jour, tandis qu'il vaquait à ses occupations de chat,

Albert a trouvé une boite dans le grenier.

Une simple boîte ?

Non ! Il s'agit d'une boîte exceptionnelle, magique, incroyable.

Sa particularité ?

Chaque fois qu'Albert l'ouvre, un nombre en sort.

Albert a beau avoir observé ce qui en sortait un grand nombre de fois,

il n'a toutes fois pas pu en percer le secret.

Quel mystère !

Il a alors parlé de sa trouvaille à ses amis chats.

Certains ont voulu jouer à prédire

ce qui allait sortir de la boîte

avant qu'Albert l'ouvre,

parfois ils y arrivaient,

mais, au bout d'un moment, même le meilleur des chats

finissait toujours par commettre une erreur.

Frustré de ne pas comprendre ce qui se cachait derrière cet étrange objet,

Albert a fini par m'appeler à l'aide.

Je lui ai alors expliqué que les gens dans ma profession, la statistique,

travaillent avec ce genre de boîte tous les jours.

Celle qu'il a trouvé dans le grenier

est sans doute le reste d'un ancien projet.

J'ai expliqué à Albert que personne ne pouvait percer le secret de cette boîte.

Comment est-ce possible ?

C'est simple. Elle a été conçue comme ça.

Ce qui en sort est toujours imprévisible.

Albert était un peu déçu de ma réponse.

Mais sa curiosité restait grande,

il voulait savoir comment j'avais construit la boîte qu'il avait trouvé.

Pour créer une boite de statisticien, il y a deux choses importantes à définir.

Premièrement, il faut décider ce qui peut en sortir.

On appelle ça le domaine de la boite.

Par exemple, les nombres 22, 25, 37 et 50.

Bien qu'il ne soit pas possible à l'avance de dire quel nombre va sortir

à chaque fois que la boite est ouverte,

on est sûr que c'est l'un de ces nombres qui sortira

car nous en avons ainsi défini le domaine.

Deuxièmement, il faut personnaliser le poids sur chaque nombre.

Par défaut, chaque nombre a autant de chances de sortir que les autres.

Donc s'il y en a quatre, ça nous donne une chance sur quatre pour chacun d'apparaître.

Si l'on souhaite toutefois voir le nombre 25 sortir de la boîte plus souvent que les autres,

il suffit simplement de réorganiser les poids.

Attention ! Si on augmente le poids quelque part,

Il faut automatiquement en retirer ailleurs.

Si la somme totale des poids n'est plus de une unité,

le plan devient erroné

et la boîte qui se basera sur ces plans

ne pourra pas fonctionner correctement.

Albert pense avoir compris.

Mais quels étaient les plans de la boîte du grenier ?

J'étais bien embêté, je ne m'en souvenais plus.

Heureusement, perdre les plans d'une boîte n'est pas si grave.

Si l'on observe ce qui sort d'une boîte dont on ne sait rien suffisamment longtemps,

il est possible d'en deviner les plans.

Lorsque Albert a montré la boîte à ses amis chats,

voici la totalité des chiffres qui sont sortis.

Bon d'accord, ça en fait un paquet.

Mais on dirait que ce sont toujours les chiffres 0, 1 et 2 qui sortent.

Voilà le domaine de la boîte.

Il nous manque encore toutefois les poids.

Sur les 100 résultats d'Albert, le chiffre 0 est sorti 54 fois,

le chiffre 1, douze fois et le chiffre 2, 34 fois.

Les poids de mon plan devaient donc être de 54/100, 12/100 et 34/100.

Je vois que l'attention d'Albert diminue.

Mais Albert ! Il y a pourtant tellement de choses à raconter sur ces boîtes magiques.

Par exemple, on peut construire des boîtes dont ce qui sort n'est pas des nombres mais autre chose,

comme des couleurs.

Disons rouge, orange, jaune, vert et pourquoi pas bleu.

Le couleur jaune pourrait sortir la moitié du temps

et les autres couleurs 1/8 du temps.

Il y a aussi des boîtes dont le domaine est un segment.

Par exemple, le segment qui va de -5 à 2

N'importe quelle valeur entre -5 et 2,

comme 1,3476 ou encore -4,1 peut en sortir.

Ces boites ont toutefois un comportement très particulier,

qui a amené plusieurs générations de statisticiens à s'arracher les cheveux

avant de réussir à les dompter de façon satisfaisante.

Nous y consacrerons d'ailleurs une vidéo complète dans le futur.

Certaines boites sont particulièrement extrêmes,

avec un domaine comportant des nombres infiniment grands.

Par exemple, une boite de laquelle n'importe quel entier naturel peut sortir,

c'est à dire 0, 1, 2, 3, 4, 5,

mais aussi 1.000, 100.000, 2 millions, 106 milliards, etc.

Assigner un poids à chaque valeur du domaine,

tout en s'assurant que la somme totale de ces poids n'excède pas une unité,

est toutefois très délicat dans le cas d'une boîte de ce genre.

Le problème est d'ailleurs tellement sévère

que les statisticiens préfèrent utiliser des formules

pour les assister dans cette délicate tâche.

La formule de monsieur Poisson est ainsi très populaire.

Dès que le symbole grec lambda dans cette formule est remplacé par une valeur concrète,

un poids pour chaque élément du domaine est facile à calculer.

Les poids générés peuvent être indirectement personnalisés

en changeant la valeur du symbole lambda dans la formule.

Plus lambda est élevé, moins il y aura de poids sur le début du domaine.

Et la force de cette formule est que les poids générés s'additionneront toujours pour donner une valeur de 1 !

C'est monsieur Poisson qui le garantit.

Albert s'est endormi. J'imagine que ce sera tout pour aujourd'hui.

Mais il ne faut pas s'inquiéter :

mon grenier est rempli de merveilles qui n'attendent qu'à être découvertes.

Oh, avant de terminer, une dernière chose.

Nous autres, statisticiens, nous n'aimons pas l'appellation "boîte magique".

Cela ne fait pas très sérieux, vous serez d'accord avec moi.

À la place nous appelons ça une variable aléatoire.

Albert remercie vivement @Lebravex pour avoir réalisé ces sous-titres :-)

La variable aléatoire du grenier Die Zufallsvariable des Dachbodens The attic's random variable La variable aleatoria en el ático La variabile casuale in soffitta 屋根裏部屋の確率変数 De willekeurige variabele op zolder Zmienna losowa na poddaszu A variável aleatória no sótão Случайная переменная на чердаке Den slumpmässiga variabeln på vinden Tavan arasındaki rastgele değişken 阁楼随机变量

Voici mon chat, Albert. This is my cat, Albert Aquí está mi gato, Albert. Dit is mijn kat, Albert

L'autre jour, tandis qu'il vaquait à ses occupations de chat, ||||was engaged|||occupations|| The other day, while he was busy doing cat stuff, El otro día, mientras él hacía su negocio de gatos, Op een keer, toen hij bezig was te doen wat katten gewoonlijk doen,

Albert a trouvé une boite dans le grenier. Albert found a box in the attic. Albert encontró una caja en el ático. vond Albert op zolder een kartonnen doos.

Une simple boîte ? Is it a common box? ¿Una simple caja? Een gewone doos?

Non ! Il s'agit d'une boîte exceptionnelle, magique, incroyable. Nope! This box is exceptional, magic, simply incredible. ¡No! Esta es una caja excepcional, mágica, increíble. Neen! Een uitzonderlijke, magische, ongelooflijke doos.

Sa particularité ? What's so peculiar about it? ¿Su particularidad? Wat er zo bijzonder aan was?

Chaque fois qu'Albert l'ouvre, un nombre en sort. ||Albert||||| Every time Albert opens it, a number comes out. Cada vez que Albert lo abre, sale un número. Wel, telkens Albert ze opende, kwam er een getal uit.

Albert a beau avoir observé ce qui en sortait un grand nombre de fois, |||||||||||number|| Albert has opened it many times, hoping to figure it out, but he could not. Albert pudo haber observado lo que salió muchas veces, Hoewel Albert aandachtig heeft zitten kijken welke getallen er vaak uitkwamen,

il n'a toutes fois pas pu en percer le secret. él no ha sido capaz de penetrar el secreto. slaagde hij er niet in het geheim erachter te ontmaskeren.

Quel mystère ! ¡Qué misterio! Hoe vreemd!

Il a alors parlé de sa trouvaille à ses amis chats. ||||||discovery|||| Luego habló sobre su hallazgo a sus amigos gatos. Vervolgens sprak hij met zijn vrienden, de katten, over zijn vondst.

Certains ont voulu jouer à prédire Algunos querían jugar para predecir Sommigen van hen probeerden te voorspellen

ce qui allait sortir de la boîte lo que saldría de la caja wat er uit de doos zou komen voordat Albert ze opende. Soms slaagden zij erin,

avant qu'Albert l'ouvre, antes de que Albert lo abra,

parfois ils y arrivaient, From time to time, they succeeded. But after a while, a veces lo hicieron,

mais, au bout d'un moment, même le meilleur des chats |at||||even|||| even the best of them always ended up making a mistake. pero, después de un tiempo, incluso el mejor de los gatos

finissait toujours par commettre une erreur. siempre terminé cometiendo un error.

Frustré de ne pas comprendre ce qui se cachait derrière cet étrange objet, Frustrated|||||||||||| Albert was getting frustrated. He wanted to know what this box was all about and so came to me. Frustrado por no entender lo que había detrás de este extraño objeto,

Albert a fini par m'appeler à l'aide. Albert terminó llamándome por ayuda.

Je lui ai alors expliqué que les gens dans ma profession, la statistique, ||||||||||||statistics Luego le expliqué que personas en mi profesión, estadísticas,

travaillent avec ce genre de boîte tous les jours. trabaje con este tipo de caja todos los días.

Celle qu'il a trouvé dans le grenier El que encontró en el ático

est sans doute le reste d'un ancien projet. es probablemente el resto de un viejo proyecto.

J'ai expliqué à Albert que personne ne pouvait percer le secret de cette boîte. |||||||could|||||| I explained to Albert that no one can crack the box. How is this possible? Le expliqué a Albert que nadie podía descifrar el secreto de esta caja. Hoe dat mogelijk is?

Comment est-ce possible ? ¿Cómo es posible? Heel eenvoudig, omdat de doos zo is opgebouwd dat

C'est simple. Elle a été conçue comme ça. |||||designed|| It's fairly simple: the box was designed that way. Es simple. Fue diseñado así.

Ce qui en sort est toujours imprévisible. ||||||unpredictable What comes out is, by definition, impossible to predict. Lo que sale de él siempre es impredecible.

Albert était un peu déçu de ma réponse. Albert was a bit disappointed by my answer. Albert estaba un poco decepcionado con mi respuesta. Albert was wel wat teleurgesteld door mijn antwoord,

Mais sa curiosité restait grande, But he nonetheless wanted to know more about the box. Pero su curiosidad permaneció grandiosa, maar hij bleef erg nieuwsgierig.

il voulait savoir comment j'avais construit la boîte qu'il avait trouvé. For instance, how was the one he found built? él quería saber cómo había construido la caja que había encontrado. Hij wilde weten hoe ik de doos die hij had gevonden, had opgebouwd.

Pour créer une boite de statisticien, il y a deux choses importantes à définir. To build this kind of box, you need to define two things. Para crear un cuadro de estadística, hay dos cosas importantes que definir. Om een statistische doos op te bouwen, zijn er twee zaken van belang.

Premièrement, il faut décider ce qui peut en sortir. First, you need to decide what is allowed to come out. This is called the domain of the box. Primero, debes decidir qué puede salir de eso. Ten eerste, moet je beslissen wat er naar buiten kan komen.

On appelle ça le domaine de la boite. Esto se llama el dominio de la caja. Dit noemt men “het domein” van de doos.

Par exemple, les nombres 22, 25, 37 et 50. |||numbers| For instance, you could pick the numbers 22, 25, 37 and 50. Por ejemplo, los números 22, 25, 37 y 50. Bij voorbeeld, de getallen 22, 25, 37 en 50.

Bien qu'il ne soit pas possible à l'avance de dire quel nombre va sortir While it is not possible to predict what number will actually come out when you open the box, Aunque no es posible por adelantado decir qué número saldrá Hoewel het onmogelijk is om elke keer als iemand de doos opent

à chaque fois que la boite est ouverte, cada vez que la caja está abierta, vooraf te zeggen welk getal zal verschijnen,

on est sûr que c'est l'un de ces nombres qui sortira estamos seguros de que es uno de esos números que saldrán zijn we zeker dat het één van die getallen zal zijn

car nous en avons ainsi défini le domaine. porque así hemos definido el dominio. omdat we het domein zo hebben gedefinieerd.

Deuxièmement, il faut personnaliser le poids sur chaque nombre. En segundo lugar, debe personalizar el peso en cada número. Ten tweede is het belangrijk “het gewicht” van elk getal te bepalen.

Par défaut, chaque nombre a autant de chances de sortir que les autres. Por defecto, cada número es tan probable que salga como los demás. Doe je dat niet, dan heeft elk getal een zelfde kans om naar buiten te komen.

Donc s'il y en a quatre, ça nous donne une chance sur quatre pour chacun d'apparaître. Entonces, si hay cuatro, nos da una de cada cuatro oportunidades para que todos aparezcan. Dus, als er vier getallen zijn, heeft elk getal één kans op vier om te verschijnen.

Si l'on souhaite toutefois voir le nombre 25 sortir de la boîte plus souvent que les autres, Sin embargo, si queremos ver el número 25 fuera de la caja con más frecuencia que los demás, Wensen wij bv. dat het getal 25 meer dan de andere getallen verschijnt,

il suffit simplement de réorganiser les poids. ||||reorganize|| solo tienes que reorganizar los pesos. dan kan dit door gewoon de gewichten te wijzigen.

Attention ! Si on augmente le poids quelque part, ¡Atención! Si aumentamos el peso en alguna parte, Maar let op: als we het gewicht van een getal verhogen,

Il faut automatiquement en retirer ailleurs. you have to remove some elsewhere. Debe ser eliminado automáticamente en otro lugar. moeten we het automatisch elders laten afnemen.

Si la somme totale des poids n'est plus de une unité, If the total weight is not one unit, Si la suma total de los pesos ya no es uno, Want als het totale gewicht niet langer één eenheid bedraagt,

le plan devient erroné |||erroneous the blueprint is wrong, and the box based on it won't work properly. el plan se vuelve incorrecto klopt het plan niet meer

et la boîte qui se basera sur ces plans |||||will be based||| and the box based on these plans y la caja que se basará en estos planes en zal de doos, die volgens dit plan is opgebouwd, niet correct kunnen werken.

ne pourra pas fonctionner correctement. will not work properly. no funcionará correctamente

Albert pense avoir compris. Albert cree que entiende.

Mais quels étaient les plans de la boîte du grenier ? Pero, ¿cuáles eran los planes de la caja del ático?

J'étais bien embêté, je ne m'en souvenais plus. ||bothered||||| This is a little embarrassing, I had no idea where the blueprint could be. Estaba realmente molesto, ya no lo recordaba.

Heureusement, perdre les plans d'une boîte n'est pas si grave. Not to worry, though. Afortunadamente, perder los planes de una caja no es tan malo.

Si l'on observe ce qui sort d'une boîte dont on ne sait rien suffisamment longtemps, Indeed, if we observe long enough what comes out of a box for which we do not know what the blueprint is, Si miras lo que sale de una caja que no sabes lo suficiente,

il est possible d'en deviner les plans. it's pretty easy to guess what that blueprint was. es posible adivinar los planes.

Lorsque Albert a montré la boîte à ses amis chats, When Albert showed the box to his cat-friends, he had gathered 100 results. Cuando Albert mostró la caja a sus amiguitos,

voici la totalité des chiffres qui sont sortis. ||totality||||| aquí están todos los números que salieron.

Bon d'accord, ça en fait un paquet. De acuerdo, eso es mucho.

Mais on dirait que ce sont toujours les chiffres 0, 1 et 2 qui sortent. Pero parece que todavía están saliendo los números 0, 1 y 2.

Voilà le domaine de la boîte. Ese es el campo de la caja.

Il nous manque encore toutefois les poids. But we're still missing the weights. Sin embargo, todavía extrañamos los pesos.

Sur les 100 résultats d'Albert, le chiffre 0 est sorti 54 fois, De los 100 resultados de Albert, el número 0 salió 54 veces,

le chiffre 1, douze fois et le chiffre 2, 34 fois. el número 1, doce veces y el número 2, 34 veces.

Les poids de mon plan devaient donc être de 54/100, 12/100 et 34/100. The weights of my plan were therefore 54/100, 12/100 and 34/100. El peso de mi plan debería ser 54/100, 12/100 y 34/100.

Je vois que l'attention d'Albert diminue. |||||decreases I see that Albert is getting tired. Veo que la atención de Albert está disminuyendo.

Mais Albert ! Il y a pourtant tellement de choses à raconter sur ces boîtes magiques. |||||||||||||boxes|magical Yet, there are so many things to tell about these boxes! ¡Pero Albert! Hay mucho que contar sobre estas cajas mágicas.

Par exemple, on peut construire des boîtes dont ce qui sort n'est pas des nombres mais autre chose, For example, it is possible to build boxes from which a color comes out. Por ejemplo, podemos construir cajas cuyo resultado no sean números sino otra cosa, zoals kleuren.

comme des couleurs. Let's say red, orange, yellow, green and why not blue. como los colores. Bijvoorbeeld: rood, oranje, geel, groen en, waarom niet, blauw.

Disons rouge, orange, jaune, vert et pourquoi pas bleu. Digamos rojo, naranja, amarillo, verde y por qué no azul.

Le couleur jaune pourrait sortir la moitié du temps El color amarillo podría salir la mitad del tiempo

et les autres couleurs 1/8 du temps. y los otros colores 1/8 del tiempo.

Il y a aussi des boîtes dont le domaine est un segment. También hay cuadros cuyo dominio es un segmento.

Par exemple, le segment qui va de -5 à 2 Por ejemplo, el segmento que va de -5 a 2.

N'importe quelle valeur entre -5 et 2, Cualquier valor entre -5 y 2,

comme 1,3476 ou encore -4,1 peut en sortir. como 1.3476 o -4.1 pueden salir.

Ces boites ont toutefois un comportement très particulier, |boxes|||||| Estas cajas, sin embargo, tienen un comportamiento muy particular,

qui a amené plusieurs générations de statisticiens à s'arracher les cheveux ||||||||tear|| que ha llevado a varias generaciones de estadísticos a rasgarse el pelo

avant de réussir à les dompter de façon satisfaisante. |||||tame||| before you can tame them satisfactorily. antes de que logren domesticarlos satisfactoriamente.

Nous y consacrerons d'ailleurs une vidéo complète dans le futur. ||will dedicate||||||| We'll be dedicating a full video to this topic in the future. Dedicaremos un video completo en el futuro.

Certaines boites sont particulièrement extrêmes, Algunas cajas son particularmente extremas,

avec un domaine comportant des nombres infiniment grands. |||involving|||| with a domain of infinitely large numbers. con un dominio con números infinitamente grandes.

Par exemple, une boite de laquelle n'importe quel entier naturel peut sortir, For instance, a box such that any natural number can come out, such as 0, 1, 2, 3, 4, 5, Por ejemplo, una caja desde la cual puede salir cualquier entero natural,

c'est à dire 0, 1, 2, 3, 4, 5, es decir, 0, 1, 2, 3, 4, 5,

mais aussi 1.000, 100.000, 2 millions, 106 milliards, etc. but also 1,000, 100,000, 2 million, 106 billion, etc. pero también 1,000, 100,000, 2 millones, 106 billones, etc.

Assigner un poids à chaque valeur du domaine, Asignar un peso a cada valor de dominio,

tout en s'assurant que la somme totale de ces poids n'excède pas une unité, ||ensuring||||||||does not exceed||| while ensuring that the sum total of these weights does not exceed one unit, mientras se asegura que la suma total de estos pesos no exceda una unidad,

est toutefois très délicat dans le cas d'une boîte de ce genre. es muy delicado en el caso de una caja de este tipo.

Le problème est d'ailleurs tellement sévère In fact, the problem is so severe El problema es tan severo

que les statisticiens préfèrent utiliser des formules ||||||formulas que los estadísticos prefieren usar fórmulas

pour les assister dans cette délicate tâche. para ayudarlos en esta delicada tarea.

La formule de monsieur Poisson est ainsi très populaire. The formula of mister Poisson is for instance very popular. La fórmula del Sr. Poisson es, por lo tanto, muy popular.

Dès que le symbole grec lambda dans cette formule est remplacé par une valeur concrète, |||||lambda|||||replaced||||concrete As soon as the symbol lambda in this formula is replaced by an actual value, Tan pronto como el símbolo griego lambda en esta fórmula sea reemplazado por un valor concreto,

un poids pour chaque élément du domaine est facile à calculer. ||||element|||||| a weight for each element of the domain is easy to calculate. un peso para cada elemento del dominio es fácil de calcular.

Les poids générés peuvent être indirectement personnalisés ||generated||||personalized Generated weights can be indirectly personalized by changing the value of lambda in the formula. Los pesos generados se pueden personalizar indirectamente

en changeant la valeur du symbole lambda dans la formule. cambiando el valor del símbolo lambda en la fórmula.

Plus lambda est élevé, moins il y aura de poids sur le début du domaine. The larger lambda is, the less weight we get at the beginning of the domain. Cuanto mayor sea la lambda, menos peso habrá al comienzo de la herencia.

Et la force de cette formule est que les poids générés s'additionneront toujours pour donner une valeur de 1 ! |||||||||||will add up|||||| The strength of this formula is that generated weights always add up to 1, mister Poisson made sure of it. ¡Y la fuerza de esta fórmula es que los pesos generados siempre se sumarán para dar un valor de 1!

C'est monsieur Poisson qui le garantit. Mr. Poisson guarantees it. Es el Sr. Poisson quien lo garantiza.

Albert s'est endormi. J'imagine que ce sera tout pour aujourd'hui. Look, Albert is asleep. I guess that's it for today. Albert se durmió. Me imagino que eso será todo por hoy. Oei, Albert is in slaap gevallen. Ik denk dat dit zal volstaan voor vandaag.

Mais il ne faut pas s'inquiéter : Not to worry however: my attic is full of mysteries that are waiting to be discovered. Pero no preocupe : Maar maak je geen zorgen:

mon grenier est rempli de merveilles qui n'attendent qu'à être découvertes. |||||||await||| mi ático está lleno de maravillas esperando ser descubierto. op mijn zolder liggen nog heel wat wonderen te wachten om te worden ontdekt.

Oh, avant de terminer, une dernière chose. Oh before you go, one last thing. Oh, antes de terminar, una última cosa. Toch nog vlug dit, voor ik hier afsluit:

Nous autres, statisticiens, nous n'aimons pas l'appellation "boîte magique". We statisticians don't like to speak about boxes. Not fancy enough, right? A los estadísticos no nos gusta el nombre "caja mágica". wij, statistici, houden niet van de benaming "magische doos”,

Cela ne fait pas très sérieux, vous serez d'accord avec moi. It's not very serious, as you'll agree. No es muy serio, estarás de acuerdo conmigo. want geef toe, dat klinkt niet erg ernstig.

À la place nous appelons ça une variable aléatoire. ||||call|||| En cambio, lo llamamos una variable aleatoria. In plaats daarvan, noemen we ze een “stochastische variabele”.

Albert remercie vivement @Lebravex pour avoir réalisé ces sous-titres :-) |||Lebravex|||||| Albert would like to thank @Lebravex for producing these subtitles :-) Albert agradece calurosamente a @Lebravex por producir los subtítulos en francés que han sido traducidos con placer por @Kobalt :-)