×

Utilizziamo i cookies per contribuire a migliorare LingQ. Visitando il sito, acconsenti alla nostra politica dei cookie.


image

La statistique expliquée à mon chat, Le théorème central limite

Le théorème central limite

Les physiciens ont la relativité générale et les élégantes équations de Maxwell.

Les chimistes ont le tableau périodique des éléments.

Les biologistes ont l'évolution, ou encore la fascinante molécule d'ADN.

Et les statisticiens ont le théorème central limite.

Le théorème central limite, mon chat Albert n'en a jamais entendu parler.

Mais les statisticiens, eux, lui vouent un véritable culte !

Sans le théorème central limite, la statistique ne serait que l'ombre de ce qu'elle est aujourd'hui.

Il est donc grand temps, je crois, d'expliquer à Albert de quoi il s'agit.

<3 Sous-titres réalisés avec amour par Posey 1235. Merci à lui ! <3

Au quotidien, le statisticien travaille avec ce qu'il appelle des variables aléatoires.

Albert, tu as encore oublié ce qu'était une variable ?

Bon, je te le rappelle, mais c'est la dernière fois !

Une variable aléatoire, c'est comme une boite magique qui a pour particularité qu'à chaque ouverture,

une valeur en sort sans que l'on puisse dire ce que sera cette valeur à l'avance.

Cela n'a toutefois pas empêché les statisticiens d'analyser un grand nombre de ces boites

et de conclure que, peu importe la boite,

il y a toujours ce qu'ils nomment une distribution de probabilité derrière.

Connaître la distribution de probabilité d'une variable est très important Albert,

car cela signifie avoir tout en main pour répondre à des questions du genre :

Quelles sont les chances qu'une valeur entre -2 et 6,5 sorte ?

Ou encore,

Quelle est la probabilité qu'une valeur plus petite que 60 ou plus grande que 142 soit obtenue ?

Une distribution de probabilité très connue, c'est la fameuse courbe en cloche, ou distribution normale.

Mais il y en a beaucoup d'autres ;

par exemple :

la distribution uniforme continue,

la distribution triangulaire,

la distribution uniforme discrète,

la distribution exponentielle,

etc.

Lorsque deux variables A et B ont exactement la même distribution de probabilité, les statisticiens disent que ces variables sont identiquement distribuées.

Pour que tu comprennes bien ce que cela signifie Albert, imagine toi avoir un clone qui vit quelques pâtés de maisons plus loin.

Il est en tout point identique à toi : le pelage est le même, la taille aussi,

la tendance à rendre son maître fou furieux en dormant dans le panier à linge propre également.

Vous êtes comme deux variables A et B qui seraient identiquement distribuées.

Mais ce chat et toi êtes des êtres distincts.

Ce n'est pas parce que ton clone est dans les bras de Morphée en ce moment que tu dois l'être toi aussi.

Ce n'est pas parce que ton clone partira peut-être jouer à l'extérieur plus tard que tu en feras autant.

Vous avez chacun votre propre vie.

Bon.

Passons aux choses sérieuses.

Lorsqu'il n'est pas occupé à vous présenter un graphique,

l'une des occupations favorites du statisticien consiste à assembler des variables aléatoires pour en créer des nouvelles.

Si je multiplie deux variables G et H, qui ne sont pas forcément identiquement distribuées même si c'est souvent le cas,

Le résultat est une nouvelle variable aléatoire.

Si je soustrais à G 5 fois la racine carrée de H,

là aussi, j'obtiens une nouvelle variable aléatoire.

Il n'y a pas vraiment de limite à ce que l'on peut faire,

mais le problème en bout de ligne sera toujours le même :

lorsqu'on assemble deux ou davantage de variables,

quelle sera la distribution de probabilité de la nouvelle variable ?

C'est ici que les statisticiens ont découvert quelque chose qui, aujourd'hui encore, me fascine.

Plus on assemble un grand nombre de variables aléatoires identiquement distribuées par addition,

plus la distribution de probabilité de la nouvelle variable sera proche d'une distribution normale.

C'est ça le théorème central limite.

Prenons deux boites ayant une distribution exponentielle.

Comme on peut le voir à l'écran, l'addition de ces deux variables ne donne pas une variable ayant une distribution normale.

Mais à mesure que l'on va additionner toujours plus de variables ayant une distribution exponentielle,

la distribution de la variable finale converge lentement mais sûrement vers une distribution normale.

Et ceci fonctionne pour n'importe quelle distribution de départ.

Prenons deux variables ayant cette fois une distribution de probabilité uniforme discrète.

Leur addition donne le résultat à l'écran, qui n'est clairement pas une distribution normale.

Mais à mesure que je vais additionner un nombre toujours plus grand de variables, chacune caractérisée par une distribution uniforme discrète,

on voit que la distribution de la nouvelle variable converge de façon flagrante vers une distribution normale.

N'est-ce pas là un phénomène extraordinaire, Albert ?

Tu ne sembles pas très impressionné.

Concluons donc par un exemple d'application de ce théorème.

Oscar propose à Albert et à Marine un jeu.

Ces deux derniers doivent chacun lancer une dizaine de dés,

et si la somme des vingts chiffres obtenus est de cent ou plus, Oscar leur offre une conserve de thon à partager.

Au pire, Albert et Marine savent qu'ils obtiendront ensemble un total de vingt points et au maximum un total de cent vingt points s'ils réalisent vingt fois six,

ce qui est bien sûr extrêmement peu probable.

Mais Oscar ne leur demande pas de faire cent vingt points, il demande cent points ou plus.

N'ayant rien à perdre, Albert et Marine se lancent et obtiennent ensemble nonante-deux, dommage!

Mais quelles sont les chances de faire cent points ou plus à ce jeu ?

La somme des vingt dés, ce n'est rien d'autre que la somme de vingt variables identiquement distribuées.

D'après le théorème central limite, la distribution de cette somme est donc approximativement une distribution normale,

ce que nous pouvons utiliser pour calculer des probabilités.

Comment réaliser les calculs n'est pas très difficile mais toutefois un peu technique.

Et nous y consacrerons d'ailleurs une vidéo complète dans le futur.

Pour l'heure Albert,

sache que la probabilité de faire cent points ou plus,

calculée sur base de la distribution normale,

vaut 0,000043.

C'est donc assez clair, Oscar n'était pas vraiment inquiet pour sa conserve de thon.

Oh, Albert, ne fais pas cette tête !

Après tout, tu es mon petit chat, et j'aurai toujours une conserve de thon en réserve pour toi ou Marine.

Cette vidéo a été presque entièrement financée par nos fans et par le fond de développement pédagogique de la plus grande université francophone de Belgique : l'UCL.

Laura, Gwenaël et moi-même tenons à remercier du fond du coeur toutes les personnes concernées pour ce coup de pouce.

Merci pour votre attention, et à très bientôt pour une nouvelle vidéo.

Le théorème central limite Der zentrale Grenzwertsatz The central limit theorem Teorema central del límite 중심 극한 정리 De stelling van de centrale limiet Centralne twierdzenie graniczne O teorema do limite central Den centrala gränsvärdessatsen Merkezi limit teoremi 中心极限定理

Les physiciens ont la relativité générale et les élégantes équations de Maxwell. Physicists have general relativity and Maxwell's beautiful equations. Os físicos têm a relatividade geral e as elegantes equações de Maxwell

Les chimistes ont le tableau périodique des éléments. Chemists have the periodic table of elements. Os químicos têm a tabela periódica dos elementos

Les biologistes ont l'évolution, ou encore la fascinante molécule d'ADN. Biologists have evolution or the fascinating DNA molecule. Os biólogos têm a evolução, ou ainda as fascinantes moléculas de DNA

Et les statisticiens ont le théorème central limite. And statisticians have the central limit theorem. E os estatísticos têm o teorema central do limite!

Le théorème central limite, mon chat Albert n'en a jamais entendu parler. The central limit theorem? While my cat, Albert, never heard of it before, Do teorema central do limite o meu gato Alberto nunca ouviu falar...

Mais les statisticiens, eux, lui vouent un véritable culte ! statisticians truly worship it. Mas os estatísticos prestam-lhe um verdadeiro culto.

Sans le théorème central limite, la statistique ne serait que l'ombre de ce qu'elle est aujourd'hui. Without this theorem, statistics would only be the shadow of what it is today. Sem o teorema central do limite a estatística seria apenas uma sombra do que é.

Il est donc grand temps, je crois, d'expliquer à Albert de quoi il s'agit. I believe that it is time to explain to Albert what this is all about. Parece-me, assim, chegada a altura de explicar ao meu gato Alberto de que se trata.

<3 Sous-titres réalisés avec amour par Posey 1235. Merci à lui ! <3 Subtitles by Nathan; help us improve them!

Au quotidien, le statisticien travaille avec ce qu'il appelle des variables aléatoires. In their daily life, statisticians work with random variables. Os objectos com que o estatístico trabalha no dia a dia têm o nome de variáveis aleatórias

Albert, tu as encore oublié ce qu'était une variable ? Albert, have you forgotten yet again what a variable is? Alberto, ainda te lembras do que é uma variável aleatória?

Bon, je te le rappelle, mais c'est la dernière fois ! All right, let me explain this to you one more time. Vou-te dizer, mas é a última vez!

Une variable aléatoire, c'est comme une boite magique qui a pour particularité qu'à chaque ouverture, A random variable is a bit like a magical box. Each you open the box, Uma variável aleatória é uma espécie de caixa mágica que cada vez que se abre

une valeur en sort sans que l'on puisse dire ce que sera cette valeur à l'avance. some value comes out of it, this value being impossible to predict. sai um valor (número/cor/etc) sem que se possa dizer com antecedência o qual será.

Cela n'a toutefois pas empêché les statisticiens d'analyser un grand nombre de ces boites This did not prevent statisticians to analyze a large number of these boxes Tal não impediu os estatísticos de analisar uma grande quantidade dessas caixas.

et de conclure que, peu importe la boite, and to conclude that, behind any box, e de concluir que, qualquer que seja a caixa

il y a toujours ce qu'ils nomment une distribution de probabilité derrière. there is always what they call a probability distribution. há sempre uma distribuição de probabilidade por detrás.

Connaître la distribution de probabilité d'une variable est très important Albert, It's very important to know what the distribution of a variable is, Albert, Conhecer a distribuição de probabilidade de uma caixa (de uma variável aleatória) é muito importante Alberto,

car cela signifie avoir tout en main pour répondre à des questions du genre : because it gives you the ability to answer questions such as: pois isso significa que se pode responder a perguntas do género

Quelles sont les chances qu'une valeur entre -2 et 6,5 sorte ? What is the probability that a value between -2 and 6.5 comes out? Qual é a probabilidade que saia um valor entre -2 e 6.5?

Ou encore, Or, for instance, ou ainda,

Quelle est la probabilité qu'une valeur plus petite que 60 ou plus grande que 142 soit obtenue ? What is the probability that a value lower than 60 but higher than 142 will come out? Qual é a probabilidade de se obter um valor menor que 60 ou maior que 142?

Une distribution de probabilité très connue, c'est la fameuse courbe en cloche, ou distribution normale. A well-known probability distribution is the so-called bell curve or normal distribution. Uma distribuição de probabilidade muito conhecida é a famosa distribuição normal.

Mais il y en a beaucoup d'autres ; But there are many others; Mas há muitas mais,

par exemple : for instance: por exemplo:

la distribution uniforme continue, the continuous uniform distribution; a distribuição uniforme contínua,

la distribution triangulaire, the triangular distribution; a distribuição triangular,

la distribution uniforme discrète, the discrete uniform distribution; distribuição uniforme discreta,

la distribution exponentielle, the exponential distribution; a distribuição exponencial,

etc. etc. etc.

Lorsque deux variables A et B ont exactement la même distribution de probabilité, les statisticiens disent que ces variables sont identiquement distribuées. Whenever two variables A and B have the exact same probability distribution, statisticians say that these variables are *identically distributed*. Quando duas variáveis aleatórias A e B têm exactamente a mesma distribuição, os estatísticos dizem então que são identicamente distribuídas.

Pour que tu comprennes bien ce que cela signifie Albert, imagine toi avoir un clone qui vit quelques pâtés de maisons plus loin. In order for you to really understand what it means, Albert, let us imagine that you have a clone living not far from here. Para que percebas o que isso quer dizer, Alberto, imagina que tivesses um clone que vivesse a um quarteirão da tua casa,

Il est en tout point identique à toi : le pelage est le même, la taille aussi, This clone is an exact copy of you: its fur and its size are the same, e em tudo igual a ti, com a tua pelagem, com o teu tamanho,

la tendance à rendre son maître fou furieux en dormant dans le panier à linge propre également. as well as its habit to sleep in the basket of clean laundry, driving its owner mad. com a mesma tendência para pôr o dono louco por se pôr a dormir na cesta roupa lavada.

Vous êtes comme deux variables A et B qui seraient identiquement distribuées. You are like two variables A and B with the same distribution. Vocês seriam como duas variáveis A e B que fossem identicamente distribuídas.

Mais ce chat et toi êtes des êtres distincts. But this cat and you are distinct creatures. ainda que esse gato e tu fossem gatos distintos.

Ce n'est pas parce que ton clone est dans les bras de Morphée en ce moment que tu dois l'être toi aussi. It's not because your clone is sleeping right now that you have to sleep, too. mas não é por esse gato estar a dormir neste momento que tu o estarás a fazer também!...

Ce n'est pas parce que ton clone partira peut-être jouer à l'extérieur plus tard que tu en feras autant. It's not because your clone might play outside later today that you will do the same. Não é por que o teu clone vai daqui a nada brincar para a rua que tu o farás também.

Vous avez chacun votre propre vie. You both have your own life and problems. Cada um de vocês tem a sua própria vida.

Bon. All right. Bom,

Passons aux choses sérieuses. Let's get down to business. passemos às coisas sérias.

Lorsqu'il n'est pas occupé à vous présenter un graphique, Whenever a statistician isn't busy showcasing some graph, Quando não esta ocupado a apresentar um gráfico

l'une des occupations favorites du statisticien consiste à assembler des variables aléatoires pour en créer des nouvelles. one of its favorite occupation is to build new random variables using other variables. uma das ocupações favoritas do estatístico consiste em usar variáveis aleatórias para fazer outras, novas.

Si je multiplie deux variables G et H, qui ne sont pas forcément identiquement distribuées même si c'est souvent le cas, If I multiply two variables G and H that are not necessarily identically distributed although it's often the case, Se se multiplicarem duas variáveis G e H que não sejam necessariamente idênticas

Le résultat est une nouvelle variable aléatoire. the result is a new random variable. o resultado é uma nova variável aleatória.

Si je soustrais à G 5 fois la racine carrée de H, If I subtract 5 times the square root of H to G, Se se subtrair a G 5 vezes a raiz quadrada de H

là aussi, j'obtiens une nouvelle variable aléatoire. I will again get a new random variable. também se obtém uma nova variável aleatória.

Il n'y a pas vraiment de limite à ce que l'on peut faire, There is no real limit to what one can do, Não há limitações para o que se pode fazer.

mais le problème en bout de ligne sera toujours le même : but the problem at the end of the line will always be the same: mas o problema será sempre o mesmo:

lorsqu'on assemble deux ou davantage de variables, whenever we assemble two random variables into a new one, quando se juntam duas ou mais variáveis aleatórias

quelle sera la distribution de probabilité de la nouvelle variable ? what can we say about the probability distribution of this new variable? qual será a distribuição de probabilidade da nova variável aleatória?

C'est ici que les statisticiens ont découvert quelque chose qui, aujourd'hui encore, me fascine. Here, statisticians have discovered something that still fascinates me today. Foi aqui que os estatísticos descobriram um facto que ainda hoje me surpreende

Plus on assemble un grand nombre de variables aléatoires identiquement distribuées par addition, The more identically distributed random variables we assemble by addition, quanto mais se adicionam variáveis aleatórias identicamente distribuídas [com média e variância finitas]

plus la distribution de probabilité de la nouvelle variable sera proche d'une distribution normale. the more the probability distribution of the new variable will be close to a normal distribution. mais a distribuição de probabilidade da soma se aproximará de uma distribuição normal

C'est ça le théorème central limite. That's the central limit theorem. é este o teorema central do limite.

Prenons deux boites ayant une distribution exponentielle. Let's take two boxes with an exponential distribution. Peguemos em duas caixas que sigam uma distribuição exponencial.

Comme on peut le voir à l'écran, l'addition de ces deux variables ne donne pas une variable ayant une distribution normale. As we can see on the screen, the addition of these two variables is not a variable with a normal distribution. como se pode ver no écran a adição dessas duas variáveis não corresponde a uma variável que siga uma distribuição normal.

Mais à mesure que l'on va additionner toujours plus de variables ayant une distribution exponentielle, But as we add more of these variables, each with an exponential distribution, mas à medida que se vão adicionando mais variáveis que tenham uma distribuição exponencial

la distribution de la variable finale converge lentement mais sûrement vers une distribution normale. the resulting distribution converges slowly but surely towards a normal distribution. a distribuição da variável final converge lentamente para uma distribuição normal.

Et ceci fonctionne pour n'importe quelle distribution de départ. This also works for any other starting distribution. E isto funciona para qualquer distribuição inicial [com média e variância finitas]

Prenons deux variables ayant cette fois une distribution de probabilité uniforme discrète. Let us take two variables with a discrete uniform distribution. Peguemos em duas variáveis com uma distribuição de probabilidade uniforme discreta

Leur addition donne le résultat à l'écran, qui n'est clairement pas une distribution normale. Their addition gives the result on the screen, which is clearly not a normal distribution. A sua adição dá o resultado que se vê no écran e que claramente não é uma distribuição normal.

Mais à mesure que je vais additionner un nombre toujours plus grand de variables, chacune caractérisée par une distribution uniforme discrète, But as we add more of these variables, each characterized by a discrete uniform distribution, Mas à medida que se vão adicionando um número cada vez maior de variáveis uniformes discretas

on voit que la distribution de la nouvelle variable converge de façon flagrante vers une distribution normale. we can see that the distribution of the new variable converges without a doubt towards a normal distribution. vemos que a distribuição converge para uma distribuição normal.

N'est-ce pas là un phénomène extraordinaire, Albert ? Isn't this an extraordinary phenomenon, Albert? Não é extraordinário Alberto?

Tu ne sembles pas très impressionné. You don't look very impressed. Não estás com um ar muito impressionado...

Concluons donc par un exemple d'application de ce théorème. Let us conclude with an application of this theorem. Concluamos com um exemplo de aplicação deste teorema.

Oscar propose à Albert et à Marine un jeu. Oscar offers Albert and Marine to play a game. O Oscar propõe ao Alberto e à Maria um jogo.

Ces deux derniers doivent chacun lancer une dizaine de dés, Albert and Marine must each roll 10 dice, Alberto e Maria têm que lançar um dado dez vezes cada um.

et si la somme des vingts chiffres obtenus est de cent ou plus, Oscar leur offre une conserve de thon à partager. and should the sum of the twenty values be 100 or more, Oscar promises to give one tuna can to share. e se a soma dos vinte números for maior ou igual a 100, o Oscar dá-lhes uma lata de atum para partilharem.

Au pire, Albert et Marine savent qu'ils obtiendront ensemble un total de vingt points et au maximum un total de cent vingt points s'ils réalisent vingt fois six, At worst, Albert and Marine know they will get a total of 20 points and at best a total of 120 points, should they get 20 times the value of 6, Alberto e Maria sabem que terão no mínimo 20 pontos (20x 1ponto) e no máximo 120 (20x 6 pontos).

ce qui est bien sûr extrêmement peu probable. which is of course extremely unlikely. sendo que qualquer um destes dois resultados é extremamente improvável.

Mais Oscar ne leur demande pas de faire cent vingt points, il demande cent points ou plus. But Oscar does not ask for 120 points, only for 100 or more. Mas o Oscar não lhes pede para fazerem 120 pontos. Pede-lhes para fazerem no mínimo 100 pontos.

N'ayant rien à perdre, Albert et Marine se lancent et obtiennent ensemble nonante-deux, dommage! Having nothing to lose, Albert and Marine give it a try and get... 92. Too bad! Não tendo nada a perder, Alberto e Maria tentam a sua sorte e obtêm 92 pontos. Que pena!

Mais quelles sont les chances de faire cent points ou plus à ce jeu ? But what is the probability of getting 100 or more points in this game? Mas quais eram as chances de fazer 100 ou mais pontos neste jogo?

La somme des vingt dés, ce n'est rien d'autre que la somme de vingt variables identiquement distribuées. The sum of 20 dice is the same as the sum of 20 variables that are identically distributed. A soma dos 20 dados não é senão a soma das 20 variáveis identicamente distribuídas.

D'après le théorème central limite, la distribution de cette somme est donc approximativement une distribution normale, According to the central limit theorem, this sum is thus approximately normally distributed, Segundo o teorema central do limite esta variável soma aproxima-se [no limite] de uma distribuição normal

ce que nous pouvons utiliser pour calculer des probabilités. which we can use in order to calculate probabilities. que podemos utilizar para calcular probabilidades

Comment réaliser les calculs n'est pas très difficile mais toutefois un peu technique. How to get the actual probabilities is not very hard but nonetheless a bit technical, Como efectuar esses cálculos não é difícil mas é um pouco técnico

Et nous y consacrerons d'ailleurs une vidéo complète dans le futur. and we will make a video about it in the future. e deixaremos isso para um vídeo futuro.

Pour l'heure Albert, Right now, Albert, Por agora, Alberto,

sache que la probabilité de faire cent points ou plus, you just need to know that the probability of getting 100 points or more, ficas a saber que a probabilidade de fazer 100 pontos ou mais,

calculée sur base de la distribution normale, based on the normal distribution, calculada com base na distribuição normal

vaut 0,000043. is 0.000043. vale 0,000043.

C'est donc assez clair, Oscar n'était pas vraiment inquiet pour sa conserve de thon. Things are thus quite clear: Oscar was not afraid to lose his tuna can. Parece assim bastante evidente que o Oscar não estava muito preocupado com ter de dar a sua lata de atum...

Oh, Albert, ne fais pas cette tête ! Oh, Albert, don't look so sad! Ó Alberto!.. não faças essa cara!...

Après tout, tu es mon petit chat, et j'aurai toujours une conserve de thon en réserve pour toi ou Marine. After all, you're my little cat and I will always have a tuna can for you or Marine. Tu és o meu gato e terei sempre uma lata de atum de reserva para ti e para a Maria

Cette vidéo a été presque entièrement financée par nos fans et par le fond de développement pédagogique de la plus grande université francophone de Belgique : l'UCL. This video was almost entirely funded by our fans and by the "fond de développement pédagogique" of the largest French-speaking university in Belgium: the Catholic University of Louvain (in French: UCL). Este video foi financiado na sua quase totalidade pelos fans e pelo fundo de desenvolvimento pedagógico da maior universidade francófona da Bélgica: a UCLouvain

Laura, Gwenaël et moi-même tenons à remercier du fond du coeur toutes les personnes concernées pour ce coup de pouce. Laura, Gwenaël and myself wish to thank both our fans and the university for this help. A Laura, o Gwenaël e eu agradecemos do fundo dos nosso corações todos aqueles que nos têm apoiado

Merci pour votre attention, et à très bientôt pour une nouvelle vidéo. Thanks for having listened so far and see you soon for a new video :-) Obrigado a tod@s e até breve para um novo video