×

Usamos cookies para ayudar a mejorar LingQ. Al visitar este sitio, aceptas nuestras politicas de cookie.


image

Science Étonnante, (#29) Jeu de go et intelligence artificielle — À chaud ! #2 - YouTube

(#29) Jeu de go et intelligence artificielle — À chaud ! #2 - YouTube

Bonjour à tous

Aujourd'hui, je voulais vous faire une petite vidéo de réaction à chaud

à cet événement qui est en train de secouer le monde de l'intelligence artificielle

et le monde du jeu de go.

Je veux parler du fait qu'un algorithme, un programme informatique, qui s'appelle "alpha go",

qui a été développé par une filiale de Google,

vient de battre Lee Sedol qui est un des meilleurs joueurs de go du monde

à l'heure actuelle, si ce n'est le meilleur.

Alors, ça peut paraître un peu étonnant que tout le monde s'excite sur cette nouvelle là quand on sait que ça fait à peu près vingt ans qu'un ordinateur a battu le champion du monde d'échecs.

Quelque part, on pourrait penser que c'est pas surprenant qu'il se passe la même chose avec le Go.

Et même on pourrait être surpris que ça ait pris vingt ans pour qu'on arrive à faire avec le go ce qu'on savait déjà faire avec les échecs.

Donc aujourd'hui je voudrais vous expliquer pourquoi le jeu de go et le jeu d'échecs sont vraiment très différents.

Qu'est ce qui explique qu'on ait mis si longtemps avant d'avoir une forme d'intelligence artificielle capable

de battre le meilleur joueur de go du monde, ou l'un des meilleurs joueurs de go du monde ?

Et aussi vous expliquer pourquoi un certain nombre de personnes pensaient que ça prendrait encore plus longtemps.

Ils attendaient plutôt ça pour dans dix ou quinze ans.

Pour comprendre ça, il faut se pencher un peu sur les règles du go.

Alors moi je ne suis pas joueur mais je vais essayer de vous expliquer basiquement le fonctionnement des règles.

Donc le go c'est un jeu qui se joue à deux joueurs,

l'un prend les noirs et l'autre prend les blancs,

et ça ne se joue pas sur un damier ou un échiquier, ça se joue sur une grille.

C'est une grille qui s'appelle le goban je crois.

C'est une grille de dix-neuf par dix-neuf.

Et donc le principe du jeu c'est que chaque joueur a des pions,

(alors on appelle pas ça des pions au go, on appelle ça des pierres),

et chaque fois que c'est son tour de jouer, il prend une de ses pierres et il la pose sur une intersection de la grille sur le plateau.

La différence avec un jeu comme les échecs ou les dames,

c'est que les pierres, un fois posées, elle ne bougent pas.

Il n'y a pas de notion de déplacement, de mouvement des pierres sur le plateau, pas du tout.

En fait c'est très simple :

Chaque joueur, à son tour de jouer, prend une de ses pierres et la pose sur une des intersections de la grille.

Et donc quand on démarre le plateau est vide,

et au fur et à mesure de la partie, le plateau se rempli.

Et alors, c'est quoi le but du jeu ?

En gros c'est d'encercler des territoires.

Et notamment d'encercler des pions de l'adversaire,

si jamais vous encerclez des pions de l'adversaire, vous pouvez les capturer.

Et donc voilà, c'est comme ça qu'on marque des points.

Voilà en gros pour les règles du jeu de go.

Alors maintenant, essayons de comprendre.

Qu'est ce qu'il faudrait qu'on fasse si on voulait faire un algorithme

qui soit capable de jouer au go ?

Alors, on va se placer tout simplement dans la situation du jeu d'échecs.

Imaginez que vous êtes un programme informatique,

vous êtes en train de jouer au échecs, vous êtes au milieu d'une partie.

C'est à vous de jouer, vous devez décider quel est le prochain coup à jouer.

Il y a une méthode qui est assez simple et qu'on peut faire si on est un ordinateur,

c'est tout simplement d'essayer tous les coups possibles.

Imaginons que vous êtres dans une certaine position, vous regardez tous les coups possibles.

Et puis, pour aller plus loin on peut ne pas seulement regarder tous les coups qu'on peut jouer,

mais on peut aussi regarder toutes les réponses possibles

que l'adversaire peut faire à ces coups là.

Et puis on peu pousser plus loin,

c'est à dire qu'on peut regarder toutes les réponses qu'on peut faire à ces réponses.

Et on peut faire ça sur plusieurs niveaux et envisager toutes les situations possibles

en anticipant trois, quatre, cinq ou six coup par exemple.

On anticipe toutes les situations possibles sur un certain nombre de coups,

on regarde quelle est l'issue la plus favorable pour nous,

et puis on décide de jouer le coup correspondant. Ca c'est une méthode assez brutale.

On l'appelle recherche en arbre, pour une raison assez évidente,

on construit l'arbre de toutes les possibilités sur plusieurs coups

et on choisi le coup qui nous avantage le plus.

Ca au échecs, ça peut marcher relativement bien.

Ça demande pas mal de puissance de calcul

mais une technique comme ça peut donner d'assez bons résultats.

Au go, une méthode comme ça, ça marche pas du tout.

Il y a une raison pour ça :

quand vous jouez au go,

le nombre de possibilités de coups est bien plus important qu'aux échecs.

Aux échacs, à un moment donné de la partie,

il y a, en gros, une vingtaine ou ou trentaine de coups différents possibles.

Je crois qu'au tout début de la partie, pour l'ouverture (le premier coup), il y a vingt coups possibles.

Et puis après ça augmente un peu, mais ça tourne autour d'une trentaine de coups possibles.

Au go, quand vous commencez la partie,

la grille est vide.

Et c'est une grille de dix-neuf par dix-neuf, donc il y a trois cent soixante et une positions possibles.

Quand l'adversaire va répliquer, il a 360 positions possibles, et ainsi de suite.

Donc vous voyez que le nombre de coups possibles à un moment donné de la partie

est beaucoup plus important au go qu'aux échecs.

Et ça, ça augmente beaucoup la complexité d'une recherche en arbre

parce qu'on peut anticiper maximum quelques coups

mais ça devient très difficile d'anticiper au-delà parce qu'il faudrait une puissance de calcul vraiment démentielle.

Donc ça c'est vraiment une première différence essentielle entre le jeu de go

et le jeu d'échecs qui fait qu'une recherche en arbre brutale ne marche pas très bien.

Il y a une deuxième différence essentielle, c'est que quand vous faites une recherche en arbre

Je vous ai dit donc vous anticipez sur plusieurs coups à l'avance

Et puis vous regardez une fois joués plusieurs coups

Une fois simulés plusieurs coups, quelle est la situation la plus avantageuse.

Pour faire ça vous avez besoin d'un critère pour décider : Qu'est-ce que ça veut dire "une situation est plus avantageuse qu'une autre".

C'est-à-dire que vous avez besoin d'un critère de décision pour comparer les issues possibles et décider laquelle est la plus favorable pour vous

Faire ca au échecs, c'est pas extrêmement compliqué

Si vous savez jouer un peu aux échecs et que vous regardez un plateau avec une partie en cours de route,

Vous êtes capable de juger, à peu près, lequel des deux joueurs est le mieux barré

donc ont peut asser facilement évaluer la force d'une position aux échec

(#29) Jeu de go et intelligence artificielle — À chaud ! #2 - YouTube (#29) Go-Spiel und künstliche Intelligenz - Heiße Sache! #2 - YouTube (#29) Go game and artificial intelligence - Hot! #2 - YouTube (#29) Go-game en kunstmatige intelligentie - Vers van de pers! #2 - YouTube (#29) Gra Go i sztuczna inteligencja - À chaud! #2 - YouTube

Bonjour à tous Hello everyone

Aujourd'hui, je voulais vous faire une petite vidéo de réaction à chaud Today, I would like to make a little video for you reacting in the heat of the moment

à cet événement qui est en train de secouer le monde de l'intelligence artificielle about this event that is shaking the world of artificial intelligence

et le monde du jeu de go. and the world of the game of Go.

Je veux parler du fait qu'un algorithme, un programme informatique, qui s'appelle "alpha go", I want to talk about the fact that an algorithm, a computer program, called "Alpha Go",

qui a été développé par une filiale de Google, which has been developed by an affiliate of Google,

vient de battre Lee Sedol qui est un des meilleurs joueurs de go du monde just beat Lee Sedol, one of the best Go players in the world,

à l'heure actuelle, si ce n'est le meilleur. if not the best.

Alors, ça peut paraître un peu étonnant que tout le monde s'excite sur cette nouvelle là So, it can seem a bit surprising that everyone is excited about this quand on sait que ça fait à peu près vingt ans qu'un ordinateur a battu le champion du monde d'échecs. when we know that it's been close to twenty years since a computer beat the world champion of chess.

Quelque part, on pourrait penser que c'est pas surprenant qu'il se passe la même chose avec le Go. Somehow, one would think that it's not surprising that the same thing happened with Go.

Et même on pourrait être surpris que ça ait pris vingt ans pour qu'on arrive à faire avec le go ce qu'on savait déjà faire avec les échecs. And we could even be surprised that it has taken twenty years to do what we've done with Go what we already knew how to do with chess.

Donc aujourd'hui je voudrais vous expliquer pourquoi le jeu de go et le jeu d'échecs sont vraiment très différents. So today I would like to explain to you why Go and chess are really very different.

Qu'est ce qui explique qu'on ait mis si longtemps avant d'avoir une forme d'intelligence artificielle capable Which explains why it has taken so long to have a form of artificial intelligence capable

de battre le meilleur joueur de go du monde, ou l'un des meilleurs joueurs de go du monde ? of beating the best Go player in the world, or one of the best?

Et aussi vous expliquer pourquoi un certain nombre de personnes pensaient que ça prendrait encore plus longtemps. And also to explain to you why some people thought that it would take even longer.

Ils attendaient plutôt ça pour dans dix ou quinze ans. They thought it would take another ten or fifteen years.

Pour comprendre ça, il faut se pencher un peu sur les règles du go. To understand this, we have to take a look at the rules of Go.

Alors moi je ne suis pas joueur mais je vais essayer de vous expliquer basiquement le fonctionnement des règles. I don't play Go, but I'll try to explain basically how the rules work.

Donc le go c'est un jeu qui se joue à deux joueurs, So Go is a game which has two players,

l'un prend les noirs et l'autre prend les blancs, one uses black and the other uses white,

et ça ne se joue pas sur un damier ou un échiquier, ça se joue sur une grille. and it isn't played on a checkerboard or chess board, it's played on a grid.

C'est une grille qui s'appelle le goban je crois. I think it's called a goban.

C'est une grille de dix-neuf par dix-neuf. The grid is nineteen by nineteen,

Et donc le principe du jeu c'est que chaque joueur a des pions, And so the idea of the game is that each player has pieces,

(alors on appelle pas ça des pions au go, on appelle ça des pierres), but we don't call them Go pieces, we call them stones,

et chaque fois que c'est son tour de jouer, il prend une de ses pierres et il la pose sur une intersection de la grille sur le plateau. and every time it's their turn to play, they take one of their stones and put it on the intersection of grid lines on the board.

La différence avec un jeu comme les échecs ou les dames, The difference with a game like chess or checkers

c'est que les pierres, un fois posées, elle ne bougent pas. is that the stones, once placed on the board, don't move.

Il n'y a pas de notion de déplacement, de mouvement des pierres sur le plateau, pas du tout. There is no notion of shifting or moving of the stones at all on the board, not at all.

En fait c'est très simple : Actually it's very simple:

Chaque joueur, à son tour de jouer, prend une de ses pierres et la pose sur une des intersections de la grille. each player, on their turn, takes one of their stones and puts it one of the grid intersections.

Et donc quand on démarre le plateau est vide, And so when you start, the board is empty,

et au fur et à mesure de la partie, le plateau se rempli. and over the course of the game, the board fills in.

Et alors, c'est quoi le but du jeu ? So what's the object of the game?

En gros c'est d'encercler des territoires. Overall, it is to encircle territories

Et notamment d'encercler des pions de l'adversaire, and notably to encircle the pieces of the other player,

si jamais vous encerclez des pions de l'adversaire, vous pouvez les capturer. and if you ever completely surround their pieces, you can capture them.

Et donc voilà, c'est comme ça qu'on marque des points. And so that is how we keep score.

Voilà en gros pour les règles du jeu de go. So those are the rules of Go.

Alors maintenant, essayons de comprendre. Now, we'll try to understand:

Qu'est ce qu'il faudrait qu'on fasse si on voulait faire un algorithme What do we need to do if we wanted to make an algorithm

qui soit capable de jouer au go ? that is able to play Go?

Alors, on va se placer tout simplement dans la situation du jeu d'échecs. To start, let's look at the situation when it comes to Chess.

Imaginez que vous êtes un programme informatique, Imagine that you're a computer program,

vous êtes en train de jouer au échecs, vous êtes au milieu d'une partie. you're playing chess, and you're in the middle of a game.

C'est à vous de jouer, vous devez décider quel est le prochain coup à jouer. It's your turn to play, you have to decide the next move.

Il y a une méthode qui est assez simple et qu'on peut faire si on est un ordinateur, There is a pretty simple method which you can try if you're a computer,

c'est tout simplement d'essayer tous les coups possibles. and that is simply trying all the possible moves.

Imaginons que vous êtres dans une certaine position, vous regardez tous les coups possibles. Let's imagine that you're in a certain spot, and you see all the possible moves.

Et puis, pour aller plus loin on peut ne pas seulement regarder tous les coups qu'on peut jouer, And to go farther, you can't just see all the moves that you can make,

mais on peut aussi regarder toutes les réponses possibles but you can also see all of the possible responses

que l'adversaire peut faire à ces coups là. that the other player could make to those moves.

Et puis on peu pousser plus loin, And then we can push farther,

c'est à dire qu'on peut regarder toutes les réponses qu'on peut faire à ces réponses. that is, we can see all the responses that one could make to those responses.

Et on peut faire ça sur plusieurs niveaux et envisager toutes les situations possibles And we can do that for many levels and envision all the possible situations

en anticipant trois, quatre, cinq ou six coup par exemple. by anticipating three, four, five, or six moves for example.

On anticipe toutes les situations possibles sur un certain nombre de coups, We predict all the possible situations for a certain number of moves,

on regarde quelle est l'issue la plus favorable pour nous, we see which one is the most favorable for us,

et puis on décide de jouer le coup correspondant. and then we decide to play the corresponding move. Ca c'est une méthode assez brutale. This is a somewhat brutal method.

On l'appelle recherche en arbre, pour une raison assez évidente, We call it a tree search, for an obvious reason,

on construit l'arbre de toutes les possibilités sur plusieurs coups we construct the tree with all the possibilities for many moves

et on choisi le coup qui nous avantage le plus. and we chose the move that benefits us the most.

Ca au échecs, ça peut marcher relativement bien. For chess, this works relatively well,

Ça demande pas mal de puissance de calcul it requires not a bad amount of computing power,

mais une technique comme ça peut donner d'assez bons résultats. but a technique like that can give pretty good results.

Au go, une méthode comme ça, ça marche pas du tout. In Go, a method like this does not work at all.

Il y a une raison pour ça : There is a reason for this:

quand vous jouez au go, when you play go,

le nombre de possibilités de coups est bien plus important qu'aux échecs. the number of possibilities of moves is much more important than in chess.

Aux échacs, à un moment donné de la partie, In chess, at any moment in the game,

il y a, en gros, une vingtaine ou ou trentaine de coups différents possibles. there are about twenty or thirty different possible moves.

Je crois qu'au tout début de la partie, pour l'ouverture (le premier coup), il y a vingt coups possibles. I believe at the very beginning of the game, for the first move, there are twenty possible moves.

Et puis après ça augmente un peu, mais ça tourne autour d'une trentaine de coups possibles. After that, it grows a bit, but it turns out to be about thirty possible moves.

Au go, quand vous commencez la partie, In Go, when you start the game,

la grille est vide. the grid is empty.

Et c'est une grille de dix-neuf par dix-neuf, donc il y a trois cent soixante et une positions possibles. And this is a grid of 19 by 19, so there are 361 possible positions.

Quand l'adversaire va répliquer, il a 360 positions possibles, et ainsi de suite. When the other person responds, there are 360 possible positions, and so on.

Donc vous voyez que le nombre de coups possibles à un moment donné de la partie So you see that the number of possible moves at any given moment of the game

est beaucoup plus important au go qu'aux échecs. is much more important in Go than in chess.

Et ça, ça augmente beaucoup la complexité d'une recherche en arbre And that really increases the complexity of a tree search

parce qu'on peut anticiper maximum quelques coups because we can predict at most a few moves

mais ça devient très difficile d'anticiper au-delà parce qu'il faudrait une puissance de calcul vraiment démentielle. but it becomes very difficult to predict beyond this because you would need a crazy amount of computing power.

Donc ça c'est vraiment une première différence essentielle entre le jeu de go So that's one essential difference between Go

et le jeu d'échecs qui fait qu'une recherche en arbre brutale ne marche pas très bien. and Chess that makes it so a brute force tree search doesn't work very well.

Il y a une deuxième différence essentielle, c'est que quand vous faites une recherche en arbre There's a second essential difference, and that is when you make a tree search,

Je vous ai dit donc vous anticipez sur plusieurs coups à l'avance I told you that you predict several moves in advance,

Et puis vous regardez une fois joués plusieurs coups and then you look at one move several times,

Une fois simulés plusieurs coups, quelle est la situation la plus avantageuse. Once simulated several times, what is the most advantageous situation.

Pour faire ça vous avez besoin d'un critère pour décider : Qu'est-ce que ça veut dire "une situation est plus avantageuse qu'une autre". To do this you need criteria to decide: what would be "a situation more advantageous than the others"?

C'est-à-dire que vous avez besoin d'un critère de décision pour comparer les issues possibles et décider laquelle est la plus favorable pour vous This is to say that you need a criteria to compare the possible outcomes and decide which one is the most favorable for you.

Faire ca au échecs, c'est pas extrêmement compliqué To do that in Chess, it's not extremely complicated.

Si vous savez jouer un peu aux échecs et que vous regardez un plateau avec une partie en cours de route, If you know how to play chess a bit, and you see a board with a game being played,

Vous êtes capable de juger, à peu près, lequel des deux joueurs est le mieux barré you're capable of judging, almost, which of the two players is better defended

donc ont peut asser facilement évaluer la force d'une position aux échec and so one can easily evaluate the strength of a position in Chess