Du double guessing au hasard

yzar · Janvier 24, 2013, 8:52

Bonjour,

En jouant à quelques jeux basés sur le double guessing, j'ai l'impression que plus on joue avec les mêmes personnes plus cela devient intéressant dans un premier temps, en effet c'est là que l'on cherche à savoir ce que pense l'autre...

Dans un second temps (après quelques parties de plus) , j'ai l'impression que de toute façon on ne peut plus savoir ce que vont jouer les adversaires, et que cela s'apparente à du hasard pur. (je joue ça car il va penser que je pense qu'il va jouer ça, bon en même temps il sait bien que je pense ça donc ben je met ça au hasard....)

Qu'en pensez vous?

edit : grosse faute

arbre2vie · Janvier 24, 2013, 9:09

Yzar dit:
Quand pensez vous?

Tout le temps.

oi-lionheart · Janvier 24, 2013, 9:11

arbre2vie dit:
Yzar dit:
Quand pensez vous?

Tout le temps.

sylfraor · Janvier 24, 2013, 9:13

Il faut lire la théorie du poker de Sklansky pour voir que pas mal de gens ont travaillé sur le sujet.

En résumé, il est avéré qu'il devient plus efficace de jouer réellement au hasard sur un coup si on est dans une situation où l'autre joueur va fort probablement anticiper notre choix.

Attention, pas faire tout au hasard, mais uniquement face aux choix où deux vraies options existent et où la force du choix est dans la surprise pour l'adversaire. Si lui aussi a conscience de ce choix et qu'il a beaucoup d'information lui permettant de vous "lire", alors vous réduisez ses chances d tomber juste en prenant la décision selon un processus aléatoire.

Toutefois, cela signifie aussi que si l'interêt du jeu est sur ce double guessing, ben, il reste à trouver d'autres jeux ou d'autres joueurs.

tt-a591c296c9ef0a4de07abd2cc4aafd9e · Janvier 24, 2013, 10:25

L'astuce est qu'un être humain est incapable de jouer complètement au hasard, il y a toujours quelque chose qui va l'influencer, des schémas qu'il sera incapable d'éviter. C'est comme ça qu'on arrive à faire des programmes informatiques qui battent des humains au pierre/papier/ciseaux.

En plus de ça, il est souvent possible de « lire » la gestuelle de l'adversaire pour anticiper ses coups.

Je trouve que le jeu Geister est particulièrement intéressant pour jouer là dessus.

docky · Janvier 24, 2013, 10:30

scand1sk dit:C'est comme ça qu'on arrive à faire des programmes informatiques qui battent des humains au pierre/papier/ciseaux.

Cela ne me parait pas inconcevable dans l'absolu. La base de calcul étant 50 % de victoires sur des duels, quelle serait la statistique obtenue par le programme pour en conclure qu'il est performant face à l'homme ?

tt-a591c296c9ef0a4de07abd2cc4aafd9e · Janvier 24, 2013, 10:57

Docky dit:
scand1sk dit:C'est comme ça qu'on arrive à faire des programmes informatiques qui battent des humains au pierre/papier/ciseaux.

Cela ne me parait pas inconcevable dans l'absolu. La base de calcul étant 50 % de victoires sur des duels, quelle serait la statistique obtenue par le programme pour en conclure qu'il est performant face à l'homme ?

Un peu moins de 60%, ici par exemple : http://www.essentially.net/rsp/index.jsp

Une recherche de « rock paper scissors ai » donne plusieurs résultats sur Google, certains avec des IA sans doute meilleures que mon lien.

docky · Janvier 24, 2013, 10:59

Merci pour l'information. Bonne journée.

tt-ec95db8584a386aa5870cb4cdf3ec394 · Janvier 24, 2013, 11:02

Docky dit:
scand1sk dit:C'est comme ça qu'on arrive à faire des programmes informatiques qui battent des humains au pierre/papier/ciseaux.

Cela ne me parait pas inconcevable dans l'absolu. La base de calcul étant 50 % de victoires sur des duels, quelle serait la statistique obtenue par le programme pour en conclure qu'il est performant face à l'homme ?

Tout dépend du nombre de parties!

Sur dix parties, une victoire de l'ordinateur sera significative à 70 ou 80% tandis que sur 1000 parties, elle sera significative à 55 ou 60% et sur 100.000 parties c'est peut-être à partir de 52 % de victoire pour l'ordinateur que l'on pourra dire que sa supériorité ne doit rien au hasard!

Je donne les chiffres en tant qu'ordre de grandeur et non en tant que vérité mathématique.

tt-a591c296c9ef0a4de07abd2cc4aafd9e · Janvier 24, 2013, 11:12

Sur le lien que je donne, c'est 59,44% de victoires pour 464 000 parties. Je pense que c'est largement significatif.

beri · Janvier 24, 2013, 12:20

Comment je le fume ton programme
Il a dû gagner une manche, moi 5 ou 6.

Pour revenir au sujet, je me suis souvent fait la réflexion que le double-guessing était finalement une fausse bonne idée. Ca a l'air malin a première vue, mais en fin de compte, c'est vrai que c'est dur de prévoir ce que va faire l'autre si les deux joueurs jouent aussi finement. Après quand plusieurs paramètres rentrent en ligne de compte pour le choix de l'option, ça peut être plus intéressant.

seb42 · Janvier 24, 2013, 2:15

beri dit:Pour revenir au sujet, je me suis souvent fait la réflexion que le double-guessing était finalement une fausse bonne idée. Ca a l'air malin a première vue [...]

Oui, mais le principal argument en faveur du double-guessing, c'est que c'est amusant pour le cerveau humain qui prend en compte des facteurs psychologiques(le "connais ton adversaire" de Sun Tzu). C'est d'ailleurs pour cette raison qu'il n'est pas très intéressant d'un point de vue ludique de jouer contre une machine (bien que ce soit très intéressant dans le cadre de l'étude des sciences cognitives).
D'ailleurs, de mon point de vue tous les jeux ne faisant pas intervenir d'aléatoire ni de contraintes physiques ou temporelles (donc les jeux combinatoires à informations complètes, dits jeux abstraits par ici) se réduisent ludiquement à des situations de double-guessing. Pour préciser par un exemple, ce que je veux dire est qu'une partie d'échecs sans horloge n'est finalement qu'un cas de double-guessing si on veut y trouver un intérêt ludique (c'est-à-dire de ne pas paralyser le jeu par une étude exhaustive de toutes les possibilités, accepter ses limites humaines, et donc tenter des voies stratégiques (équivalent du choix pierre/feuille/ciseaux) sans en calculer par avance toutes les conséquences... bref jouer au jeu d'échecs sans horloge). Bien sûr, tout l'intérêt réside dans le fait que le choix entre une variante Smyslov, une attaque Panov et une variante d'avance sur une défense Caro-Kann semble beaucoup plus intéressant pour notre cerveau humain qu'un choix entre une pierre, une feuille et des ciseaux.

beri dit:[...] mais en fin de compte, c'est vrai que c'est dur de prévoir ce que va faire l'autre si les deux joueurs jouent aussi finement.

C'est ce paradoxe ("jouer finement" ne peut pas être défini par "prévoir que l'adversaire va jouer finement") qui donne tout l'intérêt du double-guessing d'un point de vue ludique. Sans composante psychologique (exemple du jeu contre une machine), on perd l'espoir de pouvoir surmonter ce paradoxe et donc l'intérêt du jeu.

beri dit:Après quand plusieurs paramètres rentrent en ligne de compte pour le choix de l'option, ça peut être plus intéressant.

Entièrement d'accord, et ça rejoint ce que j'écrivais plus haut sur les échecs.

Bref, pour moi le double-guessing est une super bonne idée du point de vue ludique, encore faut-il que les choix soient assez motivants pour nous faire accepter de mouliner du ciboulot afin de nous divertir.

Seb42, stone

docky · Janvier 24, 2013, 2:20

Pour moi, les échecs, c'est du mini-max plutôt que du double guessing. Bon, ça n'enlève rien à l'intérêt de ton intervention.

seb42 · Janvier 24, 2013, 2:36

Docky dit:Pour moi, les échecs, c'est du mini-max plutôt que du double guessing. Bon, ça n'enlève rien à l'intérêt de ton intervention.

D'un point de vue théorie des jeux, je suis d'accord. Mais d'un point de vue ludique, je n'y crois pas. Pour faire des choix stratégiques, on commence par faire du mini-max (surtout pour les coups tactiques) mais il est humainement impossible (et en plus je ne pense pas que ça ait un intérêt ludique) d'aller au bout du raisonnement (exhauster tous les possibles) pour finaliser sa décision. A un moment de la réflexion, il faut faire un choix qui va se baser sur un ressenti de double-guessing. C'est pour cette raison que des styles de jeux et des profils de joueurs se distinguent. Un joueur A va être plus à l'aise contre un joueur B qui va lui-même être plus à l'aise contre un joueur C alors que ce dernier aura plus de difficultés face au jeu de A.

En tout cas, c'est que je pense. Je trouve de l'intérêt ludique aux échecs sans horloge si je le prends comme un jeu de double-guessing, alors que je ne m'y amuserais pas si c'était seulement un problème d'optimisation (bien que ce problème est réel et très intéressant d'un point de vue théorique).

Seb42, qui se demande du coup ce que pourrait en penser un cyborg

tt-46718dd32691ae4ded1837f47c75d4b6 · Janvier 24, 2013, 3:18

Dans un min-max, tu ne vas pas forcement au bout du raisonnement c'est à dire jusqu'à des feuilles indiquant Victoire ou Défaite. Tu peux t'arrêter à une certaine profondeur, quitte à avoir un effet d'horizon, en évaluant le jeu n coups plus loin grâce à une fonction fitness.

Ca ne me semble pas très différent d'un raisonnement humain où je vais essayer d'évaluer les différentes positions après quelques coups. D'autant plus que les fonctions fitness sont très souvent conçues de manière empirique par un humain.

D'ailleurs quand on joue contre une IA, on ne joue pas contre un joueur parfait (sauf jeu facile à explorer), mais indirectement contre un humain qui a créé la fonction d'évaluation qu'on affronte.

superdefi · Janvier 24, 2013, 3:35

Pour la madeleine deux sujets chauds de 2004 :
http://www.trictrac.net/jeux/forum/view ... hp?t=10065

le-zakhan-noir · Janvier 24, 2013, 3:41

scand1sk dit:L'astuce est qu'un être humain est incapable de jouer complètement au hasard, il y a toujours quelque chose qui va l'influencer, des schémas qu'il sera incapable d'éviter.

Là je ne suis pas d'accord. Si je décide, selon ce qui a été dit plus haut, de jouer au hasard pour troubler un bon joueur, crois moi je le fais à 100%! Par exemple, je lance ouvertement un dé si c'est divisible en parts égales (en gardant la répartition pour moi évidemment) ou genre au Trône de fer, je mélange les cartes combat et j'en prends une au hasard...
aucune influence exterieure là dedans

La difficulté à la limite c'est si tu veux choisir au hasard sans que l'autre le sache. Là il faut ruser pour être discret, mais c'est un autre problème

tt-a591c296c9ef0a4de07abd2cc4aafd9e · Janvier 24, 2013, 3:53

le Zakhan noir dit:
scand1sk dit:L'astuce est qu'un être humain est incapable de jouer complètement au hasard, il y a toujours quelque chose qui va l'influencer, des schémas qu'il sera incapable d'éviter.

Là je ne suis pas d'accord. Si je décide, selon ce qui a été dit plus haut, de jouer au hasard pour troubler un bon joueur, crois moi je le fais à 100%! Par exemple, je lance ouvertement un dé si c'est divisible en parts égales (en gardant la répartition pour moi évidemment) ou genre au Trône de fer, je mélange les cartes combat et j'en prends une au hasard...
aucune influence exterieure là dedans
La difficulté à la limite c'est si tu veux choisir au hasard sans que l'autre le sache. Là il faut ruser pour être discret, mais c'est un autre problème

Ah ben oui effectivement si tu utilises une source extérieure de hasard, c'est facile (en supposant que la source extérieure soit fiable). Ce que je prétends, c'est que sans cette source extérieure, tu ne peux pas vraiment choisir au hasard, avec une répartition équiprobable des possibilités. Et que sachant ça, il n'est pas impossible de « lire » le jeu d'un être humain qui prétend jouer au hasard.

jeremie · Janvier 24, 2013, 3:53

Si un joueur me sort un dé (supposément non truqué) pour prendre une décision au hasard, j'intègre cela dans ma prise de décision. Si le choix est "important" cela risque fort de le conduire à la défaite.

Rock-Paper-Scissors (aka Rochambeau) a fait l'objet de compétition internationales pour les machines. Je me souviens que la première compétition a été gagnée par un programme appelé iocaine dont le source est disponible sur le net. Geenberg a gagné la seconde compétition en se basant sur des estimateurs de distances distributionnelles. Je ne sais pas ce que donnent ces programmes contre des humains "forts", mais Mr tout le monde finit invariablement par perdre.

Le point qui prête un peu à confusion dans Rochambeau c'est que l'équilibre de Nash (stratégie non dominée) est de jouer au hasard. Evidemment dans un tournoi ce ne serait pas un très bon joueur (50% de victoires => milieu du classement). Tout le sel du jeu est de modéliser le comportement de son adversaire plus vite que lui ne le fait.

Après sur des jeux type poker, il est étonnant de noter que les pros (au prix d'un ennui mortel) parviennent à jouer pas loin de l'équilibre de Nash.

la-guigne · Janvier 24, 2013, 4:05

Il y a des joueurs de poker (de mémoire Dan Harrington en parle dans un de ses bouquins) qui utilisent leur montre comme générateur aléatoire afin de varier leurs coups. Par exemple, si ils décident de jouer un situation donnée 80% du temps d'une manière et 20% d'une autre, tout dépendra de la position de la trotteuse de leur montre au moment de prendre leur décision. C'est particulièrement bien adapté au poker...