[Poker] L'homme face à la machine : 2-1

[Poker]

Le laboratoire de Machine Learning de l'université d'Alberta (Canada) organise depuis plusieurs années une compétition d'IA jouant au Poker. Pour la première fois cette année, une compétition parallèle "homme contre machine" a été mise en place. Le match s'est déroulé au cours de la conférence AAAI'07 à Vancouver, le 23 et 24 juillet dernier. J'ai eu la chance d'assister à quelques matchs et de prendre quelques photos (malheureusement, la qualité laisse un peu à désirer).

Le match s'est déroulé en 2000 mains de Texas Hold'em Limit (le Limit est plus facile à jouer pour une IA étant donné la faible taille de l'arbre de jeu : on ne peut à son tour que relancer d'une somme fixe - et seulement deux fois par tour d'enchère -, checker ou se coucher).

Les joueurs étaient des joueurs professionnels de haut niveau, Phil Laak et Ali Eslami qui jouaient contre le programme Polaris. Pour limiter le hasard des cartes, les deux joueurs jouaient en duplicate (les mains de Phil Laak vs Polaris étaient les mêmes que celles de Polaris vs Ali Eslami) sur quatre sessions de 500 mains.

La première session s'est soldée sur un match nul, la deuxième sur une victoire de la machine et les deux dernières sur une victoire des deux professionnels. Plus de détails sur Poker News : http://fr.pokernews.com/news/2007/7/hom ... umains.htm

Pour info, Polaris n'a pas gagné le tournoi inter-machines lancé en parallèle (sur plus de 10000 mains).

Encore quelques années avant de reproduire le match Big Blue - Kasparov sur le Hold'em No Limit ?


PS : c'était quand même rigolo de voir Laak utiliser des techniques d'intimidation, sans doute par pure habitude ou pour le public (il rugissait et insultait son adversaire à chaque gros gain) contre une machine imperturbable ;)

Tiens, je viens de remarquer que Polaris a été développé en partie par Jonathan Schaeffer, un scientifique de l'Université d'Alberta, le même qui a récemment résolu le jeu de Checkers...

D'autre part, la stratégie utilisée par le programme pour les deux rounds perdus était différente des deux premières : dans les deux derniers rounds, le programme tentait d'adopter des "attitudes" prudentes ou agressives, alors que dans les premiers rounds il jouait "au mieux".

Le jeu à un contre un est aussi plus facile pour une IA qu'une table de 8 ou 10 joueurs.

j'ai du mal a voir l'interet d'un tel programme,tant le poker est un jeu orienté bluff et psychologie,deux notions qui ne peuvent exister dans un programme informatique. :|

Hadoken_ dit:j'ai du mal a voir l'interet d'un tel programme,tant le poker est un jeu orienté bluff et psychologie,deux notions qui ne peuvent exister dans un programme informatique. :|

Pareil...à moins que l'on tente d'inventer l'ordi "intuitif"....

C'est largement sous-estimer 40 ans de recherche par des dizaines de milliers de personnes en IA que de croire qu'un ordinateur est incapable de bluffer. Le bluff est essentiellement lié à la notion d'apprentissage, et c'est quelque chose que les algorithmes les plus simples savent faire depuis des années. D'ailleurs une simple IA d'apprentissage suffit pour battre un humain au pierre-papier-ciseaux avec un rapport de près de 60%.

Le logiciel de Poker est tout à fait capable de bluffer, d'analyser le jeu de son adversaire et de déjouer des stratégies. J'ai joué contre Polaris une dizaine de minutes, le temps de faire une cinquantaine de mains. J'ai été battu assez largement, et j'ai eu le temps de voir le jeu de l'ordinateur évoluer : très prudent au début (il se couchait très fréquemment en pré-flop) puis nettement plus agressif quand il s'est rendu compte que je misais souvent avec un jeu très moyen, sur des espoirs de quintes ou flushs. En fait, il était très rare que je le batte au showdown : soit il avait un meilleur jeu que moi, soit il se couchait avant. En cela, il a très bien "appris" mon jeu (mais je ne suis pas un grand joueur !)

En ce qui concerne la psychologie, on peut considérer que l'on joue contre une "poker face" totalement imperturbable, et à haut niveau de jeu, c'est plutôt courant : il est bien connu que savoir contrôler ses émotions est une des premières choses à savoir faire pour bien jouer au poker. D'autre part, l'ordinateur ne va pas non plus à chercher à intimider son adversaire ou exploiter les faiblesses psychologiques de son adversaire : tout se joue sur la stratégie des relances. D'un point de vue scientifique, c'est déjà énorme.

Oui, ca ne simule qu'un joueur de poker online en fait.