Romain
Romain
Bonjour à tous,

Le but de ce message est de décrire les méthodes de classement de TricTrac, de façon la plus objective possible.

Préambule et mise en garde

J’aimerais commencer par les limites du système de notation et des classements en général. Au moment d'écrire ces lignes, il y a environ 3000 personnes qui ont laissé près de 48 000 avis sur TricTrac. Parmi ces personnes, il y en a qui ne donneront jamais un 5/5, car cela sous-entendrait la perfection et rien n’est parfait. D’autres aiment tellement les jeux qu’ils donneront un 5/5 à tous les jeux. Si on peut avoir une confiance relative qu’un joueur donnera une meilleure note à ses préférés, il est périlleux de comparer des jeux sur des notes données par différentes personnes. C’est pourtant ce que fait un classement en comparant la moyenne des notes de jeux.

Un autre problème est que les jeux sont de genre parfois complètement différent si bien que l’on se demande si on ne compare pas des pommes avec des oranges. Peut-on avoir dans un même classement un jeu pour amuser un groupe, un jeu stratégique multi-joueurs, un jeu abstrait à deux, un jeu pour enfant et un wargame? Plusieurs en doute.

Sans oublier que selon le moment et l’humeur un joueur peut donner une note différente à un même jeu.

Malgré ses faiblesses, un classement est utile pour pointer vers ce que vos comparses ont aimé ou pas. Il est bon de se rappeler qu’un top de classement n’est pas une garantie que vous allez aimer. Vous devriez avant d’acheter, lire sa description et des comptes rendus de partie pour voir si c'est un type de jeu qui vous convient et l’essayer si vous en avez la chance. Mais devant la multitude de choix qui s'offre à vous, il vous faut un outil pour vous guider dans vos recherches et malgré ses imperfections le classement est cet outil.

Le premier classement qui nous vient à l’esprit est basé sur le calcul de la moyenne brute. De plus, les classements Finkel et Bayes, sont aussi basés sur la moyenne. Il est donc important de bien comprendre ce qu’est une moyenne. Les mathématiciens peuvent sauter la prochaine section, je vais tenter d'expliquer le plus simplement possible ce que signifie une moyenne.

La moyenne brute

La moyenne des avis est tout simplement la somme de toutes les notes divisées par le nombre de notes. Par exemple, si six personnes donnent les notes 3, 4, 4, 5, 5 et 5, cela va donner une moyenne de
(3+4+4+5+5+5)/6= 26/6 = 4,33. Si nous appelons cela une moyenne brute, c’est parce que les autres méthodes font des modifications à cette moyenne.

Puisque les notes vont de 1 à 5, la moyenne brute sera toujours comprise entre ces chiffres. Le zéro n’étant pas une note possible, un jeu moyen qui a autant d'avis favorables que défavorables aura une moyenne de 3 et non pas de 2,5 comme on pourrait le penser à prime abord.

La moyenne de plus de 40 000 notes sur TricTrac (i.e. toutes les notes, sur tous les jeux) était de 3,69 le 1er octobre 2006.

Comparer deux jeux qui ont des centaines d’avis et des moyennes de 4,3 et 4,7 peut sembler un exercice futile. Pour noter nous n’avons le choix qu’entre des nombres entiers et nous avons parfois de la difficulté à choisir entre un 4 et un 5. Lorsqu’il n’y a qu’une différence de 0,4 cela parait très peu. Nous sommes certainement en présence de deux excellents jeux dont la grande majorité des avis doivent être des 4 et des 5. Supposons pour simplifier que justement ce ne sont que des 4 et 5. Une moyenne de 4,3 voudrait dire que pour chaque groupe de trois personnes qui auraient donné un 5/5, il y aurait sept personnes qui auraient donné un 4/5. Une moyenne de 4,7 voudrait dire que la proportion serait exactement l’inverse.
Moyenne de 4,3
4444444
555

Moyenne de 4,7
444
5555555

Ce qui semblait une petite variation après la virgule représente en fait une proportion de 4 et de 5 complètements différents.

Au moment d'écrire ceci, il y a 78 jeux ayant 10 avis ou plus dont la moyenne brute se trouve entre 4,3 et 4,7 sur la base de données de TricTrac.

Le problème avec la moyenne brute est que l’on ne sait pas sur combien d’avis elle est basée. Par exemple, il y a présentement 156 jeux avec une moyenne brute de 5. Évidemment, plusieurs n’ont qu’un seul avis. Comment comparer un jeu qui a une seule note de 5 avec un jeu qui a 200 notes d'une moyenne de 4,7? Idéalement, il faudrait tenir compte et du nombre de notes et de la moyenne de celles-ci. C’est ce que les méthodes Finkel et Bayes tentent de faire.

La méthode Finkel

La note de Finkel qui sert à faire le classement des jeux les plus appréciés de TricTrac se calcule selon la formule suivante:

Note Finkel = moyenne brute + ajustement Finkel

L’ajustement à la moyenne brute étant pour chaque note :
de 5/5 on ajoute 0,02
de 4/5 on ajoute 0,01
de 2/5 on soustrait 0,01
de 1/5 on soustrait 0,02

En faisant la somme de tous ses ajustements, on obtient l’ajustement Finkel.

Il y a une correspondance entre la moyenne d’un jeu et l’ajustement Finkel moyen du même jeu. Par exemple, si la moyenne d’un jeu est de 3,96, l’ajustement Finkel moyen sera de 0,0096, si la moyenne d’un jeu est de 4,31 l’ajustement Finkel moyen sera de 0,0131. La correspondance entre les deux s’exprime selon la formule suivante:

ajustement Finkel moyen = (moyenne brute-3) / 100

Ainsi les jeux qui ont une moyenne de 3 n'ont aucune différence entre leur moyenne brute et leur note de Finkel, car l'ajustement de Finkel est alors de zéro. Les jeux qui ont une moyenne supérieure à trois ont une note Finkel plus élevée que leur moyenne brute, par contre les jeux qui ont des moyennes inférieures à trois ont une note Finkel inférieure à leur moyenne brute.

Une autre façon de calculer l’ajustement Finkel est de multiplier l’ajustement moyen par le nombre de notes, le calcul de la note Finkel devient alors:

Note Finkel = moyenne brute + (ajustement Finkel moyen x nombre de notes)

Cette façon d'exprimer la note Finkel nous rappelle le calcul d'une droite:

Y = a + b X

Où a (la moyenne brute) est l’abscisse à l’origine et b (l’ajustement Finkel moyen) est la pente. Lorsqu’on suit l’évolution de la note Finkel à chaque nouvelle note reçue pour en faire un graphique où la note Finkel est fonction du nombre de notes, on voit clairement une droite qui monte (ou descend) au fur et à mesure que les notes s'empilent.

Pour illustrer, disons qu’un jeu à une moyenne de 4,5 et qu’il garde cette moyenne peu importe le nombre de notes (en réalité la moyenne change au fur et à mesure que les notes s’ajoutent, mais simplifions).
Nb. de notes.....................Finkel
15 .................................4,725
50 .................................5,25
100 ..................................6
200 ..................................7,5
400 ................................10,5


La méthode de Bayes

Pour ceux qui ne savent pas encore l’origine de ce nom difficilement prononçable pour un francophone, feu Bayes était mathématicien. Le top bayesien se trouve sur le site de Scand1sk :
http://vion.free.fr/toptt_history/

La note de Bayes qui sert à calculer le classement bayesien se calcule en ajoutant un nombre de notes artificielles aux notes réelles et en calculant la moyenne. Présentement Scand1sk ajoute 15 notes de 3,69 aux notes réelles et fait une moyenne. La formule pour calculer la note de Bayes est :
Note Bayes = ((somme des notes) + (3,69 x 15)) / (nombre de notes +15)

Pour interpréter la note Bayes, c’est un peu comme si nous étions septiques avec les premières notes et que nous ramenions la moyenne des jeux avec peu de notes vers 3,69 (la moyenne des notes de tous les jeux), mais que lorsqu’un jeu obtient beaucoup de notes, on permet à la note Bayes de s’approcher très près de la vraie moyenne. Autrement dit, plus il y a de notes, plus on fait confiance à la moyenne.

Pour illustrer, reprenons notre exemple d’un jeu avec une moyenne de 4,5 et qui garde cette moyenne peu importe le nombre de notes.

Nb. de notes............................Bayes
15 ........................................4,095
50 .......................................4,313
100 .......................................4,394
200 .......................................4,443
400 .......................................4,471

Avec 15 notes, la note de Bayes se trouve exactement à mi-chemin entre 3,69 et la moyenne du jeu 4,5. Cependant, au fur et à mesure que les notes s’ajoutent la note de Bayes se rapproche de la moyenne du jeu.
Lilian
Lilian
Franchement Romain, je pense que tu as tellement énervé Mr Phal que par principe, il ne mettera jamais ton classement. Il a déjà pas assez de temps pour dévellopper d'autres fonctions du site que je considére plus important qu'un simple classement alors...
Mitsoukos
Mitsoukos
Je n'ai pas lu Romain demander à ce que sa méthode de classement soit integrée au site...

Et puis saches, Lilian, que Mr Phal n'est JAMAIS énérvé :mrgreen:

Reste à savoir si Mr Phal est à cheval sur les principes... :roll:
bilbo
bilbo
Mitsoukos dit:Je n'ai pas lu Romain demander à ce que sa méthode de classement soit integrée au site...


Dans ce topic là, non, mais dans les cinquante précédents... :lol:

C'est dommage que la situation en soit arrivée là. Je crois que vue la tournure personnelle qu'a pris ce sujet, et vus les conflits inutilement interminables qu'il a déjà suscités, Romain aura beau créer 50 autres topics, la situation restera sans doute bloquée à son niveau actuel; car la subjectivité et l'amour propre ont depuis longtemps pris le pas sur le débat.

Alors bon, c'est regrettable, surtout que personnellement j'apprécie le classement bayesien et qu'une mise en parallèle avec le classement finkel aurait pu être intéressante si elle avait été proposé sur TT; mais j'ai peur que le point de non retour ait été atteint depuis longtemps. Mais bon tant pis je consulte le classement de scand1sk, je lis avec attention les analyses mensuelles de Romain, et finalement ça me suffit déjà pas mal comme ça. :)
cartouche01
cartouche01
En tout cas, moi ca m'a permis d'apprendre ce qu'est la méthode finkel et la méthode de bayes ;). Merci
arthemix
arthemix
Dans son post, Romain ne fait pas autre chose que d'expliquer le fonctionnement de chaque méthode. Même si cela est certainement dans le but de faire de la pub à la méthode Bayes et au classement présent sur le site de scand1sk, et même si le passif sur cette histoire de classement est indéniable, ce n'est à mon avis pas sain de lire autre chose que ce qui est écrit. Ca ne servira qu'à faire dégénérer un post de plus, ce que tous regretteront ensuite.



Stéphane, qui voit des procès d'intention de partout ces temps-ci. :(
grolapinos
grolapinos
D'autant, si je puis me permettre, que les explications de Romain sont très claires et les mises en garde liminaires fort à propos. Alors quelles que soient ses motivations, y'a pas à mégoter, ce post est utile et intéressant.
nekotarie
nekotarie
Romain dit:
La méthode de Bayes
La note de Bayes qui sert à calculer le classement bayesien se calcule en ajoutant un nombre de notes artificielles aux notes réelles et en calculant la moyenne. Présentement Scand1sk ajoute 15 notes de 3,69 aux notes réelles et fait une moyenne. La formule pour calculer la note de Bayes est :
Note Bayes = ((somme des notes) + (3,69 x 15)) / (nombre de notes +15)


Petite question concernant cette méthode :

Le "15" est un paramètre libre n'est-ce pas ? Ou bien existe-t-il une règle pour le choisir ?

On pourrait imaginer des classements bayésiens avec 30, 50 ou 100 à la place de 15 non ? Il existerait alors une infinité de classements bayésiens potentiellement différents ?
Romain
Romain
nekotarie dit:
Romain dit:
La méthode de Bayes
La note de Bayes qui sert à calculer le classement bayesien se calcule en ajoutant un nombre de notes artificielles aux notes réelles et en calculant la moyenne. Présentement Scand1sk ajoute 15 notes de 3,69 aux notes réelles et fait une moyenne. La formule pour calculer la note de Bayes est :
Note Bayes = ((somme des notes) + (3,69 x 15)) / (nombre de notes +15)

Petite question concernant cette méthode :
Le "15" est un paramètre libre n'est-ce pas ? Ou bien existe-t-il une règle pour le choisir ?
On pourrait imaginer des classements bayésiens avec 30, 50 ou 100 à la place de 15 non ? Il existerait alors une infinité de classements bayésiens potentiellement différents ?


En théorie tu as raison, en pratique le classement change peu avec le choix de ce paramètre. Si 15 a été choisi, c'est que c'est le nombre minimun d'avis qu'un jeu a besoin pour être inclu dans le classement de Scand1sk.
scand1sk
scand1sk
Romain, au taquet ;)

En ce qui concerne ce paramètre, je le fais évoluer régulièrement en fonction du nombre total d'avis sur TT. J'essaie de garder la taille de la liste raisonnable, donc je risque fort de passer ce nombre à 20 quand le nombre de jeux présents dans la liste approchera les 1000.
Romain
Romain
Régulièrement est un peu exagéré, non? :wink: Cela fait presque deux ans que tu calcules la moyenne bayésienne (merci pour cela) et tu l'as changé une fois pour passer de 10 à 15.
nekotarie
nekotarie
D'accord, mais si (imaginons !) je décide de ne m'intéresser qu'aux jeux ayant au moins 50 avis, si je mets 50, ça va non seulement supprimer des jeux du classement, mais aussi changer les positions relatives de certains, non ?

En principe en prenant tes datas je dois pouvoir simuler ça. Finalement je n'ai besoin que de la moyenne brute et du nombre d'avis de chaque jeu !

J'essaye :-)
Romain
Romain
En passant Scand1sk,

As-tu remarqué qu'Actorios utilise ton classement de Bayes pour comparer les goûts des utilisateurs de BGG et TT?

http://www.boardgamegeek.com/geeklist/24296
nekotarie
nekotarie
Voilà le résultat avec le paramètre 50 (désolé c'est moche je sais pas comment faire mieux...)

De manière assez logique, ça fait remonter les jeux qui ont beaucoup d'avis.

Chacun peut donc ajuster le paramètre pour trouver la config qui lui plait !

Intéressant !



"Rg15""Jeu""Moy Bay 15""Moy brute""Nb avis""Moy Bay 50"
1"Puerto Rico "4,594,623544,5
2"Caylus "4,544,582674,44
4"Euphrat & Tigris "4,474,522374,37
15"Time's Up ( 2e ed. , 3e ed. , 4e ed. , 5e ed. ) "4,384,422524,3
3"Yinsh "4,524,67824,29
19"Citadelles ( 2e ed. ) "4,324,345384,28
7"Funkenschlag "4,434,511344,28
5"Age of Steam "4,464,571054,28
11"Pique Plume "4,394,491114,24
9"Princes de Florence ( 2e ed. ) "4,424,55894,24
26"Tikal ( 2e ed. ) "4,34,342154,21
23"Mr. Jack ( 2e ed. ) "4,34,351884,21
14"Dvonn "4,384,48974,21
12"El Grande "4,384,51874,21
16"Go "4,374,47974,2
39"Loups Garous de Thiercelieux, Les "4,234,244504,18
8"Space Hulk "4,434,62584,18
24"Full Metal Planete "4,34,381254,18
32"Himalaya ( 2e ed. ) "4,254,291904,16
33"St Petersburg "4,254,311444,15
17"Modern Art ( 2e ed. ) "4,354,5664,14
52"Chevaliers de la Table Ronde, Les "4,184,23444,13
30"Samurai "4,264,341084,13
13"Löwenherz "4,384,6484,13
28"Santiago "4,294,41794,13
34"Yspahan "4,254,321124,12
18"Meuterer "4,334,48624,12
20"Java "4,324,48614,12
27"Goa "4,294,42714,11
54"Aventuriers du Rail Europe, Les "4,174,212134,11

:P
nekotarie
nekotarie
Je crois qu'un d'un point de vue mathématique, la valeur du paramètre doit correspondre à l'idée qu'on se fait de la représentativité de l'échantillon qui vote (les TTiens donnant leur avis) par rapport à l'échantillon total (les joueurs).

Ex :

avec un paramètre de 0, j'ai la moyenne brute. Donc un jeu avec un seul avis à 5 sort avec une note de 5. Ce qui a du sens si on considère que notre unique votant est totalement représentatif de la population.

avec un paramètre très elevé, les loups-garous, times up et autres vont sortir devrant. Ce qui doit être correct si on considère les TTiens comme peu représentatifs par rapport à l'ensembles joueurs (enfants, grand-mères et autres inclus...)

Donc à chacun de trouver son paramètre qui va bien, non ? :wink:
scand1sk
scand1sk
Ah, j'avais loupé la GeekList d'Actorios... Probablement plus "insightful" que ma tentative de première GeekList (les gens semble pas aimer les listes où on dit du mal de certains jeux, surtout quand je fustige de l'Amerithrash ;)).

Pour jouer avec les classements, je mets à disposition depuis peu une version csv des données, facilement importable sous un tableur quelconque. Le lien se trouve dans l'historique des classements : http://vion.free.fr/toptt_history/
Romain
Romain
Fustiger l'ameritrash sur BGG et le classement finkel sur TT... Tu ne manques pas une contreverse toi. :)
Pso76
Pso76
Je pense que monsieur Phal est débordé et comme il l'a dit, tous nos souhaits de programmation ne seront là que lorsqu'il engagera une personne.... ce qui n'est pas le cas pour le moment (à confirmer)

Malgré que c'est un site communautaire (avis,ajout fiche,...) , le développement n'est fait que par lui...

Le site est victime de son succès....

Par contre, un autre site communautaire se développe où là tu auras toutes tes moyennes : http://jedisjeux.kami-blue.com/


Concernant l'avis, les notes... en laissant une marge de 1 à 5 ... c'est comme il l'a dit... c'est juste pour donner une impression.
Un éditeur ou un auteur ne doit pas être choqué d'avoir un 2/5 ... c'est parfois une bonne note selon la personne qui l'indique.
Des fois j'aurai aimé indiqué 0,1/5 ;)

Trop jeux... pas évident de dire quelle est le jeu qui vous a le plus plu...
-> il faut avoir des joueurs avec vous qui aiment ce jeu
-> il faut avoir une bonne table
-> de bonnes conditions de jeux
-> ....

un jeu "null" vous fera passé un bon moment si les critères ci haut sont rempli


Le mieux est de lire l'avis si il est écrit avec des arguments que de se fier à une note "subjective"

Je suis convaincu qu'avec 5 jeux différents je peux trouver un jeu qui va plaire à quelqu'un qui n'a jamais ou déjà joué. Et parmi tous les jeux que j'ai déjà joué, je pense qu'on peut trouver facilement 20 très bons jeux.(et sans doute 100 bons jeux)
TS Léodagan
TS Léodagan
Voilà un topic qu'il est intéressant. :D

Merci à Scand1sk pour ses moyennes bayesiennes qui sont fort révélatrices. :wink:

Enfin, je compatis avec Mr Phal, j'ai connu le même problème de manque de moyens humains pour compenser les demandes des utilisateurs (appelé syndrôme "victime de son succès") avec Elwen... :(
nekotarie
nekotarie
Je continue mes élucubrations.

Tout d'abord toute mes excuses pour avoir relancé ce sujet qui (je l'ai découvert après coup) semble avoir été une source de discussions un peu trop passionnées.

Sauf erreur de calcul, si on note M la moyenne et N le nombre d'avis, on a :

Finkel = M + (M-3)*N/100

Bayes = M - (M-3.67)*15/(N+15)

Quelques commentaires philosophiques :

1) les deux calculs sont tout à fait similaires , dans l'un on apporte une correction positive qui augmente avec le nombre d'avis, dans l'autre on apporte une correction négative qui diminue avec le nombre d'avis. Philosophiquement c'est identique.

2) les deux calculs dépendent d'un paramètre libre , le 100 dans le cas de Finkel et le 15 dans le cas de Bayes. Et bien évidemment cette dépendance est assez critique. Le choix du paramètre influe autant sur le résultat final que le choix de la méthode.

Avec un paramètre Finkel plus faible on obtiendra un classement qui ressemble au Bayes actuel alors qu'avec un paramètre Bayes très elevé on obtiendra un truc qui ressemble au Finkel actuel !

3) Les deux calculs n'utilisent pour calculer leur moyenne que 2 infos : la moyenne brute et le nombre d'avis.

Finalement plutot que d'essayer de trouver la meilleure manière de fabriquer 1 nombre subjectif à partir de 2 nombres objectifs, est-ce qu'on pourrait pas également dresser une sorte de carte bidimensionnelle des avis sur les jeux avec les deux infos.

Par ex (désolé pour la mauvaise qualité mais en agrandissant c'est moins moche) :


(75 avis au moins et brute>3.5)

On y voit clairement la nature de chacun des jeux en fonction de son nombre d'avis et sa moyenne brute.
TS Léodagan
TS Léodagan
Trop fouillis pour moi, je trouve bizarrement le graphique trop abscons. :|

Je préfère Bayes parce qu'on reste dans une échelle 1 à 5 qui s'avère plus parlante pour un usager de TT. :mrgreen:
nekotarie
nekotarie
TS L�odagan dit:Trop fouillis pour moi, je trouve bizarrement le graphique trop abscons. :|
Je pr�f�re Bayes parce qu'on reste dans une �chelle 1 � 5 qui s'av�re plus parlante pour un usager de TT. :mrgreen:


Oui je sais le graphe est dégueulasse, fais en 10 minutes avec excel . Mais imprimé en A0 ça rendra bien ! 8)

Sinon pas de polémique sur les classements préférés, je voulais juste souligner que les deux moyennes répondent à la même volonté de prendre en compte le nombre d'avis en plus de la moyenne brute, et que pour peu qu'on les paramètre bien, on peut leur faire dire la même chose.
Romain
Romain
nekotarie dit:Sinon pas de polémique sur les classements préférés, je voulais juste souligner que les deux moyennes répondent à la même volonté de prendre en compte le nombre d'avis en plus de la moyenne brute, et que pour peu qu'on les paramètre bien, on peut leur faire dire la même chose.


C'est effectivement la volonté de corriger la moyenne brute pour éviter qu'un jeu avec seulement quelques notes et une note parfaite se retrouve en tête du classement qui motive les deux approches. Mais je ne crois pas qu'avec un changement de paramètre de Finkel, tu puisses arriver à un classement similaire à celui de Bayes.

Ce que l'on remarque pour les jeux en haut de classement lorsqu'on calcule leur moyenne glissante - c'est-à-dire une moyenne qui est recalculée à chaque fois que l'on ajoute une note - à partir de la trentième note ou à peu près, elle descent peu à peu. C'est comme si le premier public d'un jeu était celui ciblé, enthousiaste, et donne une excellente moyenne à un jeu. Ensuite attirés par les bons commentaires, d'autres joueurs l'essaient, l'aiment moins et le notent, baissant ainsi la moyenne. Ce que j'aime de la moyenne bayesienne c'est qu'elle nous donne des mois à l'avance ce que la moyenne brute aura l'air lorsqu'il y aura plus de notes.

Par exemple, le 5 novembre 2005, Caylus avait à peine 31 notes. Sa moyenne brute était de 4,77 alors que sa moyenne bayesienne était de 4,52. Le 3 août 2007, la moyenne brute de ses 267 notes était de 4,58 soit tout près de ce que la moyenne bayesienne nous donnait il y a deux ans.
Mattintheweb
Mattintheweb
Moi je suis pas un fan de classements, je les consulte quasi jamais, mais les graphiques, je les trouve bien pensés ; effectivement, la réalisation est pas optimale, mais je trouve qu'on réussit bien à voir les nuances entre moyenne et nombre d'avis... :pouicbravo:
nekotarie
nekotarie
Ok alors je me lance le défi suivant.

Je prends 3 jeux aux profils d'avis très différents :

Yinsh
Tigre&Euphrate
Les loups-garous

Et j'essaye de fabriquer des 3 classements Bayes, 3 Finkel et 3 "modulation par le nombre d'avis" qui les donnent à chaque fois chacun leur tour 1er du classement.
scand1sk
scand1sk
Et sinon, ça intéresse quelqu'un mon classement par "paires classées" (ou méthode de Condorcet, ou encore de la Ligue de Football), donc ni Finkel, ni Bayes ni même moyenne d'ailleurs, dit "des Maîtres Pouics" ?

[edit]Explication rapide : http://vion.free.fr/toptt/index.php/200 ... classement
nekotarie
nekotarie
nekotarie dit:Ok alors je me lance le défi suivant.


Défi relevé !

En mettant des paramètres Finkel, Bayes ou modulation par le nombre d'avis qui augmentent progressivement, on fait passer qui on veut au devant du classement :

-soit les jeux de niche à moyenne brute très élevées et peu d'avis (comme Yinsh)
-soit les jeux de compromis comme T&E
-soit les jeux beaucoup notés comme LoupsGarous



Je reste donc sur mon opinion que la question n'est pas tant de savoir quelle méthode est la meilleure que d'ajuster correctement le paramètre.

L'ajustement du paramètre gouverne dans toutes les méthodes l'importance qu'on donne au nombre d'avis, et il est clair que chacun de nous aura sa préférence à ce sujet, suivant son profil de joueur.
grolapinos
grolapinos
Merci nekotarie pour cette brillante démonstration de la stérilité totale des controverses sur les méthodes de classement. Voire de l'intérêt très relatif des classements en question. Il ne pouvait pas y en avoir de plus probante.
Fadest
Fadest
Et de toutes manières, tout le monde sait que le meilleur jeu, c'est Factory Fun :lol:
scand1sk
scand1sk
Attention quand même pour Bayes : mettre 1000 votes "artificiels" quand il n'y en a que 80 de "vrais" n'a pas beaucoup de sens. De fait, ce nombre de votes "artificiels" correspond aussi au nombre minimal de votes pour apparaître dans le classement. Donc si tu mets 238 en paramètre, seuls les LG apparaîtront.

Bon, sans vouloir radoter, dire que ces classements ont un intérêt "tout relatif", c'est sans doute vrai, mais l'intérêt est strictement le même que celui d'un TT d'or, d'un SDJ, d'un DSP, d'un As d'Or ou de tout autre prix dans lequel un vote quelconque intervient, que ce soit celui du public ou d'un jury. Ou même d'ailleurs de toute élection, y compris en politique, et les présidentielles de 2002 en furent un brillant exemple (ainsi que toute la polémique sur les sondages, sur les partis centristes et extrémistes, etc).

Dans tous les cas, on essaie d'établir un consensus de manière mathématique à partir de données chiffrées imprécises et incomplètes (je rappelle qu'un vote "à la française" consiste à mettre 5/5 à un candidat et 0/5 à tous les autres, ce qui peut sembler un poil aberrant). Il y a un prix nobel d'économie qui a prouvé qu'il était mathématiquement impossible de trouver une "bonne" méthode pour y parvenir, donc on fait avec les moyens du bord.

Bayes n'est pas la panacée, je le fais parce que j'aime bien jouer avec les chiffres, que j'aime les statistiques, que je suis un geek, et que c'est très proche de mon domaine de recherche scientifique (pour info, tout ça, c'est de l'IA). Les "paires classées", utilisées pour élire le prix du BGG mais aussi pour les élections politiques en Irlande (mais ça je ne le savais pas quand j'ai mis en place ce classement) sont une autre approche, qui a l'avantage de ne plus s'intéresser aux notes proprement dites, mais simplement sur le fait qu'une même personne préfère un jeu qu'elle a noté 5/5 qu'un autre qu'elle a noté 4/5.
nekotarie
nekotarie
Pour achever les considérations techniques :

Si on place tous les jeux dans le diagramme "moyenne brute/nombre d'avis", faire un classement prenant en compte ces deux paramètres correspond à tracer des lignes de niveau dans ce diagramme, un peu comme les lignes de niveau sur une carte donnant les altitudes.

Deux jeux auront la même note par la méthode "trucmuche" si ils sont sur la même ligne de niveau.

Par exemple dans la méthode "moyenne brute", les lignes de niveau sont tout simplement les lignes horizontales.

Dans la méthode "modulation par le nombre d'avis", ce sont des droites de pente négative.

Dans Bayes et Finkel, ce sont des courbes plus ou moins creusées (voir dessin) suivant la valeur du paramètre. En gros, plus les courbes sont creusées, plus on donne d'importance au fait d'être un bon compromis moyenne/nombre d'avis.

Voici un diagramme des formes des courbes. 2 jeux situés sur la même ligne de niveau auront la même note par telle ou telle méthode.



Pour faire mon petit jeu avec Yinsh, LG et E&T, j'ai joué sur le paramètre pour creuser plus ou moins les courbes et obtenir le résultat désiré.
nekotarie
nekotarie
scand1sk dit:
Attention quand même pour Bayes : mettre 1000 votes "artificiels" quand il n'y en a que 80 de "vrais" n'a pas beaucoup de sens. De fait, ce nombre de votes "artificiels" correspond aussi au nombre minimal de votes pour apparaître dans le classement.

Oui j'y ai pensé mais la correspondance (# de vote artificiels)=(# mini de vote) ne parait pas indispensable. Y-a-t-il une raison théorique à celà ?
Intuitivement le nombre de votes artificiels devrait même plutôt être le nombre typique moyen de votes exprimés sur les jeux qu'on classe. Donc si 15 est le nombre minimal pour être dans le classement, avec tes datas ça donne 60 comme nombre moyen de votes exprimés.
scand1sk dit:
Dans tous les cas, on essaie d'établir un consensus de manière mathématique à partir de données chiffrées imprécises et incomplètes

C'est un peu pour ça que je défend la carte bidimensionnelle plutot que le classement unidimensionnel !
scand1sk dit:
Bayes n'est pas la panacée, je le fais parce que j'aime bien jouer avec les chiffres, que j'aime les statistiques, que je suis un geek, et que c'est très proche de mon domaine de recherche scientifique (pour info, tout ça, c'est de l'IA).


Bah j'avoue, moi aussi j'ai un faible pour Bayes d'un point de vue théorique :P . D'ailleurs puisque c'est ton jardin, est-ce que tu sais comment on démontre la formule ?

Intuitivement un truc genre maximisation sur x de la probabilité postérieure d'avoir la note x sachant les votes exprimés. Du coup je vois pas trop comment on introduit le paramètre magique ? :holdpouic:

Et puis du coup ça suppose que les votes exprimés doivent être tirés uniformément dans les votes possibles, non ? ce qui est hautement non-vérifié dans TT où les joueurs légers ne vont pas évaluer Roads&Boats.