0
votes

Algorithme anti-biais pour évaluer un restaurant

Je travaille sur une application de restaurant que l'utilisateur peut évaluer un restaurant en logique, par exemple, l'équation de notation de 10 personnes est suivie: L'utilisateur peut évaluer de 1 à 5 9 avait noté 5 1 avait noté 1 L'équation est ((9 * 5) + (1 * 1)) / 10 (somme des personnes) = 46/10 = 4.6 La réponse est de 4,6 ans, ce qui est injuste car 1 personne basse rendez-vous pour aller jusqu'à 4.6 À mon avis, le résultat devrait être 4.9 J'ai recherché et trouvé quelque chose appelé biais algorithmique que je ne comprenais pas bien, Zomato App Company a trouvé une solution Pour que ces cas semblent être justes dans la basse notation et les fausses notes

Quelqu'un peut-il m'aider avec une équation juste ou une algorithme


5 commentaires

C'est un problème difficile: TechnologyReview.com/s/612876/...


Ce n'est pas évident pour moi pourquoi la note 4.6 est injuste - elle est assez proche de la meilleure note possible de 5.


"À mon avis" - N'est-ce pas biais?


Si un restaurant dispose de 9 clients heureux et une fausse note laissez sa note diminue à 4,6, ce n'est pas juste, une application est appelée Zomato elle au Liban qui a eu une note de restauration et dans son blog Son dit qu'elle avait une solution pour cela par algorithme mais son secret pour que je demande si quelqu'un peut aider


voter ma question se rendra difficile pour moi de demander à nouveau je suis nouveau ici sa juste que j'ai juste demandé de l'aide merci beaucoup de gars désolé de demander


5 Réponses :


-1
votes

4.6 est juste et 4.9 est biaisé.


3 commentaires

À mon avis, Biais ne doit pas être compris ici dans son sens mathématique. Dans le traitement du signal, généralement, les estimateurs d'erreur moyens minimums (E.G. Wiener / MMSE Estimation) sont biaisés! (Remarque: je n'ai pas répondu)


"Fair" est un jugement de valeur et vous n'avez pas fait l'objet de la raison pour laquelle nous devrions accepter votre jugement.


@PJS: Je conviens que ma réponse est insuffisante. Mais "Fair" est le terme utilisé par l'OP; impartial est plus proche de la vérité.



1
votes

Le problème de l'estimation d'un paramètre inconnu (moyenne, de variance, etc.) d'un processus de Randow à partir d'un (très) nombre d'observations est un problème très difficile, qui a été étudié de manière intensive.

Le terme biais est actuellement utilisé ici, mais ne doit pas être confondu avec le biais probaliste (différence entre la moyenne mathématique du processus aléatoire et la moyenne mathémétique de l'estimation). Ce que l'on veut minimiser ici est l'erreur elle-même, et plus précisément on veut éviter les grandes erreurs. Dans de telles situations, avec un faible nombre d'électeurs, un simple vote peut biais l'estimation efficacement.

Une difficulté supplémentaire est que je ne suis pas convaincu que la moyenne des notations est un bon critère. Un histogramme des tarifs (90% -> 5, 10% -> 1) est plus intéressant et fournit plus d'informations. Cependant, de tels histogrammes ne permettent pas de tri simple ...

Je ne suis pas un spécialiste de ce problème spécifique et je ne connais qu'une simple méthode souvent utilisée: supprimer les valeurs inférieures et plus élevées. Cependant, dans le scénario proposé, nous obtenons un classement de 5, ce qui est loin d'être parfait.

Une autre méthode à laquelle je peux penser consiste à effectuer une première estimation approximative, puis à effectuer une nouvelle moyenne avec un poids inférieur pour les valeurs trop loin de la première moyenne.

Toutefois, toute méthode proposée doit être dérivée et vérifiée de / avec suffisamment de données: collecter un grand nombre de votes, dériver une estimation précise pour un restaurant, puis essayer d'obtenir le même résultat avec tout faible nombre de votes extraits de cette base de données. L'algorithme meilleur dépend de la loi probaliste du processus que je ne sais pas.


0 commentaires

2
votes

Une solution possible consiste à mettre le nombre de personnes qui ont voté pour une note particulière. Calculer la moyenne pondérée en multipliant chaque évaluation par le carré. Puis divisez par la somme des carrés et arrondi. Cela aura tendance à garder la note près de la valeur que la plupart des personnes ont choisi.

Par exemple, lorsque les notes sont p> xxx pré>

alors le calcul est p>

(5*16 + 4*64 + 3*121 + 2*36 + 1*9) / (16+64+121+36+9) = 3.1


2 commentaires

Vous êtes incroyable que je ne sais pas quoi dire mais ce que je peux dire que Dieu vous bénisse !! Merci beaucoup @ user3386109


@Ahmadbaddah content d'aider, bonne chance à vous!



3
votes

Biais algorithmique

La question est loin d'être triviale. En fait, ce n'est pas du tout solvable. Au moins pas de la manière mathématique, vous semblez penser. Je vais commencer par une tentative d'expliquer le biais d'algorithmique avec quelques exemples:

Amazon a formé un IA pour prendre des décisions d'embauche. Après un certain temps, ils ont compris que l'IA préférait que les demandeurs féminins, en raison de ce biais se présentant également dans le jeu de données de formation. Dans ce cas, il est assez trivial de décider si l'IA avait un biais injuste.

Disons que je configurais un autre AI qui décide également des candidats à inviter pour une entrevue. Maintenant, j'ai appris d'Amazon et j'ai évité le sexe-biais en supprimant simplement des détails tels que le sexe, le nom ou l'appartenance ethnique. Non, mon IA ne peut ni être raciste ni sexiste, il devrait donc être juste, non? Eh bien, mon AI a appris qu'il est préférable d'embaucher des candidats âgés d'environ 30 ans, simplement parce qu'ils ont une expérience de technologie de pointe et ne sont pas nouvelles pour l'industrie. Ce serait idéal pour l'entreprise (probablement au moins - je vais ignorer ce détail et le suppose simplement pour la simplicité). Mais maintenant, nous ignorons les nouveaux arrivants et les personnes qui dépassent un certain âge. Est-ce juste? Ça devient un peu florrique.

L'AI décrit précédemment a été rejeté comme étant injuste et maintenant, je suis également assuré que le nouveau AI ignore l'âge. Cela traitera maintenant les nouveaux arrivants de la même manière que cela traite quelqu'un qui a 30 ans et quelqu'un qui est plus senior que cela. Alors maintenant c'est juste, non? Mais maintenant, cela ne se soucie pas de l'expérience des candidats et de donner à quelqu'un qui n'a aucune idée de la même chance que quelqu'un qui a investi du temps et de l'argent pour obtenir de l'expérience. Alors est-ce juste? Eh bien, je pouvais difficilement répondre à cette question

ou en dernier, mais non le moindre: les commentaires à cette question montrent déjà à quel point il est délicat de définir ce qui est (non) juste. Pour le reste de la question, je supposerai simplement que le schéma de notation que vous avez proposé est juste.

Les moyens possibles de modifier l'évaluation des notes

Il existe de nombreuses façons de lequel pourrait alternativement compiler des notes. Je ne montrerai que deux options simples pour réaliser ce que vous voulez, bien qu'il existe certainement de nombreuses façons de déconner avec les chiffres avec une créativité un peu.

Médian

La médiane est un excellent outil statistique pour éliminer la mouche causée par quelques-uns des valeurs aberrantes entre les notes. Habituellement, la médiane est calculée comme la valeur au milieu de la liste triée - ou si le nombre de notations est même la moyenne des deux valeurs centrales. xxx

pour votre exemple Avec 9 notations 5 étoiles et une note 1 étoile, le résultat serait 5. Est-ce juste? Probablement pas, car cela traitera toute note qui n'est pas égale à la médiane de la même manière. C'est à dire. Pour la notation ci-dessus, il ne fera pas de différence si le dernier utilisateur a donné une étoile ou quatre. D'autre part, cette statistique est assez robuste contre les données asymétriques avec des valeurs aberrantes extrêmes. Donc, ce n'est pas le bon outil ici de toute façon.

Combinant la moyenne médiane et arithmétique

Celui-ci crée un résultat plus proche de ce que vous attendez - 4.8. Nous n'ignorons plus entièrement les valeurs aberrantes, mais nous leur avons donné beaucoup moins de poids. Donc globalement, cette note a un biais solide vers l'opinion la plus courante, mais ne le donne pas autant de valeur qu'avant.

On pourrait même ajouter des poids pour la médiane et la moyenne pour régler combien de poids est donné aux valeurs aberrantes: xxx

dans le code ci-dessus w doit être compris entre 0 (moyenne arithmétique uniquement) et 1 (médiane uniquement). Pour w = 0,75 , la note serait de 4.9. Donc, la médiane a deux fois plus de poids que la moyenne afin d'obtenir une telle note.

EDIT:

Une excellente approche pratique qui traite des valeurs aberrantes de manière plus équitable serait @ user3386109 réponse . Ma réponse était principalement destinée à démontrer les subtilités des statistiques "équitables", plutôt que de fournir un algorithme réel pour calculer une note.


4 commentaires

+1 pour reconnaître le problème de la médiane par rapport à la moyenne. De mon expérience, peu de gens se disputeront lorsque la médiane et la moyenne sont les mêmes. Quand ils sont différents, la tendance semble être de donner plus de poids à la médiane, comme suggéré par votre réponse. Cependant, il y a un problème avec la méthode de combinaison médiane et moyenne. Lorsqu'une distribution est fortement bimodale, la méthode proposée pourrait générer un résultat que peu de personnes seraient acceptées. Par exemple, étant donné 10 notes cinq étoiles et 9 notes une étoile, le pondéded_ratant avec w = 0,75 serait 4.5 (5 * 0,75 + 3.1 * 0,25)


En général, avec des distributions bimodales, la cote "FAIR" tendent plus fortement vers la moyenne arithmétique que la médiane.


@ user3386109 Je voulais juste donner quelques exemples simples sur la façon dont on pourrait atteindre un tel résultat. Mon intention de cette réponse était plutôt de montrer les subtilités de la mise en œuvre d'une mesure "juste" que de fournir toute mesure réelle que votre réponse résolue de manière agréable (aussi +1). Quoi qu'il en soit, j'ai édité ma réponse pour rendre cela clair.


Les gars tu es incroyable que je ne sais pas quoi dire mais ce que je peux dire que Dieu vous bénisse !! Merci beaucoup @Paul



1
votes

La cause première du problème est que l'échelle de notation est subjective - et donc affectée par les biais cognitifs des utilisateurs. Par conséquent, la meilleure solution serait une approche de notation différente, telle que le système Elo - les utilisateurs seraient invités à comparer leur restaurant le plus récemment visité avec celui qu'ils avaient visité avant, créant ainsi un véritable ordre de restaurants (qui pourraient permettre aux étoiles. être redéfini en quintiles). Cet article traite de la question et des solutions possibles au détail beaucoup plus détaillé: https://www.linkedin.com/pulse/how-build-truly-5-Star-uRating-Tobias-baer/


0 commentaires