Valve fuit le nombre de joueurs du jeu Steam ; nous avons les chiffres

by Jack

Valve fuit le nombre de joueurs du jeu Steam ; nous avons les chiffres
/

Un trou récemment découvert dans l’API de Valve a permis aux observateurs de générer des données extrêmement précises et accessibles au public pour le nombre total de joueurs pour des milliers de jeux Steam. Alors que Valve a maintenant fermé cette fuite de données par inadvertance, Ars peut toujours fournir les données qu’il a révélées en tant qu’enregistrement historique de la popularité globale d’une grande partie de la bibliothèque Steam.

La nouvelle méthode de dérivation des données, comme expliqué avec compétence dans un article Medium de La fin est proche développeur Tyler Glaiel, se concentre sur le pourcentage de joueurs qui ont accompli des réalisations définies par le développeur associées à de nombreux jeux sur le service. Sur le site Web de Steam, ces données apparaissent arrondies à deux décimales. Dans l’API Steam, cependant, les pourcentages de réussite étaient, jusqu’à récemment, fournis avec 16 décimales extrêmement précises.

Cette précision supplémentaire signifie que de nombreux pourcentages de réussite ne peuvent être pris en compte que dans des nombres entiers spécifiques. (Ceci est utile car le nombre de joueurs de chaque jeu doit être un nombre entier.) Avec plusieurs réalisations à vérifier, il est possible de trouver un dénominateur commun qui fonctionne pour tous les pourcentages avec une grande fiabilité. Ce processus permet une ingénierie inverse extrêmement précise du dénominateur représentant la base totale de joueurs pour un pourcentage de réussite.

Comme le souligne Glaiel, par exemple, un succès obtenu par 0,012782207690179348% des joueurs sur son jeu se traduit précisément par 8 joueurs sur 62 587 sans aucun arrondi nécessaire (une fois que certains aléas de la représentation en virgule flottante sont résolus).

Mises en garde

Étant donné que ces données sont dérivées directement de l’API de Steam pour chaque jeu, elles sont beaucoup plus précises que les anciennes méthodes d’estimation Steam Gauge / Steam Spy, qui reposaient sur un échantillonnage aléatoire d’une petite partie de la base de joueurs Steam. Mais cette méthode ne fonctionne que pour les jeux avec des réalisations définies par le développeur, elle couvre donc environ 13 000 des quelque 23 000 jeux actuellement sur Steam.

On ne sait pas exactement comment Valve définit ce « dénominateur de réussite », qui se rapproche mais ne correspond pas précisément aux statistiques de « joueurs » fournies aux développeurs individuels. Les nouvelles données ne donnent également aucune indication sur le nombre de personnes qui possèdent le jeu sans y avoir joué. Et, dans de très rares cas, cette méthode pourrait aboutir à un dénominateur d’un facteur deux, grâce à des facteurs communs (bien que cette chance devienne infime dans les jeux avec plus de quelques succès).

Le 4 juillet, Valve a mis à jour son API Steam pour fournir beaucoup moins de précision dans ses pourcentages de réussite, coupant complètement cette nouvelle source de données. Cette décision intervient quelques mois seulement après que Valve a commencé à protéger les données d’utilisation individuelles de Steam par défaut, coupant ainsi la méthode d’estimation précédente utilisée par Steam Gauge et Steam Spy. Le responsable du développement commercial de Valve, Jan-Peter Ewert, a déclaré que la société travaillait actuellement sur un moyen « plus précis » pour les utilisateurs et les développeurs de « sortir des données de Steam », bien qu’apparemment ce type d’ensemble de données dérivé de l’accomplissement n’était pas ce qu’il avait en tête.

Les nombres

Avant que le trou de données des réalisations ne puisse être bouché, Sergey Galyonkin a pu intégrer la méthode dans l’algorithme d’apprentissage automatique utilisé pour Steam Spy, où les données ont été brièvement affichées sur des pages de jeu individuelles plus tôt dans la semaine. En tant que service public, et avec la permission de Galyonkin, nous sommes en mesure de partager les numéros de joueurs dérivés des réalisations qu’il a collectés dans ce fichier CSV pratique. (Ars a pu confirmer la fiabilité de ces données grâce à des contrôles ponctuels basés sur l’API plus tôt dans la semaine). Les 1 000 meilleurs jeux par nombre de joueurs sont également répertoriés sur les pages suivantes, pour plus de commodité.

Cet instantané, précis au 1er juillet, deviendra sûrement moins utile avec le temps, et il n’est pas du tout utile pour la partie importante de la bibliothèque Steam qui n’utilise pas les succès. (Ces jeux ne sont pas inclus dans l’ensemble de données.) Malgré cela, et les autres mises en garde énumérées ci-dessus, nous sommes heureux de partager ce qui est probablement les données les plus solides et les plus précises actuellement disponibles concernant la popularité relative d’une grande partie des Bibliothèque Steam.

En plus de satisfaire la curiosité des fans, ce type de données peut nous aider à mieux comprendre la forme du marché des jeux PC. C’est le genre de données que d’autres industries du divertissement tiennent pour acquises – sous la forme de rapports réguliers sur les recettes au box-office et les cotes d’écoute, par exemple – mais qui restent d’une opacité frustrante pour l’industrie du jeu dans son ensemble.

Comme Ewert de Valve l’a récemment déclaré aux développeurs, « La seule façon de gagner de l’argent est de prendre les bonnes décisions pour apporter les bons jeux sur la plate-forme et trouver votre public. » Pour l’instant, au moins, cette fuite de données peut nous aider à mieux comprendre de nombreux jeux qui « trouvent un public » de joueurs Steam.

N’oubliez pas de partager l’article avec vos amis !

Related Articles

Leave a Comment