Ne manquez pas les nouvelles de l'industrie des médias sociaux de demain

Publié: 2023-04-01

Comme promis par le chef de Twitter Elon Musk plus tôt ce mois-ci, Twitter a publié aujourd'hui son code d'algorithme de recommandation sur GitHub pour que tout le monde puisse le voir, tandis qu'il a également publié un nouvel aperçu du fonctionnement de son algorithme de recommandation de tweet, fournissant de nouvelles informations sur ce qui dicte l'ordre. dans lequel les tweets sont affichés.

Présentation de l'algorithme Twitter

Comme l'explique Twitter :

« Sur GitHub , vous trouverez deux nouveaux référentiels ( main repo , ml repo ) contenant le code source de nombreuses parties de Twitter, y compris notre algorithme de recommandations, qui contrôle les Tweets que vous voyez sur la chronologie For You. Pour cette version, nous avons visé le plus haut degré de transparence possible, tout en excluant tout code qui compromettrait la sécurité et la confidentialité des utilisateurs ou la capacité de protéger notre plateforme contre les mauvais acteurs, y compris saper nos efforts de lutte contre l'exploitation et la manipulation sexuelles des enfants.

Il est également important de noter que Twitter n'a pas les informations de pondération liées à chaque élément - c'est-à-dire l'importance accordée à chaque facteur dans la conduite des résultats de sortie finaux.

Ce n'est donc pas tous les détails, mais cela fournit un aperçu de haut niveau du fonctionnement des algorithmes de Twitter, tandis que Twitter a également fourni une explication plus simple du système, afin d'aider les gens à comprendre comment il décide de ce que vous verrez dans votre chronologie chaque fois que vous ouvrez l'application.

Selon Twitter :

« La base des recommandations de Twitter est un ensemble de modèles et de fonctionnalités de base qui extraient des informations latentes des données sur les Tweets, les utilisateurs et les interactions. Ces modèles visent à répondre à des questions importantes sur le réseau Twitter, telles que « Quelle est la probabilité que vous interagissiez avec un autre utilisateur à l'avenir ? ou, "Quelles sont les communautés sur Twitter et quels sont les Tweets à la mode en leur sein ?"Répondre à ces questions avec précision permet à Twitter de fournir des recommandations plus pertinentes.

Ce dernier élément est important et correspond à ce que Ryan Broderick de Garbage Day avait découvert dans ses expériences de test de ce qui gagne maintenant du terrain via tweet.

Comme le résume Broderick :

"Twitter utilise des subreddits invisibles via Topics pour organiser les tweets de manière algorithmique. Parce que la page For You n'est plus chronologique, les tweets viraux ne peuvent plus être aussi opportuns qu'avant. Ils doivent être un peu persistants. Cela aide s'ils commentent quelque chose qui devient déjà viral. Et cela aide vraiment si vous publiez un fil de discussion, répondez à vous-même ou créez une sorte de discussion dans les réponses. Il semble également y avoir un plus grand accent sur la vidéo maintenant.

Il s'avère que Ryan avait raison - Twitter cherche maintenant à promouvoir plus de tweets dans le flux "Pour vous" en fonction de l'engagement thématique, que Twitter définit au niveau du compte, en filtrant certains comptes dans des catégories de sujets, puis en l'utilisant comme guide pour catégoriser le sujet probable de chacun de leurs tweets.

Présentation de l'algorithme Twitter

Selon Twitter :

L'un des espaces d'intégration les plus utiles de Twitter est SimClusters . Les SimClusters découvrent des communautés ancrées par un groupe d'utilisateurs influents à l'aide d'un algorithme de factorisation matriciel personnalisé . Il existe 145 000 communautés, qui sont mises à jour toutes les trois semaines. La taille des communautés varie de quelques milliers d'utilisateurs pour des groupes d'amis individuels à des centaines de millions d'utilisateurs pour les actualités ou la culture pop. Plus les utilisateurs d'une communauté aiment un Tweet, plus ce Tweet sera associé à cette communauté.

L'image ci-dessus montre certaines des plus grandes « communautés » de Twitter, ou des collections thématiques basées sur le filtrage algorithmique de Twitter.

Twitter affirme que cette approche est devenue un facteur clé pour décider quels tweets "hors réseau" insérer dans votre flux "Pour vous", ou quels tweets vous montrer à partir de comptes que vous ne suivez pas. Et avec de plus en plus de ces recommandations insérées dans les flux d'utilisateurs, cela devient un facteur plus important d'exposition aux tweets - bien que cela changera à nouveau bientôt, lorsque Twitter restreindra davantage les recommandations "Pour vous" aux seuls tweets provenant de comptes d'abonnés payants.

Personne ne peut deviner comment cela affecte l'expérience Twitter à ce stade, mais cela transformera fondamentalement le flux "Pour vous", au moins, en limitant le pool de tweets sources que Twitter peut extraire.

Et si les célébrités, en particulier, ne paient pas ou arrêtent de tweeter en conséquence, cet impact pourrait être important.

C'est la révélation la plus importante de l'aperçu algorithmique de Twitter, bien qu'il y ait plusieurs autres notes et points intéressants inclus dans la documentation :

  • Pour chaque session utilisateur, Twitter extrait environ 1500 tweets qu'il estime susceptibles d'intéresser chaque personne, avant de les classer dans le flux "Pour vous".
  • La chronologie For You se compose actuellement de 50 % de Tweets In-Network (personnes que vous suivez) et de 50 % de Tweets Out-of-Network, en moyenne
  • Twitter prédit également la probabilité d'engagement entre deux utilisateurs. "Plus le score Real Graph entre vous et l'auteur du Tweet est élevé, plus nous inclurons de leurs tweets"
  • Un autre facteur est les tweets avec lesquels les personnes que vous suivez interagissent - ce qui n'est pas une révélation, juste un point à noter
  • Le classement des Tweets est effectué via un « réseau neuronal de paramètres d'environ 48 millions qui est continuellement formé sur les interactions des Tweets pour optimiser l'engagement positif (par exemple, les J'aime, les Retweets et les Réponses) ». Il n'y a cependant aucune note sur la façon dont Twitter détermine l'engagement positif par rapport à l'engagement négatif dans ce contexte

Cela fournit un contexte intéressant sur la façon dont Twitter cherche à classer les tweets et à maximiser l'exposition dans le flux principal "Pour vous" – bien que cela changera encore une fois le 15 avril, lorsque Twitter passera à l'affichage uniquement des tweets des utilisateurs payants dans ses recommandations "Pour vous".

Ce qui, à certains égards, rend une grande partie de cette idée redondante – même si je suppose que si la théorie de travail est que, finalement, la plupart des utilisateurs paieront, cela pourrait rester indicatif pendant un certain temps encore.

Sauf qu'ils ne le feront pas.

Moins de 1 % des utilisateurs de Twitter paient actuellement pour Twitter Blue, et bien que la décision de supprimer les coches bleues « héritées » et d'annuler le processus de classement « For You » entraînera une participation supplémentaire, il semble peu probable que Twitter Blue une considération importante pour la grande majorité des utilisateurs de Twitter.

Je suppose que l'autre élément à prendre en compte, à cet égard, est que la grande majorité des tweets proviennent de très peu d'utilisateurs, la plupart des profils Twitter se tweetant rarement eux-mêmes. Peut-être alors que Twitter n'a besoin que d'un plus petit nombre d'utilisateurs pour s'inscrire à Blue afin d'en faire un élément plus important dans le classement des tweets. Mais il semble toujours peu probable de produire de meilleurs résultats en mettant en évidence le contenu le plus pertinent de l'ensemble de l'application.

Quoi qu'il en soit, il semble que Twitter va de l'avant, et maintenant, les développeurs externes ont plus d'informations sur le fonctionnement de l'algorithme de Twitter, ce qui conduira à un nouveau flot d'idées et d'indications sur la façon de jouer avec le système.

L'espoir de Twitter est que cela l'aide également à améliorer rapidement ses algorithmes. Peut-être que cela arrive aussi. Nous devrons attendre et voir.