Nu ratați știrile din industria rețelelor sociale de mâine

Publicat: 2023-04-01

Așa cum a promis de către șeful Twitter, Elon Musk, la începutul acestei luni, astăzi, Twitter și-a publicat codul algoritmului de recomandare pe GitHub pentru ca toată lumea să-l vadă, în timp ce a postat și o nouă prezentare generală a modului în care funcționează algoritmul său de recomandare de tweet, oferind noi perspective asupra a ceea ce dictează ordinea. în care sunt afișate tweet-urile.

Prezentare generală a algoritmului Twitter

După cum explică Twitter:

Pe GitHub , veți găsi două depozite noi ( depozit principal , ml repo ) care conțin codul sursă pentru multe părți ale Twitter, inclusiv algoritmul nostru de recomandări, care controlează Tweeturile pe care le vedeți în cronologia For You. Pentru această versiune, am urmărit cel mai înalt grad posibil de transparență, excluzând în același timp orice cod care ar compromite siguranța și confidențialitatea utilizatorilor sau capacitatea de a ne proteja platforma de actori răi, inclusiv subminând eforturile noastre de a combate exploatarea și manipularea sexuală a copiilor.”

De asemenea, este important să rețineți că Twitter nu are informațiile de ponderare conectate la fiecare element - adică cât de mult accent primește fiecare factor în determinarea rezultatelor finale.

Deci nu este fiecare detaliu, dar oferă o perspectivă la nivel înalt asupra modului în care funcționează algoritmii Twitter, în timp ce Twitter a oferit, de asemenea, o explicație mai profană a sistemului, pentru a ajuta oamenii să înțeleagă cum decide ce veți vedea în cronologia dvs. când deschideți aplicația.

Conform Twitter:

Baza recomandărilor Twitter este un set de modele și caracteristici de bază care extrag informații latente din Tweet, utilizatori și date de implicare. Aceste modele își propun să răspundă la întrebări importante despre rețeaua Twitter, cum ar fi „Care este probabilitatea să interacționați cu un alt utilizator în viitor?” sau „Care sunt comunitățile de pe Twitter și ce tweet-uri în tendințe în cadrul acestora?”Răspunsul cu precizie la aceste întrebări permite Twitter să ofere recomandări mai relevante.

Acest ultim element este important și se aliniază cu ceea ce Ryan Broderick, de la Garbage Day, a descoperit în experimentele sale de testare a ceea ce acum câștigă tracțiune prin tweet.

După cum a rezumat Broderick:

„Twitter folosește subreddite invizibile prin Topics pentru a organiza algoritmic tweet-urile. Deoarece pagina Pentru tine nu mai este cronologică, tweet-urile virale nu pot fi la fel de actuale ca înainte. Trebuie să fie un fel de veșnic verzi. Este de ajutor dacă comentează ceva care devine deja viral. Și chiar ajută dacă postezi un thread, răspunzi la tine însuți sau creezi un fel de discuție în răspunsuri. De asemenea, se pare că se pune un accent mai mare pe video acum.

Se pare că Ryan a avut dreptate – Twitter caută acum să promoveze mai multe tweet-uri în feedul „Pentru tine”, pe baza interacțiunii de actualitate, pe care Twitter o definește la nivel de cont, prin filtrarea anumitor conturi în categorii de subiecte, apoi folosindu-le ca ghid pentru a clasifica. subiectul probabil pentru fiecare dintre tweeturile lor.

Prezentare generală a algoritmului Twitter

Conform Twitter:

Unul dintre cele mai utile spații de încorporare ale Twitter este SimClusters . SimClusters descoperă comunități ancorate de un grup de utilizatori influenți folosind un algoritm de factorizare matrice personalizat . Există 145.000 de comunități, care sunt actualizate la fiecare trei săptămâni. Dimensiunea comunităților variază de la câteva mii de utilizatori pentru grupuri individuale de prieteni, la sute de milioane de utilizatori pentru știri sau cultură pop. Cu cât sunt mai mulți utilizatori dintr-o comunitate ca un Tweet, cu atât mai mult acest Tweet va fi asociat cu acea comunitate.”

Imaginea de mai sus arată unele dintre cele mai mari „comunități” Twitter sau colecții de actualitate bazate pe filtrarea algoritmică Twitter.

Twitter spune că această abordare a devenit un factor cheie în a decide care dintre tweeturile „în afara rețelei” să fie introduse în feedul „Pentru tine” sau ce tweeturi să îți arate din conturile pe care nu le urmărești. Și odată cu inserarea din ce în ce mai multe dintre aceste recomandări în feed-urile utilizatorilor, acestea au devenit un factor mai mare de expunere a tweet-urilor – deși acest lucru se va schimba din nou în curând, când Twitter restricționează și mai mult recomandările „Pentru tine” doar la tweet-urile de la conturile de abonați plătitori.

Modul în care aceasta afectează experiența Twitter este de ghicit oricine în acest moment, dar va transforma fundamental feedul „Pentru tine”, cel puțin, prin limitarea grupului de tweet-uri sursă de la care Twitter le poate extrage.

Și dacă celebritățile, în special, nu plătesc sau nu mai trimit, ca urmare, acel impact ar putea fi semnificativ.

Aceasta este cea mai semnificativă revelație a prezentării algoritmice a Twitter, deși există câteva alte note și puncte interesante incluse în documentație:

  • Pentru fiecare sesiune de utilizator, Twitter extrage aproximativ 1500 de tweet-uri despre care crede că vor fi de interes pentru fiecare persoană, înainte de a le clasa în feedul „Pentru tine”.
  • Cronologia For You constă în prezent din 50% Tweeturi în rețea (persoane pe care le urmărești) și 50% Twe-uri în afara rețelei, în medie
  • Twitter prezice, de asemenea, probabilitatea de interacțiune între doi utilizatori. „Cu cât scorul Real Graph este mai mare între tine și autorul Tweet-ului, cu atât vom include mai multe tweet-uri ale acestora”
  • Un alt factor sunt tweet-urile cu care interacționează oamenii pe care îi urmărești – ceea ce nu este o revelație, ci doar un punct de remarcat
  • Clasificarea Tweet-urilor este realizată printr-o „rețea neuronală cu parametri de ~ 48M care este antrenată continuu cu privire la interacțiunile Tweet pentru a optimiza implicarea pozitivă (de exemplu Like-uri, Retweeturi și Răspunsuri)”. Cu toate acestea, nu există nicio notă despre modul în care Twitter determină implicarea pozitivă versus negativă în acest context

Acest lucru oferă un context interesant cu privire la modul în care arată Twitter să clasifice tweet-urile și să maximizeze expunerea în fluxul principal „Pentru tine” – deși din nou, acest lucru se va schimba pe 15 aprilie, când Twitter va trece la afișarea numai a tweet-urilor de la utilizatorii plătitori în recomandările sale „Pentru tine”.

Ceea ce, în anumite privințe, face ca multe din această perspectivă să fie redundantă – deși cred că, dacă teoria de lucru este că, în cele din urmă, majoritatea utilizatorilor vor plăti, atunci ar putea rămâne orientativ pentru ceva timp încă.

Numai că nu vor.

Mai puțin de 1% dintre utilizatorii Twitter plătesc în prezent pentru Twitter Blue și, deși decizia de a elimina bifoanele albastre „moștenite” și de a reveni la procesul de clasare „Pentru tine” va genera o adoptare suplimentară, pare puțin probabil să facă Twitter Blue. o considerație semnificativă pentru marea majoritate a utilizatorilor Twitter.

Bănuiesc că celălalt element de luat în considerare, în acest sens, este faptul că marea majoritate a tweet-urilor provin de la foarte puțini utilizatori, majoritatea profilurilor Twitter rar twittând. Poate, atunci, Twitter are nevoie doar de o colecție mai mică de utilizatori pentru a se înscrie la Blue, pentru a-l face un element mai semnificativ în clasamentul tweet-urilor. Dar încă pare puțin probabil să producă rezultate mai bune în evidențierea conținutului cel mai relevant din întreaga aplicație.

Indiferent, se pare că Twitter avansează, iar acum, dezvoltatorii externi au o perspectivă mai bună asupra modului în care funcționează algoritmul Twitter, ceea ce va duce la un nou flux de informații și indicații despre cum să joci sistemul.

Speranța Twitter este că, de asemenea, îl ajută să-și îmbunătățească rapid algoritmii. Poate se întâmplă și asta. Va trebui să așteptăm și să vedem.