내일의 SNS 업계 소식을 놓치지 마세요
게시 됨: 2023-04-01이달 초 트위터 최고 책임자인 Elon Musk가 약속한 대로 오늘 Twitter는 모든 사람이 볼 수 있도록 GitHub에 추천 알고리즘 코드를 게시했습니다. 트윗이 표시됩니다.
트위터에서 설명한 바와 같이:
“ GitHub 에는 For You 타임라인에 표시되는 트윗을 제어하는 추천 알고리즘을 포함하여 Twitter의 많은 부분에 대한 소스 코드가 포함된 두 개의 새로운 저장소(main repo , ml repo ) 가 있습니다 . 이번 릴리스에서 우리는 가능한 최고 수준의 투명성을 목표로 했으며, 동시에 사용자의 안전과 개인 정보를 침해하는 코드 또는 아동 성적 착취 및 조작을 퇴치하려는 우리의 노력을 약화시키는 것을 포함하여 나쁜 행위자로부터 우리 플랫폼을 보호하는 기능을 배제했습니다.”
또한 Twitter에는 각 요소에 연결된 가중치 정보가 없다는 점도 중요합니다. 즉, 각 요소가 최종 출력 결과를 구동하는 데 얼마나 강조되는지입니다.
따라서 모든 세부 사항은 아니지만 Twitter의 알고리즘이 작동하는 방식에 대한 높은 수준의 통찰력을 제공하는 반면 Twitter는 또한 사람들이 타임라인에서 볼 내용을 결정하는 방법을 이해하는 데 도움이 되도록 시스템에 대한 평신도 설명을 제공합니다. 앱을 여는 시간.
트위터에 따르면:
“ Twitter 추천의 기초는 트윗, 사용자 및 참여 데이터에서 잠재 정보를 추출하는 일련의 핵심 모델 및 기능입니다. 이러한 모델은 "미래에 다른 사용자와 상호 작용할 확률은 얼마입니까?"와 같은 Twitter 네트워크에 대한 중요한 질문에 답하는 것을 목표로 합니다. 또는 "Twitter의 커뮤니티는 무엇이며 커뮤니티 내에서 유행하는 트윗은 무엇입니까?"이러한 질문에 정확하게 답하면 Twitter에서 더 관련성 높은 추천을 제공할 수 있습니다.”
마지막 요소는 중요하며 Garbage Day의 Ryan Broderick이 현재 트윗을 통해 관심을 끌고 있는 것을 테스트하는 실험에서 발견한 것과 일치합니다.
Broderick은 다음과 같이 요약했습니다.
“트위터는 주제를 통해 보이지 않는 하위 레딧을 사용하여 알고리즘 방식으로 트윗을 구성합니다. For You 페이지는 더 이상 연대순이 아니기 때문에 바이럴 트윗은 예전만큼 시의적절할 수 없습니다. 그들은 일종의 상록수 여야합니다. 이미 입소문이 난 것에 대해 댓글을 달면 도움이 됩니다. 스레드를 게시하거나 자신에게 회신하거나 회신에서 일종의 토론을 생성하면 정말 도움이 됩니다. 또한 이제 비디오에 더 중점을 두는 것 같습니다. ”
알고 보니 Ryan이 옳았습니다. Twitter는 특정 계정을 주제 범주로 필터링한 다음 이를 분류 가이드로 사용하여 계정 수준에서 정의하는 주제 참여를 기반으로 'For You' 피드에서 더 많은 트윗을 홍보하려고 합니다. 각 트윗의 가능성 있는 주제.
트위터에 따르면:
“ Twitter의 가장 유용한 임베딩 공간 중 하나는 SimClusters입니다 . SimClusters는 사용자 정의 행렬 분해 알고리즘을 사용하여 영향력 있는 사용자 클러스터에 기반한 커뮤니티를 발견합니다 . 3주마다 업데이트되는 145,000개의 커뮤니티가 있습니다. 커뮤니티의 규모는 개별 친구 그룹의 경우 수천 명의 사용자에서 뉴스 또는 대중 문화의 경우 수억 명의 사용자에 이르기까지 다양합니다. 트윗을 좋아하는 커뮤니티의 사용자가 많을수록 해당 트윗이 해당 커뮤니티와 더 많이 연결됩니다.”
위의 이미지는 가장 큰 Twitter '커뮤니티' 또는 Twitter의 알고리즘 필터링을 기반으로 하는 주제 모음을 보여줍니다.
Twitter는 이 접근 방식이 'For You' 피드에 삽입할 '네트워크 외부' 트윗 또는 팔로우하지 않는 계정에서 표시할 트윗을 결정하는 핵심 요소가 되었다고 말합니다. 그리고 점점 더 많은 권장 사항이 사용자 피드에 삽입되면서 트윗 노출의 더 큰 동인이 되었습니다. 트위터가 'For You' 추천을 유료 구독자 계정의 트윗으로만 제한하면 곧 다시 바뀔 것입니다.
그것이 트위터 경험에 어떤 영향을 미치는지는 이 시점에서 누구나 추측할 수 있지만 적어도 트위터가 가져올 수 있는 소스 트윗 풀을 제한함으로써 'For You' 피드를 근본적으로 변화시킬 것입니다.
특히 유명인이 비용을 지불하지 않거나 결과적으로 트윗을 중단한다면 그 영향은 상당할 수 있습니다.
문서에 포함된 몇 가지 다른 흥미로운 참고 사항과 요점이 있지만 이것은 Twitter의 알고리즘 개요에 대한 가장 중요한 계시입니다.
- 각 사용자 세션에 대해 트위터는 'For You' 피드에서 순위를 매기기 전에 잠재적으로 각 사용자가 관심을 가질 것으로 생각되는 약 1500개의 트윗을 추출합니다.
- For You 타임라인은 현재 평균 50%의 네트워크 내 트윗(귀하가 팔로우하는 사람)과 50%의 네트워크 외부 트윗으로 구성됩니다.
- Twitter는 또한 두 사용자 간의 참여 가능성을 예측합니다. '귀하와 트윗 작성자 사이의 Real Graph 점수가 높을수록 더 많은 트윗이 포함됩니다.'
- 또 다른 요인은 당신이 팔로우하는 사람들이 참여하고 있는 트윗입니다.
- 트윗 순위는 '긍정적인 참여(예: 좋아요, 리트윗 및 답글)를 최적화하기 위해 트윗 상호작용에 대해 지속적으로 훈련되는 ~48M 매개변수 신경망'을 통해 수행됩니다. 그러나 트위터가 이 맥락에서 긍정적인 참여와 부정적인 참여를 결정하는 방법에 대한 언급은 없습니다.
이는 Twitter가 트윗 순위를 매기고 메인 'For You' 피드 내에서 노출을 최대화하는 방법에 대한 흥미로운 맥락을 제공합니다. 'For You' 추천.
이는 어떤 면에서 이 통찰력을 중복되게 만듭니다. 작업 이론이 결국 대부분의 사용자가 비용을 지불한다는 것이라면 아직 한동안은 지표로 남을 수 있습니다.
제외하고는 그렇지 않습니다.
Twitter 사용자의 1% 미만이 현재 Twitter Blue에 비용을 지불하고 있으며, '레거시' 파란색 틱을 제거하고 'For You' 순위 프로세스를 되돌리기로 한 결정으로 인해 추가 사용이 발생하겠지만 Twitter Blue가 될 가능성은 낮아 보입니다. 대다수의 Twitter 사용자에게 중요한 고려 사항입니다.
이와 관련하여 고려해야 할 다른 요소는 대부분의 트위터 프로필이 거의 트윗을 하지 않는 극소수의 사용자가 대부분의 트윗을 작성한다는 것입니다. 그러면 트위터는 트윗 순위에서 더 중요한 요소로 만들기 위해 Blue에 가입하는 데 더 적은 수의 사용자만 필요로 할 수 있습니다. 그러나 여전히 앱 전체에서 가장 관련성 높은 콘텐츠를 강조 표시하는 데 더 나은 결과를 생성할 것 같지 않습니다.
그럼에도 불구하고 Twitter는 앞으로 나아가고 있으며 이제 외부 개발자는 Twitter의 알고리즘 작동 방식에 대해 더 많은 통찰력을 갖게 되어 시스템을 게임하는 방법에 대한 새로운 통찰력과 포인터가 쏟아질 것입니다.
Twitter의 희망은 알고리즘을 빠르게 개선하는 데에도 도움이 되는 것입니다. 어쩌면 그런 일도 일어날 것입니다. 우리는 기다려야 할 것입니다.