不要錯過明天的社交媒體行業新聞

已發表: 2023-04-01

正如 Twitter 首席執行官埃隆·馬斯克本月早些時候所承諾的那樣，今天，Twitter 已在 GitHub 上發布了其推薦算法代碼供所有人查看，同時還發布了其推文推薦算法如何工作的新概述，提供了對決定順序的新見解其中顯示推文。

正如推特所解釋的那樣：

“在GitHub 上，您會發現兩個新的存儲庫（ main repo和ml repo ），其中包含 Twitter 許多部分的源代碼，包括我們的推薦算法，它控制您在 For You 時間軸上看到的推文。對於此版本，我們的目標是盡可能提高透明度，同時排除任何會危及用戶安全和隱私或保護我們的平台免受不良行為者影響的代碼，包括破壞我們打擊兒童性剝削和性操縱的努力。”

同樣重要的是要注意 Twitter 沒有連接到每個元素的權重信息 - 即每個因素在驅動最終輸出結果時得到了多少重視。

所以它不是每個細節，但它確實提供了對 Twitter 算法如何工作的高級洞察，同時 Twitter 還提供了對該系統的更外行的解釋，以幫助人們了解它如何決定你將在時間軸上看到的內容打開應用程序的時間。

根據推特：

“ Twitter 推薦的基礎是一組核心模型和功能，它們從推文、用戶和參與數據中提取潛在信息。 這些模型旨在回答有關 Twitter 網絡的重要問題，例如“您將來與其他用戶互動的可能性有多大？” 或者，“Twitter 上有哪些社區，其中有哪些熱門推文？”準確回答這些問題使 Twitter 能夠提供更相關的推薦。”

最後一個元素很重要，並且與垃圾日的瑞安布羅德里克在他的實驗中發現的一致，該實驗測試了現在通過推文獲得牽引力的內容。

正如布羅德里克總結的那樣：

“Twitter 正在通過主題使用不可見的 subreddits 來通過算法組織推文。 因為“為你”頁面不再按時間順序排列，病毒式推文無法像過去那樣及時。 他們必須是常青樹。 如果他們對已經流行起來的東西發表評論，這會有所幫助。 如果您發布主題、回復自己或在回復中發起某種討論，這真的很有幫助。 現在似乎也更加重視視頻。 ”

事實證明，Ryan 是正確的——Twitter 現在希望根據主題參與度在“為你”提要中推廣更多推文，Twitter 在帳戶級別定義主題參與度，方法是將某些帳戶過濾到主題類別中，然後將其用作分類指南他們每條推文的可能主題。

根據推特：

“ Twitter 最有用的嵌入空間之一是SimClusters 。 SimClusters 使用自定義矩陣分解算法發現由一群有影響力的用戶錨定的社區。 有 145,000 個社區，每三週更新一次。 社區的規模從個別朋友組的幾千用戶到新聞或流行文化的數億用戶不等。 喜歡推文的社區用戶越多，推文與該社區的關聯度就越高。”

上圖顯示了一些最大的 Twitter“社區”，或基於 Twitter 算法過濾的主題集合。

Twitter 表示，這種方法已成為決定將哪些“網絡外”推文插入“為你”提要，或向你展示哪些你未關注的帳戶的推文的關鍵因素。隨著越來越多的這些推薦被插入到用戶源中，它已成為推文曝光的更大驅動力——儘管當 Twitter 進一步將“為你”推薦限制為僅來自付費訂閱者帳戶的推文時，這種情況很快就會再次發生變化。

這將如何影響 Twitter 的體驗是目前任何人的猜測，但它將從根本上改變“為你”的提要，至少，通過限制 Twitter 可以從中提取的源推文池。

如果名人不付錢，或者因此停止發推文，那麼影響可能會很大。

這是 Twitter 算法概述最重要的啟示，儘管文檔中還包含其他幾個有趣的註釋和要點：

對於每個用戶會話，Twitter會提取大約 1500 條它認為每個人可能會感興趣的推文，然後在“For You”提要中對它們進行排名
For You 時間線目前平均包含 50% 的網絡內推文（您關注的人）和 50% 的網絡外推文
Twitter 還預測了兩個用戶之間互動的可能性。 “你和推文作者之間的 Real Graph 得分越高，我們將包括的他們的推文越多”
另一個因素是你關注的人正在參與的推文——這不是一個啟示，只是一個注意點
推文排名是通過“~48M 參數神經網絡進行的，該神經網絡在推文交互上持續訓練以優化積極參與（例如，喜歡、轉推和回复）”。然而，沒有說明 Twitter 在這種情況下如何確定積極參與和消極參與

這提供了一些有趣的背景，說明 Twitter 如何對推文進行排名，並在主要“For You”提要中最大限度地提高曝光率——儘管如此，這將在 4 月 15 日發生變化，屆時 Twitter 將切換為僅顯示來自付費用戶的推文它的“為你”推薦。

在某些方面，這使得很多這種見解變得多餘——儘管我猜想，如果工作理論是最終大多數用戶都會付費，那麼它可能會在一段時間內保持指示性。

除了，他們不會。

目前只有不到 1% 的 Twitter 用戶為 Twitter Blue 付費，雖然刪除“遺留”藍色勾號並恢復“For You”排名過程的決定將推動一些額外的接受，但似乎不太可能讓 Twitter Blue對於絕大多數 Twitter 用戶來說，這是一個重要的考慮因素。

我想，在這方面要考慮的另一個因素是絕大多數推文來自極少數用戶，大多數 Twitter 個人資料很少發布自己的推文。那麼，也許 Twitter 只需要一小部分用戶註冊 Blue，就可以使其成為推文排名中更重要的元素。但它似乎仍然不太可能在突出顯示整個應用程序中最相關的內容方面產生更好的結果。

無論如何，Twitter 似乎正在向前推進，現在，外部開發人員對 Twitter 算法的工作原理有了更多的了解，這將導致關於如何玩弄該系統的新見解和指示的湧入。

推特希望它也能幫助它快速改進算法。也許這也會發生。我們將不得不拭目以待。