如何避免 Google 的重複內容問題?
已發表: 2021-11-01頁面上的重複內容與預算超支有很多共同點。 只有在這種情況下,我們才會談論搜索機器人站點中“信任預算”的減少。 這個問題涉及很多網站所有者,因為它甚至可能出現在他們的背後。 在閱讀了有關重複內容問題的內容後,您的網站變成了一顆定時炸彈。 在時鐘上滴答作響,谷歌的製裁正在等著你。
可悲但真實的是,Web 上大約有 25-30% 的重複內容。 前 Google 員工 Matt Cutts 持這種觀點。 儘管重複的內容會讓您陷入搜索引擎優化的困境,但這並不是那麼引人注目。 有一個解決方案——閱讀這篇文章並了解如何避免 Google 的重複內容問題。
- 什麼是重複內容?
- 關於重複內容的事實
- 有什麼樣的內容?
- 代碼是什麼?
- HTTPS 頁面
- 創建重複內容的內容管理系統
- 用於打印或多個排序選項的頁面
- 博客和存檔系統中的重複內容
- 用戶生成的重複內容(重複發帖等)
- 結論
什麼是重複內容?
有 3 種主要類型的重複內容。
- Exact duplicate:兩個 URL 的內容完全相同;
- 略有差異的內容:如句子順序、圖片稍有不同等;
- 跨域重複:許多域中存在完全相同或略有更改的副本。
此外,存在兩個相關的概念,Google 不會將其視為重複內容。 但不是那麼有經驗的出版商和 SEO 專家可以很容易地將它們與重複內容混為一談。
- 精簡內容:這些頁面內容很少。 一組基於組織地址列表的頁面,其中有 6000 個地址,但每個頁面只包含一個地址:只有幾行。
- 切片內容:彼此略有不同的頁面。 該網站銷售尺碼為 38、38.5、39、40、41、42 等的 Timberland 鞋。如果該網站為每種鞋碼提供單獨的頁面,則所有這些頁面之間會有細微差別。 谷歌將這種效果視為切片內容。
谷歌不喜歡同樣精簡和切片的內容。 Google Panda 可以檢測到任何這些影響。 這就是發布商應避免創建這些類型的頁面的原因。
由於多種原因,可能會出現重複內容:
- 您網站內容的許可;
- 由於內容管理系統未針對搜索引擎進行優化,導致網站架構存在缺陷;
- 抄襲的存在。
在過去的五年中,垃圾郵件發送者對內容有著非凡的需求,他們開始從合法來源“竊取”內容,通過使用各種複雜的過程轉換單詞並將生成的文本放在他們的頁面上以吸引“長尾”搜索操作並顯示上下文廣告和其他不誠實的目的。 所以,現在人們生活在一個“重複內容問題”和“重複內容處罰”的世界裡。
為您推薦:好的內容可以加快您的營銷工作的 5 種方式。
關於重複內容的事實
重複的內容位置
如果所有特定內容都在您的網站上,是否是重複內容?
是的,因為重複的內容既可能出現在同一個網站上,也可能出現在不同的網站上。
重複內容百分比
頁面的多少百分比應該被複製以落入重複內容過濾器? 不幸的是,搜索引擎從不公開這些信息,因為這會影響他們預防問題本身的能力。 所有引擎的這個百分比都在不斷變化。 最重要的是,頁面不必完全相同即可被視為重複。
代碼與文本的比例
如果您的代碼非常大,但頁面上有幾個獨特的 HTML 元素怎麼辦? 谷歌不會認為所有頁面都是彼此重複的嗎?
不會。搜索引擎不關心您的代碼,而是關心您網頁的內容。 代碼大小只有在超出比例時才會成為問題。
導航元素與獨特內容的比例
您網站上的所有頁面都有一個大導航欄、很多頁眉和頁腳,但內容很少。 Google 不會認為所有這些頁面都是重複的嗎?
不會。谷歌甚至在評估頁面是否重複之前就考慮了導航元素。
許可內容
您希望避免重複內容問題。 但是,如果您有來自您授權的其他網絡資源的內容可以向訪問者展示,該怎麼辦?
使用 meta name = “robots” content = “noindex, follow”。 把它放在你頁面的標題中,搜索引擎就會知道這個內容不適合他們。 另一種選擇是獲得擁有和發布該內容的專有權。
有什麼樣的內容?
- 獨特的內容是由一個人寫的。 它完全不同於網絡上任何其他字母、符號和單詞的組合,並且沒有受到計算機文本處理算法的影響。
- 片段是被反复複製和使用的小塊內容(例如,引用)。 它們很少會給搜索引擎帶來問題,尤其是當包含在包含大量獨特內容的較大文檔中時。
- 帶狀皰疹。 搜索引擎會在其他網頁上尋找相對較小的短語片段(五到六個詞)。 如果兩個文檔有太多帶狀皰疹,搜索引擎可能會將這些文檔解釋為重複內容。
代碼是什麼?
有很多方法可以創建重複內容。 這就解釋了為什麼網絡上有足夠多的內容。 內部重複內容需要特定的策略才能在優化方面獲得最佳結果。 坦率地說,重複頁面是對用戶和搜索引擎都沒有價值的頁面。 然後儘量避免這個問題。 確保只有一個 URL 指向每一頁。 此外,對舊 URL 執行 301 重定向到其餘 URL。 它可以幫助搜索機器人盡快查看您所做的更改,並保留已刪除頁面所具有的“鏈接汁”。
如果這不可能,還有很多其他選擇。 以下是針對各種情況的最簡單解決方案的概要:
- 您可以使用 robots.txt 文件來阻止搜索引擎蜘蛛抓取您網站頁面的重複版本;
- 使用 rel=”canonical” 元素,這是刪除重複頁面的次優解決方案;
- 使用 CODE <meta name=”robots” content=”noindex”> 指示搜索引擎不要顯示重複頁面。
但是,請注意:如果您使用 robots.txt 來阻止頁面查看,則在頁面上應用 noindex 或 nofollow 是沒有意義的。 由於蜘蛛無法讀取頁面,它永遠不會看到 noindex 或 nofollow 元標記。 考慮到這些工具,考慮一些重複內容的特定情況。
您可能喜歡:為什麼內容寫作對品牌和企業很重要?
HTTPS 頁面
如果您使用的是 SSL 協議(瀏覽器和 Web 服務器之間的加密數據交換,通常用於電子商務),那麼您的站點的頁面以 HTTPS:(而不是 HTTP:)開頭。 當您的 HTTPS 頁面上的鏈接使用相對而非絕對鏈接指向網站上的其他頁面時,就會出現問題。 例如,您主頁的鏈接變為 https://www.YourDomain.com 而不是 http://www.YourDomain.com)。
如果您的站點存在此問題,您可以使用 rel=”canonical” 或 301 重定向來修復它。 另一種解決方案是將鏈接更改為絕對鏈接:http://www.YourDomain.com/content.html 而不是 /contenthtml),這也會讓竊取您內容的人的生活變得更加困難。
創建重複內容的內容管理系統
有時一個網站可能有很多相同頁面的版本。 它恰好是某些內容管理系統的限制,這些系統使用多個 URL 引用相同的內容。 它通常是完全多餘的重複,對用戶沒有任何價值。 最好的決定是刪除重複的頁面,並對已刪除的頁面執行 301 重定向到其餘頁面。 如果不起作用,請嘗試其他方法。
用於打印或多個排序選項的頁面
許多網站都提供打印頁面,以適合打印機的格式為用戶提供相同的內容。 一些電子商務網站提供了多種分類(按尺寸、顏色、品牌和價格)的產品列表。 這些頁面對用戶有價值,但對搜索引擎沒有價值。 因此,他們認為這是重複的內容。 在這種情況下,您可以創建用於打印的 CSS 電子表格。
博客和存檔系統中的重複內容
博客在重複內容問題上有一種有趣的變體形式。 一篇博文可以出現在幾個不同的頁面上:
- 博客的起始頁;
- 該帖子的永久鏈接頁面;
- 存檔頁面;
- 類別頁面。
每個帖子副本都是其他副本的副本。 發布者很少嘗試處理帖子同時出現在博客主頁和永久鏈接頁面上的問題。 搜索引擎似乎很好地解決了這個問題。 但是,在類別和存檔頁面上僅顯示帖子片段可能是有意義的。
用戶生成的重複內容(重複發帖等)
各種站點使用結構來獲取用戶生成的內容,例如博客、論壇或留言板。 這些都是以極低的成本開發大量內容的好方法。 問題是用戶可以同時在您的網站和其他幾個網站上發布相同的內容,這會導致重複內容問題。 這很難控制,但要減少問題,您可以按照以下步驟進行:
- 你需要有一個明確的政策來通知用戶他們提供給你網站的內容應該是獨一無二的,不能發佈到其他網站上。 毫無疑問,這很難得到,但它有助於實現您的期望;
- 以需要不同內容的獨特方式刷新您的論壇。 除了標準數據輸入字段外,還添加一些對您的網站訪問者有用的獨特字段(不同於其他網站)。
您可能還喜歡:如何通過視頻內容擴大您的 SEO?
結論
不要太擔心重複的內容。 通常沒什麼大不了的。 大多數情況下,Google 自己都知道如何處理母版頁或內容引用等問題。 此外,很多人都面臨著重複內容的問題。 有時重複出現在他們期望的地方,所以你應該經常檢查站點。 為了防止它們,您需要為每個頁面創建獨特的內容。
本文由伊莎貝爾·喬丹撰寫。 Isabelle 是 ektatraveling.com 保險公司的商業和營銷記者。 她為不同的新聞門戶網站和主題博客撰稿,幫助她始終處於旅遊和保險新聞的核心位置。 這樣的工作讓她有機會就當今最相關的話題撰寫文章。