Google の重複コンテンツの問題を回避するにはどうすればよいですか?
公開: 2021-11-01ページ上の重複コンテンツは予算超過と多くの共通点があります。 この場合のみ、検索ロボットのサイトにおける「信頼バジェット」の減少について話しています。 この問題は多くのサイト所有者にとって懸念事項であり、背後でも発生する可能性があります。 重複コンテンツの問題に関する記事を読んだ後、あなたのサイトは時限爆弾と化しました。 時計をチクタクすれば、Google の制裁があなたを待っています。
悲しいことですが、Web 上には約 25 ~ 30% の重複コンテンツが存在します。 元Google社員のMatt Cutts氏もこの見解を持っています。 重複コンテンツは検索エンジンの最適化において問題に巻き込まれる可能性がありますが、それほど劇的なものではありません。 解決策はあります。この記事を読んで、Google の重複コンテンツの問題を回避する方法を学びましょう。
- 重複コンテンツとは何ですか?
- 重複コンテンツに関する事実
- どのような内容があるのでしょうか?
- コードとは何ですか?
- HTTPS ページ
- 重複コンテンツを作成するコンテンツ管理システム
- 印刷用のページまたは複数の並べ替えオプション
- ブログやアーカイブ システム内の重複コンテンツ
- ユーザーが作成した重複コンテンツ(繰り返し投稿など)
- 結論
重複コンテンツとは何ですか?
重複コンテンツには主に 3 つのタイプがあります。
- 完全な重複: 2 つの URL のコンテンツは完全に同一です。
- 微妙に異なる内容:文章の順序、画像が少し異なるなど。
- クロスドメインの重複:正確なコピーまたはわずかに変更されたコピーが多くのドメインに存在します。
さらに、Google が重複コンテンツとはみなさない、関連する 2 つの概念が存在します。 しかし、経験の浅いパブリッシャーや SEO スペシャリストは、それらを重複コンテンツと簡単に混同してしまう可能性があります。
- コンテンツが薄い:コンテンツが非常に少ないページです。 組織のアドレスのリストに基づいて構築された一連のページ。6,000 個のアドレスが含まれますが、各ページには 1 つのアドレスのみ (わずか数行) が含まれます。
- スライスコンテンツ:互いにわずかに異なるページ。 このサイトでは、サイズ 38、38.5、39、40、41、42 などのティンバーランド シューズを販売しています。サイトに靴のサイズごとに個別のページがある場合、それらのすべてのページ間に若干の違いが生じます。 このような効果は、Google がスライス コンテンツとして認識します。
Google は同様に薄くスライスされたコンテンツを嫌います。 これらの影響はいずれも Google Panda によって検出できます。 そのため、パブリッシャーはこのような種類のページの作成を避けるべきです。
コンテンツの重複は、次のようなさまざまな理由で発生する可能性があります。
- サイトのコンテンツのライセンス。
- 検索エンジン用に最適化されていないコンテンツ管理システムによるサイト アーキテクチャの欠陥。
- 盗作の存在。
過去 5 年間にわたり、スパマーは並外れたコンテンツ ニーズを持って、正規のソースからコンテンツを「パクり」始め、さまざまな複雑なプロセスを使用して単語を置き換え、その結果得られたテキストをページに配置して「ロングテール」検索操作を引きつけてきました。コンテキスト広告やその他の不誠実な目的を示します。 そのため、現在、人々は「重複コンテンツの問題」と「重複コンテンツのペナルティ」の世界に住んでいます。
あなたにおすすめ:優れたコンテンツでマーケティング活動をスピードアップできる 5 つの方法。
重複コンテンツに関する事実
重複したコンテンツの場所
特定のコンテンツがすべてサイト上にある場合、それは重複コンテンツですか?
はい、重複したコンテンツは同じサイトでも異なるサイトでも発生する可能性があるためです。
重複コンテンツの割合
重複コンテンツ フィルターに該当するには、ページの何パーセントを複製する必要がありますか? 残念ながら、検索エンジンは問題自体を防ぐ能力に影響を与えるため、この情報を決して公開しません。 この割合はすべてのエンジンで常に変化します。 肝心なのは、ページが重複しているとみなされるためには同一である必要はないということです。
コードとテキストの比率
コードが非常に大きいのに、ページ上にいくつかの固有の HTML 要素がある場合はどうなるでしょうか? Google はすべてのページが互いに重複していると考えないでしょうか?
いいえ、検索エンジンはコードを気にするのではなく、ページのコンテンツを気にします。 コード サイズが問題になるのは、コード サイズが不釣り合いに大きくなった場合のみです。
ナビゲーション要素と固有コンテンツの比率
サイトのすべてのページには大きなナビゲーション バー、多数のヘッダーとフッターがありますが、コンテンツはほとんどありません。 Google はこれらすべてのページが重複しているとみなさないのでしょうか?
いいえ、Google はページの重複を評価する前に、ナビゲーション要素を考慮します。
ライセンスされたコンテンツ
重複コンテンツの問題を回避したいと考えています。 しかし、訪問者に表示するライセンスを取得した他の Web ソースのコンテンツがある場合はどうすればよいでしょうか?
メタ名 = "robots" content = "noindex, follow" を使用します。 これをページのヘッダーに置くと、検索エンジンはこのコンテンツが自分たちに向けたものではないことを認識します。 もう 1 つのオプションは、そのコンテンツを所有および公開する独占的権利を取得することです。
どのような内容があるのでしょうか?
- ユニークなコンテンツは人によって書かれています。 これは、ウェブ上の他の文字、記号、単語の組み合わせとはまったく異なり、コンピューターのテキスト処理アルゴリズムの影響を受けません。
- フラグメントは、コピーされて何度も使用されるコンテンツの小さな部分 (引用など) です。 特に、多くの固有のコンテンツを含む大きなドキュメントに含まれている場合、これらが検索エンジンに問題を引き起こすことはほとんどありません。
- 帯状疱疹。 検索エンジンは、他の Web ページで比較的小さなフレーズのセグメント (5 ~ 6 語) を検索します。 2 つのドキュメントに含まれるシングルが多すぎる場合、検索エンジンはそれらのドキュメントを重複コンテンツとして解釈する可能性があります。
コードとは何ですか?
重複コンテンツを作成するにはさまざまな方法があります。 これは、ウェブ上に十分すぎるほどの情報が存在する理由を説明しています。 最適化の観点から最良の結果を得るには、内部重複コンテンツには特定の戦術が必要です。 率直に言って、重複ページはユーザーにとっても検索エンジンにとっても価値のないページです。 次に、この問題を完全に回避するようにしてください。 各ページを参照する URL は 1 つだけであることを確認してください。 さらに、古い URL から残りの URL への 301 リダイレクトを実行します。 これにより、検索ロボットはユーザーが行った変更をできるだけ早く確認し、削除されたページに含まれていた「リンクジュース」を保持することができます。
それが不可能な場合は、他の選択肢がたくさんあります。 さまざまなシナリオに対する最も簡単なソリューションの概要を次に示します。
- robots.txt ファイルを使用すると、検索エンジン スパイダーがサイト ページの重複バージョンをクロールするのをブロックできます。
- rel=”canonical” 要素を使用します。これは、重複ページを削除するための次善の解決策です。
- CODE <meta name=”robots” content=”noindex”> を使用して、検索エンジンに重複ページを表示しないように指示します。
ただし、robots.txt を使用してページの表示を防止する場合、ページに noindex または nofollow を適用しても意味がないことに注意してください。 スパイダーはページを読み取ることができないため、noindex または nofollow メタタグを認識することはありません。 これらのツールを念頭に置いて、重複コンテンツの特定の状況を検討してください。
こちらもお勧めです:なぜブランドやビジネスにとってコンテンツライティングが重要なのか?
HTTPS ページ
SSL プロトコル (電子商取引によく使用されるブラウザと Web サーバー間の暗号化されたデータ交換) を使用している場合、サイトには (HTTP: ではなく) HTTPS: で始まるページがあります。 この問題は、HTTPS ページ上のリンクが絶対リンクではなく相対リンクを使用してサイト上の他のページを指している場合に発生します。 たとえば、ホームページへのリンクは http://www.YourDomain.com ではなく https://www.YourDomain.com になります)。
サイトにこの問題がある場合は、rel=”canonical” または 301 リダイレクトを使用して修正できます。 別の解決策は、リンクを絶対リンク (/contenthtml ではなく http://www.YourDomain.com/content.html) に変更することです。これにより、コンテンツを盗む人にとっても少し困難になります。
重複コンテンツを作成するコンテンツ管理システム
場合によっては、サイトに同一のページのバージョンが多数存在することがあります。 これは、複数の URL で同じコンテンツを参照する一部のコンテンツ管理システムの制限によって発生します。 通常、これは完全に余分な重複であり、ユーザーにとっては何の価値もありません。 最善の決定は、重複ページを削除し、削除されたページを残りのページに 301 リダイレクトすることです。 うまくいかない場合は、他の方法を試してください。
印刷用のページまたは複数の並べ替えオプション
多くのサイトでは、同じコンテンツをプリンターに適合した形式でユーザーに提供する印刷用ページが提供されています。 一部の電子商取引サイトでは、複数の並べ替え (サイズ、色、ブランド、価格順) で製品のリストを提供しています。 これらのページはユーザーにとっては価値がありますが、検索エンジンにとっては価値がありません。 したがって、重複コンテンツであると考えられます。 このような状況では、印刷用の CSS スプレッドシートを作成できます。
ブログやアーカイブ システム内の重複コンテンツ
ブログには、重複コンテンツの問題に関する興味深いバリエーションの形式があります。 ブログ投稿はいくつかの異なるページに表示されます。
- ブログのスタートページ。
- その投稿のパーマリンク ページ。
- アーカイブページ。
- カテゴリページ。
各投稿コピーは他のコピーの複製です。 サイト運営者がブログ ホーム ページとパーマリンク ページの両方に投稿が存在するという問題に対処しようとすることはほとんどありません。 そして、検索エンジンはこの問題に非常にうまく対処しているようです。 ただし、カテゴリ ページとアーカイブ ページには投稿スニペットのみを表示するのが合理的かもしれません。
ユーザーが作成した重複コンテンツ(繰り返し投稿など)
さまざまなサイトでは、ブログ、フォーラム、掲示板などのユーザー作成コンテンツを取得するために構造を使用しています。 これらは、非常に低コストで多くのコンテンツを開発するための優れた方法となります。 問題は、ユーザーが同じコンテンツをあなたのサイトと他のいくつかのサイトの両方に同時に公開できるため、コンテンツの重複の問題が発生することです。 これを制御するのは困難ですが、問題を軽減するには次のように進めることができます。
- サイトに提供するコンテンツは独自のものである必要があり、他のサイトに投稿できないことをユーザーに通知する明確なポリシーが必要です。 これを実現するのは間違いなく困難ですが、期待を実現するのに役立ちます。
- さまざまなコンテンツが必要となる独自の方法でフォーラムをブラッシュアップします。 標準のデータ入力フィールドに加えて、サイト訪問者にとって役立つ (他のサイトとは異なる) 独自のフィールドもいくつか追加します。
こちらもお勧めです:動画コンテンツで SEO を強化するには?
結論
重複したコンテンツについてはあまり心配する必要はありません。 通常、それはそれほど大したことではありません。 ほとんどの場合、Google 自体がマスター ページやコンテンツの引用などの問題に対処する方法を知っています。 さらに、多くの人が重複コンテンツの問題に直面しています。 場合によっては、予期しない場所に重複が表示されることがあります。そのため、常にサイトで重複を確認する必要があります。 これらを防ぐには、ページごとに固有のコンテンツを作成する必要があります。
この記事はイザベル・ジョーダンによって書かれています。 イザベルは、保険会社 ektatraveling.com のビジネスおよびマーケティング ジャーナリストです。 彼女はさまざまなニュース ポータルやテーマ別ブログに執筆しており、旅行や保険のニュースの中心に留まるよう努めています。 このような仕事により、彼女は今日の最も関連性の高いトピックについて記事を書く機会を得ることができます。