Bagaimana Cara Menghindari Masalah Duplikat Konten untuk Google?

Diterbitkan: 2021-11-01

Duplikat konten pada halaman memiliki banyak kesamaan dengan kelebihan anggaran. Hanya dalam kasus ini, kita berbicara tentang penurunan "Anggaran Kepercayaan" di situs robot pencari. Masalah ini menjadi perhatian banyak pemilik situs, karena dapat muncul bahkan di belakang mereka. Setelah membaca sesuatu tentang masalah duplikat konten, situs Anda berubah menjadi bom waktu. Centang Tok tepat waktu dan sanksi Google menunggu Anda.

Sedih tapi benar, ada sekitar 25-30% konten duplikat di Web. Mantan Googler Matt Cutts memegang pandangan ini. Meskipun duplikat konten dapat membawa Anda ke dunia masalah dengan pengoptimalan mesin pencari, itu tidak terlalu dramatis. Ada solusinya — baca artikel ini dan ketahui cara menghindari masalah duplikat konten untuk Google.

Daftar Isi menunjukkan
  • Apa itu duplikat konten?
  • Fakta tentang duplikat konten
  • Ada konten apa saja?
  • Apa itu KODE?
    • halaman HTTPS
    • Sistem manajemen konten membuat konten duplikat
    • Halaman untuk dicetak atau beberapa opsi penyortiran
    • Duplikat konten di blog dan sistem pengarsipan
    • Konten duplikat yang dibuat pengguna (posting berulang, dll.)
  • Kesimpulan

Apa itu duplikat konten?

content-marketing-desk-laptop-note-work-writing-article-blog
Ada 3 jenis utama konten duplikat.
  • Duplikat persis: Dua URL memiliki konten yang sepenuhnya identik;
  • Konten dengan sedikit perbedaan: Seperti urutan kalimat, gambar yang sedikit berbeda, dll;
  • Duplikat lintas-domain: Salinan yang sama persis atau sedikit diubah ada di banyak domain.

Selain itu, ada dua konsep terkait yang tidak dianggap Google sebagai konten duplikat. Tetapi penerbit dan spesialis SEO yang tidak begitu berpengalaman dapat dengan mudah mencampurnya dengan konten duplikat.

  • Konten tipis: Ini adalah halaman dengan konten yang sangat sedikit. Kumpulan halaman yang dibangun di atas daftar alamat organisasi, yang memiliki 6.000 alamat, tetapi setiap halaman hanya berisi satu alamat: hanya beberapa baris.
  • Konten potongan: Halaman yang sedikit berbeda satu sama lain. Situs tersebut menjual sepatu Timberland yang tersedia dalam ukuran 38, 38,5, 39, 40, 41, 42, dll. Jika situs tersebut memiliki halaman terpisah untuk setiap ukuran sepatu, akan ada sedikit perbedaan di antara semua halaman tersebut. Efek seperti itu yang dirasakan Google sebagai konten irisan.

Google tidak menyukai konten yang tipis dan teriris. Semua efek ini dapat dideteksi oleh Google Panda. Itulah mengapa penerbit harus menghindari membuat jenis halaman ini.

Konten duplikat dapat terjadi karena sejumlah alasan:
  • lisensi konten situs Anda;
  • cacat dalam arsitektur situs karena sistem manajemen konten tidak dioptimalkan untuk mesin telusur;
  • adanya plagiarisme.

Selama lima tahun terakhir, pelaku spam, dengan kebutuhan konten yang luar biasa, telah mulai "merobek" konten dari sumber yang sah, mengubah urutan kata dengan menggunakan berbagai proses rumit dan menempatkan teks yang dihasilkan di halaman mereka untuk menarik operasi pencarian "ekor panjang". dan menunjukkan iklan kontekstual dan tujuan tidak jujur ​​lainnya. Jadi, saat ini orang hidup di dunia "masalah konten duplikat" dan "penalti konten duplikat".

Direkomendasikan untuk Anda: 5 Cara Konten yang Baik Dapat Mempercepat Upaya Pemasaran Anda.

Fakta tentang duplikat konten

pertanyaan-jawaban-faq-permintaan-bantuan
Lokasi konten duplikat

Jika semua konten tertentu ada di situs Anda, apakah itu konten duplikat?

Ya, karena duplikat konten bisa terjadi baik di situs yang sama maupun berbeda.

Persentase konten duplikat

Berapa persentase halaman yang harus digandakan agar termasuk dalam filter duplikat konten? Sayangnya, mesin pencari tidak pernah mempublikasikan informasi ini karena akan memengaruhi kemampuan mereka untuk mencegah masalah itu sendiri. Persentase ini terus berubah untuk semua mesin. Intinya adalah bahwa halaman tidak harus identik untuk dianggap duplikat.

Rasio kode ke teks

Bagaimana jika kode Anda sangat besar, tetapi ada beberapa elemen HTML unik di halaman? Tidakkah Google akan berpikir bahwa semua halaman adalah duplikat satu sama lain?

Tidak. Mesin telusur tidak peduli dengan kode Anda, tetapi tentang konten halaman Anda. Ukuran kode hanya menjadi masalah ketika tumbuh di luar proporsi.

Rasio elemen navigasi terhadap konten unik

Semua halaman di situs Anda memiliki bilah navigasi yang besar, banyak header, dan footer, tetapi kontennya sangat sedikit. Apakah Google tidak akan menganggap semua halaman ini sebagai duplikat?

Tidak. Google mempertimbangkan elemen navigasi bahkan sebelum mengevaluasi halaman untuk duplikasi.

Konten berlisensi

Anda ingin menghindari masalah duplikat konten. Tapi apa yang harus dilakukan jika Anda memiliki konten dari sumber web lain yang Anda lisensikan untuk ditampilkan kepada pengunjung Anda?

Gunakan meta name = "robots" content = "noindex, follow". Taruh di header halaman Anda, dan mesin pencari akan tahu bahwa konten ini bukan untuk mereka. Pilihan lainnya adalah mendapatkan hak eksklusif untuk memiliki dan menerbitkan konten tersebut.

Ada konten apa saja?

penelitian komputer-laptop-meja-kerja-kantor-konten-penulisan-catatan
  • Konten unik ditulis oleh seseorang. Ini benar-benar berbeda dari kombinasi huruf, simbol, dan kata lainnya di web dan tidak terpengaruh oleh algoritme pemrosesan teks komputer.
  • Fragmen adalah bagian kecil dari konten (misalnya kutipan) yang disalin dan digunakan berulang kali. Mereka jarang menimbulkan masalah bagi mesin telusur, terutama jika disertakan dalam dokumen yang lebih besar dengan banyak konten unik.
  • Herpes zoster. Mesin pencari mencari segmen frasa yang relatif kecil (lima hingga enam kata) di halaman web lain. Jika dua dokumen memiliki terlalu banyak sirap, mesin pencari dapat menafsirkan dokumen tersebut sebagai duplikat konten.

Apa itu KODE?

pengembangan web kode pemrograman

Ada banyak cara untuk membuat konten duplikat. Ini menjelaskan mengapa jumlahnya lebih dari cukup di web. Konten duplikat internal membutuhkan taktik khusus untuk mendapatkan hasil terbaik dalam hal optimasi. Terus terang, halaman duplikat adalah halaman yang tidak bernilai bagi pengguna dan mesin telusur. Kemudian cobalah untuk menghindari masalah ini sepenuhnya. Pastikan hanya satu URL yang merujuk ke setiap halaman. Selanjutnya lakukan redirect 301 untuk URL lama ke URL yang tersisa. Ini membantu robot pencarian untuk melihat perubahan yang Anda buat secepat mungkin dan menyimpan "jus tautan" yang dimiliki halaman yang dihapus.

Jika ini tidak memungkinkan, ada banyak opsi lain. Berikut ini ikhtisar solusi termudah untuk berbagai skenario:

  • Anda dapat menggunakan file robots.txt untuk memblokir spider mesin telusur agar tidak merayapi versi duplikat halaman situs Anda;
  • gunakan elemen rel="canonical", yang merupakan solusi terbaik kedua untuk menghapus halaman duplikat;
  • gunakan KODE <meta name=”robots” content=”noindex”> untuk menginstruksikan mesin SEARCH agar tidak menampilkan halaman duplikat.

Namun, perhatikan: jika Anda menggunakan robots.txt untuk mencegah tampilan halaman, menerapkan noindex atau nofollow pada halaman tidak masuk akal. Karena laba-laba tidak dapat membaca halaman, ia tidak akan pernah melihat meta-tag noindex atau nofollow. Dengan mempertimbangkan alat ini, pertimbangkan beberapa situasi spesifik dari konten duplikat.

Anda mungkin menyukai: Mengapa Penulisan Konten Penting untuk Merek dan Bisnis?

halaman HTTPS

Jika Anda menggunakan protokol SSL (pertukaran data terenkripsi antara browser dan server web, yang sering digunakan untuk perdagangan elektronik), maka situs Anda memiliki laman yang dimulai dengan HTTPS: (bukan HTTP:). Masalahnya muncul ketika tautan pada halaman HTTPS Anda mengarah ke halaman lain di situs menggunakan tautan relatif, bukan tautan absolut. Misalnya, tautan ke beranda Anda menjadi https://www.DomainAnda.com alih-alih http://www.DomainAnda.com).

Jika situs Anda mengalami masalah ini, Anda dapat menggunakan pengalihan rel=”canonical” atau 301 untuk memperbaikinya. Solusi alternatifnya adalah dengan mengubah link menjadi absolute: http://www.YourDomain.com/content.html bukan /contenthtml), yang juga membuat hidup sedikit lebih sulit bagi mereka yang mencuri konten Anda.

Sistem manajemen konten membuat konten duplikat

Terkadang sebuah situs dapat memiliki banyak versi halaman yang identik. Itu terjadi pada batasan di beberapa sistem manajemen konten yang merujuk ke konten yang sama dengan lebih dari satu URL. Ini biasanya merupakan duplikasi ekstra yang tidak ada nilainya bagi pengguna. Keputusan terbaik adalah menghapus halaman duplikat dan melakukan pengalihan 301 untuk halaman yang dihapus ke halaman lainnya. Jika tidak berhasil, coba metode lain.

Halaman untuk dicetak atau beberapa opsi penyortiran

Banyak situs menawarkan halaman untuk dicetak yang memberi pengguna konten yang sama dalam format yang disesuaikan dengan printer. Beberapa situs e-niaga menyediakan daftar produk mereka dengan beberapa penyortiran (berdasarkan ukuran, warna, merek, dan harga). Halaman-halaman ini bernilai bagi pengguna tetapi tidak bernilai bagi mesin telusur. Oleh karena itu, mereka mengira itu adalah konten duplikat. Dalam situasi seperti itu, Anda dapat membuat spreadsheet CSS untuk dicetak.

Duplikat konten di blog dan sistem pengarsipan

Blog memiliki bentuk varian yang menarik pada masalah duplikat konten. Posting blog dapat muncul di beberapa halaman berbeda:

  • halaman awal blog;
  • halaman permalink untuk posting itu;
  • halaman arsip;
  • halaman kategori.

Setiap salinan posting adalah duplikat dari salinan lainnya. Sangat jarang penerbit mencoba menangani masalah keberadaan posting baik di beranda blog maupun di halaman permalinks. Dan mesin pencari tampaknya mengatasi masalah ini dengan cukup baik. Namun, masuk akal untuk hanya menampilkan cuplikan postingan pada halaman kategori dan arsip.

Konten duplikat yang dibuat pengguna (posting berulang, dll.)

Berbagai situs menggunakan struktur untuk mendapatkan konten buatan pengguna, seperti blog, forum, atau papan pesan. Ini bisa menjadi cara yang bagus untuk mengembangkan banyak konten dengan biaya yang sangat rendah. Masalahnya adalah pengguna dapat memublikasikan konten yang sama di situs Anda dan beberapa situs lain secara bersamaan, yang menyebabkan masalah duplikat konten. Sulit untuk mengontrolnya, tetapi untuk mengurangi masalah Anda dapat melanjutkan sebagai berikut:

  • Anda harus memiliki kebijakan yang jelas yang memberi tahu pengguna bahwa konten yang mereka berikan ke situs Anda harus unik dan tidak dapat diposting di situs lain. Tanpa pertanyaan, sulit untuk mendapatkan ini, tetapi ini akan membantu mewujudkan harapan Anda;
  • Poles forum Anda dengan cara unik yang membutuhkan konten berbeda. Selain bidang entri data standar, tambahkan juga beberapa bidang unik (berbeda dari situs lain) yang akan berguna bagi pengunjung situs Anda.
Anda mungkin juga menyukai: Bagaimana Memperkuat SEO Anda dengan Konten Video?

Kesimpulan

tanda-satu-arah-jalan-pemberitahuan-duplikat-motivasi-pekerjaan

Jangan terlalu khawatir tentang duplikat konten. Ini biasanya bukan masalah besar. Sebagian besar Google sendiri tahu bagaimana menangani masalah seperti halaman master atau kutipan konten. Selain itu, banyak orang menghadapi masalah duplikat konten. Terkadang duplikat tidak terlihat oleh siapa pun di tempat yang mereka harapkan, jadi Anda harus selalu memeriksa situsnya. Untuk mencegahnya, Anda perlu membuat konten unik untuk setiap halaman.

Penulis-Gambar-Isabelle-Jordan Artikel ini ditulis oleh Isabelle Jordan. Isabelle adalah jurnalis bisnis dan pemasaran di perusahaan asuransi ektatraveling.com. Dia menulis untuk berbagai portal berita dan blog tematik yang membantunya tetap berada di jantung berita perjalanan dan asuransi. Pekerjaan semacam itu memberinya kesempatan untuk menulis artikel tentang topik paling relevan saat ini.