Come evitare il problema dei contenuti duplicati per Google?
Pubblicato: 2021-11-01Il contenuto duplicato su una pagina ha molto in comune con un superamento del budget. Solo in questo caso si parla di diminuzione del “Trust Budget” nel sito del robot di ricerca. Questo problema riguarda molti proprietari di siti, poiché può apparire anche alle loro spalle. Dopo aver letto qualcosa sul problema dei contenuti duplicati, il tuo sito si è trasformato in una bomba a orologeria. Tick Tock sull'orologio e le sanzioni di Google ti stanno aspettando.
Triste ma vero, c'è circa il 25-30% di contenuti duplicati sul Web. L'ex googler Matt Cutts ha questa opinione. Sebbene i contenuti duplicati possano metterti in un mondo di guai con l'ottimizzazione dei motori di ricerca, non è poi così drammatico. C'è una soluzione: leggi questo articolo e scopri come evitare problemi di contenuti duplicati per Google.
- Che cos'è il contenuto duplicato?
- Informazioni sui contenuti duplicati
- Che tipo di contenuto c'è?
- Cos'è il CODICE?
- Pagine HTTPS
- Sistemi di gestione dei contenuti che creano contenuti duplicati
- Pagine per la stampa o più opzioni di ordinamento
- Contenuti duplicati nei blog e nei sistemi di archiviazione
- Contenuto duplicato generato dall'utente (post ripetuti, ecc.)
- Conclusione
Che cos'è il contenuto duplicato?
Esistono 3 tipi principali di contenuto duplicato.
- Duplicato esatto: due URL hanno contenuti completamente identici;
- Contenuto con lievi differenze: come l'ordine delle frasi, un po' di immagini diverse, ecc;
- Duplicati interdominio: esiste una copia esatta o leggermente modificata in molti domini.
Inoltre, esistono due concetti correlati che Google non considera contenuti duplicati. Ma editori e specialisti SEO non così esperti possono facilmente confonderli con contenuti duplicati.
- Contenuti scarni: sono pagine con pochissimi contenuti. Insieme di pagine costruito su un elenco di indirizzi di organizzazioni, che hanno 6 000 indirizzi, ma ogni pagina contiene un solo indirizzo: solo poche righe.
- Slice content: Pagine che differiscono leggermente l'una dall'altra. Il sito vende scarpe Timberland disponibili nelle taglie 38, 38,5, 39, 40, 41, 42, ecc. Se il sito ha una pagina separata per ogni misura di scarpa, ci sarà una piccola differenza tra tutte quelle pagine. Un tale effetto che Google percepisce come fetta di contenuto.
A Google non piacciono i contenuti ugualmente sottili e tagliati. Ognuno di questi effetti può essere rilevato da Google Panda. Ecco perché gli editori dovrebbero evitare di creare questo tipo di pagine.
I contenuti duplicati possono verificarsi per una serie di motivi:
- licenza del contenuto del tuo sito;
- difetti nell'architettura del sito dovuti a un sistema di gestione dei contenuti non ottimizzato per i motori di ricerca;
- esistenza del plagio.
Negli ultimi cinque anni, gli spammer, con una straordinaria esigenza di contenuto, hanno iniziato a “rubare” contenuti da fonti legittime, trasponendo le parole utilizzando una varietà di processi complessi e inserendo il testo risultante nelle loro pagine per attirare operazioni di ricerca “a coda lunga” e mostrare la pubblicità contestuale e altri scopi disonesti. Quindi, al giorno d'oggi le persone vivono in un mondo di "problemi di contenuti duplicati" e "sanzioni per contenuti duplicati".
Consigliato per te: 5 modi in cui un buon contenuto può accelerare i tuoi sforzi di marketing.
Informazioni sui contenuti duplicati
Posizione del contenuto duplicata
Se tutti i determinati contenuti si trovano sul tuo sito, si tratta di contenuti duplicati?
Sì, perché i contenuti duplicati possono verificarsi sia sullo stesso sito che su siti diversi.
Percentuale di contenuto duplicato
Quale percentuale di una pagina deve essere duplicata per rientrare in un filtro per i contenuti duplicati? Sfortunatamente, i motori di ricerca non rendono mai pubbliche queste informazioni perché influirebbero sulla loro capacità di prevenire il problema stesso. Questa percentuale cambia costantemente per tutti i motori. La linea di fondo è che le pagine non devono essere identiche per essere considerate duplicati.
Il rapporto tra codice e testo
Cosa succede se il tuo codice è molto grande, ma ci sono alcuni elementi HTML univoci sulla pagina? Google non penserà che tutte le pagine siano duplicati l'una dell'altra?
No. I motori di ricerca non si preoccupano del tuo codice, ma del contenuto delle tue pagine. La dimensione del codice diventa un problema solo quando cresce a dismisura.
Gli elementi di navigazione rispetto al rapporto contenuto unico
Tutte le pagine del tuo sito hanno una grande barra di navigazione, molte intestazioni e piè di pagina, ma pochissimi contenuti. Google non considererà tutte queste pagine come duplicate?
No. Google considera gli elementi di navigazione prima ancora di valutare la duplicazione delle pagine.
Contenuto concesso in licenza
Vuoi evitare il problema del contenuto duplicato. Ma cosa fare se disponi di contenuti provenienti da altre fonti Web che hai concesso in licenza per mostrarli ai tuoi visitatori?
Usa meta name = "robots" content = "noindex, segui". Mettilo nell'intestazione della tua pagina e i motori di ricerca sapranno che questo contenuto non è per loro. Un'altra opzione è ottenere diritti esclusivi per possedere e pubblicare quel contenuto.
Che tipo di contenuto c'è?
- Il contenuto unico è scritto da una persona. È completamente diverso da qualsiasi altra combinazione di lettere, simboli e parole sul Web e non è stato influenzato dagli algoritmi di elaborazione del testo del computer.
- I frammenti sono piccoli pezzi di contenuto (ad esempio citazioni) che vengono copiati e utilizzati più e più volte. Raramente rappresentano un problema per i motori di ricerca, soprattutto se inclusi in un documento più ampio con molti contenuti unici.
- Herpes zoster. I motori di ricerca cercano segmenti di frasi relativamente piccoli (da cinque a sei parole) su altre pagine web. Se due documenti hanno troppi herpes zoster, i motori di ricerca potrebbero interpretare quei documenti come contenuto duplicato.
Cos'è il CODICE?
Esistono molti modi per creare contenuti duplicati. Questo spiega perché ce n'è più che sufficiente sul web. I contenuti duplicati interni necessitano di tattiche specifiche per ottenere i migliori risultati in termini di ottimizzazione. Francamente, le pagine duplicate sono pagine prive di valore sia per gli utenti che per i motori di ricerca. Quindi cerca di evitare completamente questo problema. Assicurati che un solo URL faccia riferimento a ciascuna pagina. Inoltre, esegui un reindirizzamento 301 per i vecchi URL agli URL rimanenti. Aiuta i robot di ricerca a vedere le modifiche che hai apportato il più rapidamente possibile ea mantenere il "link juice" che avevano le pagine eliminate.
Se ciò non è possibile, ci sono molte altre opzioni. Ecco una carrellata delle soluzioni più semplici per vari scenari:
- Puoi utilizzare il file robots.txt per impedire agli spider dei motori di ricerca di eseguire la scansione delle versioni duplicate delle pagine del tuo sito;
- usa l'elemento rel="canonical", che è la seconda migliore soluzione per rimuovere le pagine duplicate;
- usa CODE <meta name=”robots” content=”noindex”> per istruire i motori di RICERCA a non mostrare pagine duplicate.
Tuttavia, nota: se utilizzi robots.txt per impedire la visualizzazione della pagina, l'applicazione di noindex o nofollow sulla pagina non ha senso. Poiché uno spider non può leggere la pagina, non vedrà mai i meta-tag noindex o nofollow. Tenendo presenti questi strumenti, considera alcune situazioni specifiche di contenuti duplicati.
Ti potrebbe piacere: Perché la scrittura di contenuti è importante per marchi e aziende?
Pagine HTTPS
Se utilizzi il protocollo SSL (scambio di dati crittografati tra il browser e il server Web, spesso utilizzato per l'e-commerce), il tuo sito ha pagine che iniziano con HTTPS: (invece di HTTP:). Il problema si presenta quando i collegamenti sulle tue pagine HTTPS puntano ad altre pagine del sito utilizzando collegamenti relativi anziché assoluti. Ad esempio, il link alla tua home page diventa https://www.YourDomain.com anziché http://www.YourDomain.com).
Se il tuo sito presenta questo problema, puoi utilizzare rel="canonical" o reindirizzamenti 301 per risolverlo. Una soluzione alternativa è cambiare i link in assoluto: http://www.YourDomain.com/content.html invece di /contenthtml), il che rende anche la vita un po' più difficile a coloro che rubano i tuoi contenuti.
Sistemi di gestione dei contenuti che creano contenuti duplicati
A volte un sito può avere molte versioni di pagine identiche. Succede alle limitazioni in alcuni sistemi di gestione dei contenuti che fanno riferimento allo stesso contenuto con più di un URL. Di solito è una duplicazione completamente extra che non ha alcun valore per gli utenti. La decisione migliore è rimuovere le pagine duplicate ed eseguire un reindirizzamento 301 per le pagine rimosse a quelle rimanenti. Se non funziona, prova altri metodi.
Pagine per la stampa o più opzioni di ordinamento
Molti siti offrono pagine per la stampa che danno all'utente lo stesso contenuto in un formato adattato alla stampante. Alcuni siti di e-commerce forniscono elenchi dei loro prodotti con più ordinamenti (per dimensione, colore, marca e prezzo). Queste pagine hanno valore per l'utente ma non lo sono per i motori di ricerca. Pertanto, pensano che sia un contenuto duplicato. In una situazione del genere, puoi creare un foglio di calcolo CSS per la stampa.
Contenuti duplicati nei blog e nei sistemi di archiviazione
I blog hanno la forma di un'interessante variante sulla questione dei contenuti duplicati. Un post sul blog può apparire su diverse pagine:
- la pagina iniziale del blog;
- la pagina del permalink per quel post;
- le pagine di archivio;
- le pagine di categoria.
Ogni copia postale è un duplicato delle altre copie. Molto raramente gli editori cercano di affrontare il problema della presenza di un post sia sulla home page del blog che sulla pagina dei permalink. E i motori di ricerca sembrano affrontare abbastanza bene questo problema. Tuttavia, potrebbe avere senso mostrare solo i frammenti di post nelle pagine delle categorie e degli archivi.
Contenuto duplicato generato dall'utente (post ripetuti, ecc.)
Una varietà di siti utilizza strutture per ottenere contenuti generati dagli utenti, come blog, forum o bacheche. Questi possono essere ottimi modi per sviluppare molti contenuti a un costo molto basso. Il problema è che un utente può pubblicare lo stesso contenuto sia sul tuo sito che su diversi altri siti contemporaneamente, il che porta a problemi di contenuti duplicati. È difficile da controllare, ma per ridurre il problema puoi procedere come segue:
- È necessario disporre di una politica chiara che informi gli utenti che il contenuto che forniscono al tuo sito deve essere unico e non può essere pubblicato su altri siti. Senza dubbio, è difficile ottenerlo, ma ti aiuterà a realizzare le tue aspettative;
- Rispolvera il tuo forum in un modo unico che avrà bisogno di contenuti diversi. Oltre ai campi di inserimento dati standard, aggiungi anche alcuni campi univoci (diversi da altri siti) che saranno utili per i visitatori del tuo sito.
Ti potrebbe piacere anche: Come amplificare il tuo SEO con contenuti video?
Conclusione
Non preoccuparti troppo dei contenuti duplicati. Di solito non è un grosso problema. Principalmente Google stesso sa come gestire problemi come pagine master o citazioni di contenuti. Inoltre, molte persone affrontano il problema dei contenuti duplicati. A volte i duplicati non appaiono a nessuno dove si aspettano, quindi dovresti sempre controllare il sito per loro. Per prevenirli, è necessario creare contenuti unici per ogni pagina.
Questo articolo è stato scritto da Isabelle Jordan. Isabelle è giornalista commerciale e di marketing presso la compagnia di assicurazioni ektatraveling.com. Scrive per diversi portali di notizie e blog tematici che la aiutano a rimanere al centro delle notizie di viaggi e assicurazioni. Tale lavoro le dà l'opportunità di scrivere articoli sugli argomenti più rilevanti di oggi.