Cum să evitați problema de conținut duplicat pentru Google?
Publicat: 2021-11-01Conținutul duplicat pe o pagină are multe în comun cu depășirea bugetului. Doar în acest caz, vorbim despre scăderea „Bugetului de încredere” în site-ul robotului de căutare. Această problemă îi privește pe mulți proprietari de site-uri, deoarece poate apărea chiar și la spatele lor. După ce a citit ceva despre problema conținutului duplicat, site-ul dvs. s-a transformat într-o bombă cu ceas. Tic Tac pe ceas și sancțiunile Google vă așteaptă.
Trist, dar adevărat, există aproximativ 25-30% de conținut duplicat pe Web. Fostul Googler Matt Cutts este de părere. Deși conținutul duplicat te poate duce într-o lume de probleme cu optimizarea motoarelor de căutare, nu este chiar atât de dramatic. Există o soluție - citiți acest articol și aflați cum să evitați problemele de conținut duplicat pentru Google.
- Ce este conținutul duplicat?
- Fapte despre conținutul duplicat
- Ce fel de conținut există?
- Ce este CODUL?
- Pagini HTTPS
- Sisteme de management al conținutului care creează conținut duplicat
- Pagini pentru imprimare sau opțiuni multiple de sortare
- Conținut duplicat în bloguri și sisteme de arhivare
- Conținut duplicat generat de utilizatori (postări repetate etc.)
- Concluzie
Ce este conținutul duplicat?
Există 3 tipuri principale de conținut duplicat.
- Dublat exact: două adrese URL au conținut complet identic;
- Conținut cu diferențe ușoare: cum ar fi ordinea propoziției, câteva imagini diferite etc;
- Duble pe mai multe domenii: există o copie exactă sau ușor modificată în multe domenii.
În plus, există două concepte înrudite pe care Google nu le consideră drept conținut duplicat. Dar editorii nu atât de experimentați și specialiștii SEO le pot amesteca cu ușurință cu conținut duplicat.
- Conținut subțire: acestea sunt pagini cu foarte puțin conținut. Set de pagini construite pe o listă de adrese de organizație, care au 6 000 de adrese, dar fiecare pagină conține o singură adresă: doar câteva rânduri.
- Conținutul secțiunii: pagini care diferă ușor unele de altele. Site-ul vinde pantofi Timberland care vin în mărimile 38, 38.5, 39, 40, 41, 42 etc. Dacă site-ul are o pagină separată pentru fiecare mărime de pantof, va exista o diferență minoră între toate acele pagini. Un astfel de efect pe care Google îl percepe ca un fel de conținut.
Google nu-i place conținutul la fel de subțire și feliat. Oricare dintre aceste efecte poate fi detectat de Google Panda. De aceea, editorii ar trebui să evite crearea acestor tipuri de pagini.
Conținutul duplicat se poate întâmpla din mai multe motive:
- acordarea de licențe pentru conținutul site-ului dvs.;
- defecte în arhitectura site-ului din cauza unui sistem de management al conținutului neoptimizat pentru motoarele de căutare;
- existența plagiatului.
În ultimii cinci ani, spammerii, cu o nevoie extraordinară de conținut, au început să „smuleze” conținutul din surse legitime, transpunând cuvinte folosind o varietate de procese complexe și plasând textul rezultat pe paginile lor pentru a atrage operațiuni de căutare cu „coadă lungă”. și arată publicitatea contextuală și alte scopuri necinstite. Deci, în zilele noastre oamenii trăiesc într-o lume a „probleme de conținut duplicat” și „penalități de conținut duplicat”.
Recomandat pentru dvs.: 5 moduri în care un conținut bun vă poate accelera eforturile de marketing.
Fapte despre conținutul duplicat
Locație de conținut duplicat
Dacă tot conținutul anume se află pe site-ul tău, este conținut duplicat?
Da, deoarece conținutul duplicat se poate întâmpla atât pe același site, cât și pe site-uri diferite.
Procent de conținut duplicat
Ce procentaj dintr-o pagină ar trebui să fie duplicat pentru a intra sub un filtru de conținut duplicat? Din păcate, motoarele de căutare nu fac niciodată publice aceste informații, deoarece le-ar afecta capacitatea de a preveni problema în sine. Acest procent se schimbă constant pentru toate motoarele. Concluzia este că paginile nu trebuie să fie identice pentru a fi considerate duplicate.
Raportul cod-text
Ce se întâmplă dacă codul tău este foarte mare, dar există câteva elemente HTML unice pe pagină? Google nu va crede că toate paginile sunt duplicate una cu cealaltă?
Nu. Motoarelor de căutare nu le pasă de codul tău, ci de conținutul paginilor tale. Dimensiunea codului devine o problemă doar atunci când crește disproporționat.
Raportul dintre elementele de navigare și conținutul unic
Toate paginile de pe site-ul dvs. au o bară mare de navigare, multe anteturi și subsoluri, dar foarte puțin conținut. Google nu va considera toate aceste pagini ca fiind duplicate?
Nu. Google ia în considerare elementele de navigare chiar înainte de a evalua paginile pentru duplicare.
Conținut licențiat
Doriți să evitați problema conținutului duplicat. Dar ce să faci dacă ai conținut din alte surse web pe care le-ai autorizat pentru a-l afișa vizitatorilor?
Folosește meta name = „roboți” conținut="noindex, follow". Pune-l în antetul paginii tale, iar motoarele de căutare vor ști că acest conținut nu este pentru ei. O altă opțiune este să obțineți drepturi exclusive de a deține și de a publica acel conținut.
Ce fel de conținut există?
- Conținutul unic este scris de o persoană. Este complet diferită de orice altă combinație de litere, simboluri și cuvinte de pe web și nu a fost afectată de algoritmii de procesare a textului de pe computer.
- Fragmentele sunt mici bucăți de conținut (de exemplu, ghilimele) care sunt copiate și utilizate din nou și din nou. Rareori reprezintă o problemă pentru motoarele de căutare, mai ales atunci când sunt incluse într-un document mai mare, cu mult conținut unic.
- Zoster. Motoarele de căutare caută segmente relativ mici de expresii (cinci până la șase cuvinte) pe alte pagini web. Dacă două documente au prea multe șindrilă, motoarele de căutare pot interpreta acele documente ca conținut duplicat.
Ce este CODUL?
Există multe modalități de a crea conținut duplicat. Acest lucru explică de ce există mai mult decât suficient pe web. Conținutul duplicat intern are nevoie de tactici specifice pentru a obține cele mai bune rezultate în ceea ce privește optimizarea. Sincer vorbind, paginile duplicat sunt pagini fără valoare atât pentru utilizatori, cât și pentru motoarele de căutare. Apoi încercați să evitați complet această problemă. Asigurați-vă că o singură adresă URL se referă la fiecare pagină. Mai mult, faceți o redirecționare 301 pentru vechile URL-uri către URL-urile rămase. Ajută roboții de căutare să vadă cât mai repede posibil modificările pe care le-ați făcut și să păstreze „sucul de link” pe care îl aveau paginile șterse.
Dacă acest lucru nu este posibil, există o mulțime de alte opțiuni. Iată o listă a celor mai simple soluții pentru diferite scenarii:
- Puteți utiliza fișierul robots.txt pentru a bloca accesul cu crawlere a păianjenilor motoarelor de căutare prin versiunile duplicate ale paginilor site-ului dvs.;
- utilizați elementul rel="canonical", care este a doua cea mai bună soluție pentru a elimina paginile duplicate;
- utilizați COD <meta name=”robots” content=”noindex”> pentru a instrui motoarele de CĂUTARE să nu afișeze pagini duplicate.
Cu toate acestea, observați: dacă utilizați robots.txt pentru a preveni vizualizarea paginii, aplicarea noindex sau nofollow pe pagină nu are sens. Deoarece un păianjen nu poate citi pagina, nu va vedea niciodată metaetichetele noindex sau nofollow. Având în vedere aceste instrumente, luați în considerare unele situații specifice de conținut duplicat.
S-ar putea să vă placă: De ce este importantă scrierea de conținut pentru mărci și companii?
Pagini HTTPS
Dacă utilizați protocolul SSL (schimb de date criptate între browser și serverul web, care este adesea folosit pentru comerțul electronic), atunci site-ul dvs. are pagini care încep cu HTTPS: (în loc de HTTP:). Problema apare atunci când linkurile de pe paginile dvs. HTTPS indică către alte pagini de pe site folosind link-uri relative mai degrabă decât absolute. De exemplu, linkul către pagina dvs. de pornire devine https://www.Domeniul Dvs. în loc de http://www.Domeniul Dvs..com).
Dacă site-ul dvs. are această problemă, puteți utiliza rel="canonical" sau redirecționări 301 pentru a o remedia. O soluție alternativă este să schimbi link-urile în absolut: http://www.YourDomain.com/content.html în loc de /contenthtml), ceea ce îngreunează și viața celor care îți fură conținutul.
Sisteme de management al conținutului care creează conținut duplicat
Uneori, un site poate avea o mulțime de versiuni ale paginilor identice. Se întâmplă cu limitări în unele sisteme de management de conținut care se referă la același conținut cu peste o adresă URL. De obicei, este o duplicare complet suplimentară care nu are nicio valoare pentru utilizatori. Cea mai bună decizie este să eliminați paginile duplicate și să faceți o redirecționare 301 pentru paginile eliminate către cele rămase. Dacă nu funcționează, încercați alte metode.
Pagini pentru imprimare sau opțiuni multiple de sortare
O mulțime de site-uri oferă pagini pentru imprimare care oferă utilizatorului același conținut într-un format adaptat pentru imprimantă. Unele site-uri de comerț electronic oferă liste cu produsele lor cu mai multe sortări (după dimensiune, culoare, marcă și preț). Aceste pagini sunt valoroase pentru utilizator, dar nu au nicio valoare pentru motoarele de căutare. Prin urmare, ei cred că este conținut duplicat. Într-o astfel de situație, puteți crea o foaie de calcul CSS pentru imprimare.
Conținut duplicat în bloguri și sisteme de arhivare
Blogurile au forma unei variante interesante în problema conținutului duplicat. O postare de blog poate apărea pe mai multe pagini diferite:
- pagina de start a blogului;
- pagina de permalink pentru acea postare;
- paginile arhivei;
- paginile categoriei.
Fiecare copie postată este un duplicat al celorlalte copii. Foarte rar editorii încearcă să se ocupe de problema prezenței unei postări atât pe pagina de pornire a blogului, cât și pe pagina de permalinkuri. Iar motoarele de căutare par să facă față destul de bine acestei probleme. Cu toate acestea, ar putea avea sens să afișați numai fragmente de postare în paginile de categorii și de arhivă.
Conținut duplicat generat de utilizatori (postări repetate etc.)
O varietate de site-uri utilizează structuri pentru a obține conținut generat de utilizatori, cum ar fi bloguri, forumuri sau panouri de mesaje. Acestea pot fi modalități excelente de a dezvolta o mulțime de conținut la un cost foarte scăzut. Problema este că un utilizator poate publica același conținut atât pe site-ul dvs., cât și pe mai multe alte site-uri în același timp, ceea ce duce la probleme de conținut duplicat. Este dificil de controlat, dar pentru a reduce problema puteți proceda după cum urmează:
- Trebuie să aveți o politică clară care să notifice utilizatorii că conținutul pe care îl furnizează site-ului dvs. ar trebui să fie unic și nu poate fi postat pe alte site-uri. Fără îndoială, este dificil să obții asta, dar te va ajuta să-ți realizezi așteptările;
- Îmbunătățiți-vă forumul într-un mod unic, care va avea nevoie de conținut diferit. Pe lângă câmpurile standard de introducere a datelor, adăugați și câteva câmpuri unice (diferite de alte site-uri) care vor fi utile pentru vizitatorii site-ului dvs.
S-ar putea să vă placă și: Cum să vă amplificați SEO cu conținut video?
Concluzie
Nu vă faceți griji prea mult cu privire la conținutul duplicat. De obicei, nu este o problemă atât de mare. În cea mai mare parte, Google însuși știe cum să se ocupe de probleme precum paginile principale sau citările de conținut. În plus, mulți oameni se confruntă cu problema conținutului duplicat. Uneori, duplicatele nu apar nimănui acolo unde se așteaptă, așa că ar trebui să verificați întotdeauna site-ul pentru ele. Pentru a le preveni, trebuie să creați conținut unic pentru fiecare pagină.
Acest articol este scris de Isabelle Jordan. Isabelle este jurnalist de afaceri și marketing la compania de asigurări ektatraveling.com. Ea scrie pentru diferite portaluri de știri și bloguri tematice care o ajută să rămână în centrul știrilor despre călătorii și asigurări. O astfel de muncă îi oferă posibilitatea de a scrie articole pe cele mai relevante subiecte de astăzi.