Google의 중복 콘텐츠 문제를 피하는 방법은 무엇입니까?

게시 됨: 2021-11-01

페이지의 중복 콘텐츠는 예산 초과와 공통점이 많습니다. 이 경우에만 검색 로봇 사이트의 "신뢰 예산"감소에 대해 이야기하고 있습니다. 이 문제는 등 뒤에서 나타날 수 있으므로 많은 사이트 소유자와 관련이 있습니다. 중복 콘텐츠 문제에 대해 읽은 후 귀하의 사이트는 시한 폭탄으로 변했습니다. 시계의 Tick Tock과 Google 제재가 여러분을 기다리고 있습니다.

슬프지만 사실 웹에는 중복 콘텐츠의 약 25-30%가 있습니다. 전 Google 직원인 Matt Cutts가 이 견해를 가지고 있습니다. 중복 콘텐츠로 인해 검색 엔진 최적화 문제가 발생할 수 있지만 그다지 극적인 것은 아닙니다. 해결책이 있습니다. 이 도움말을 읽고 Google의 중복 콘텐츠 문제를 방지하는 방법을 알아보세요.

목차 보기

중복 콘텐츠란 무엇입니까?
중복 콘텐츠에 대한 사실
어떤 콘텐츠가 있나요?
코드는 무엇입니까?
- HTTPS 페이지
- 중복 콘텐츠를 생성하는 콘텐츠 관리 시스템
- 인쇄용 페이지 또는 여러 정렬 옵션
- 블로그 및 보관 시스템의 중복 콘텐츠
- 사용자 생성 중복 콘텐츠(반복 게시물 등)
결론

중복 콘텐츠란 무엇입니까?

중복 콘텐츠에는 3가지 주요 유형이 있습니다.

완전 중복: 두 URL의 내용이 완전히 동일합니다.
약간의 차이가 있는 콘텐츠: 문장 순서, 약간 다른 이미지 등
도메인 간 중복: 정확하거나 약간 변경된 사본이 많은 도메인에 존재합니다.

또한 Google이 중복 콘텐츠로 간주하지 않는 두 가지 관련 개념이 있습니다. 그러나 경험이 많지 않은 게시자와 SEO 전문가는 중복 콘텐츠와 쉽게 섞일 수 있습니다.

얇은 콘텐츠: 콘텐츠가 매우 적은 페이지입니다. 6,000개의 주소가 있는 조직 주소 목록에 구축된 페이지 집합이지만 각 페이지에는 단 몇 줄의 주소만 포함됩니다.
슬라이스 콘텐츠: 서로 약간 다른 페이지. 이 사이트는 38, 38.5, 39, 40, 41, 42 등의 크기로 제공되는 Timberland 신발을 판매합니다. 사이트에 각 신발 크기에 대한 별도의 페이지가 있는 경우 모든 페이지 간에 약간의 차이가 있습니다. 이러한 효과는 Google이 슬라이스 콘텐츠로 인식합니다.

Google은 똑같이 얇고 얇게 썬 콘텐츠를 싫어합니다. 이러한 효과는 모두 Google Panda에서 감지할 수 있습니다. 그렇기 때문에 발행인은 이러한 유형의 페이지 작성을 피해야 합니다.

중복 콘텐츠는 여러 가지 이유로 발생할 수 있습니다.

귀하의 사이트 콘텐츠에 대한 라이센스;
검색 엔진에 최적화되지 않은 콘텐츠 관리 시스템으로 인한 사이트 아키텍처 결함
표절의 존재.

지난 5년 동안 특별한 콘텐츠가 필요한 스팸 발송자들은 합법적인 소스에서 콘텐츠를 "찢어내기" 시작했습니다. 다양한 복잡한 프로세스를 사용하여 단어를 바꾸고 결과 텍스트를 자신의 페이지에 배치하여 "롱테일" 검색 작업을 유도했습니다. 문맥 광고 및 기타 부정직한 목표를 보여줍니다. 그래서 요즘 사람들은 '중복 콘텐츠 이슈'와 '중복 콘텐츠 제재'의 세상에서 살고 있다.

추천: 좋은 콘텐츠로 마케팅 활동을 가속화할 수 있는 5가지 방법.

중복 콘텐츠에 대한 사실

중복 콘텐츠 위치

특정 콘텐츠가 모두 사이트에 있는 경우 중복 콘텐츠인가요?

예. 동일한 사이트와 다른 사이트 모두에서 중복 콘텐츠가 발생할 수 있기 때문입니다.

중복 콘텐츠 비율

중복 콘텐츠 필터에 속하려면 페이지의 몇 퍼센트를 복제해야 합니까? 안타깝게도 검색 엔진은 이 정보를 공개하지 않습니다. 문제 자체를 방지하는 능력에 영향을 미치기 때문입니다. 이 비율은 모든 엔진에 대해 지속적으로 변경됩니다. 결론은 페이지가 중복으로 간주되기 위해 동일할 필요가 없다는 것입니다.

코드 대 텍스트 비율

코드가 매우 크지만 페이지에 몇 가지 고유한 HTML 요소가 있는 경우 어떻게 합니까? Google은 모든 페이지가 서로 중복된다고 생각하지 않을까요?

아니요. 검색 엔진은 코드가 아니라 페이지 콘텐츠에 관심이 있습니다. 코드 크기는 비례하지 않을 때만 문제가 됩니다.

고유 콘텐츠 비율에 대한 탐색 요소

사이트의 모든 페이지에는 큰 탐색 모음, 많은 머리글 및 바닥글이 있지만 콘텐츠는 거의 없습니다. Google은 이러한 모든 페이지를 중복된 것으로 간주하지 않습니까?

아니요. Google은 페이지 중복 여부를 평가하기 전에 탐색 요소를 고려합니다.

라이선스 콘텐츠

콘텐츠 중복 문제를 피하고 싶습니다. 그러나 방문자에게 표시하도록 라이선스를 부여한 다른 웹 소스의 콘텐츠가 있는 경우 어떻게 해야 합니까?

메타 이름 사용 = "로봇" 콘텐츠 = "noindex, follow". 페이지 헤더에 넣으면 검색 엔진이 이 콘텐츠가 자신을 위한 것이 아님을 알게 됩니다. 또 다른 옵션은 해당 콘텐츠를 소유하고 게시할 독점권을 얻는 것입니다.

어떤 콘텐츠가 있나요?

고유한 콘텐츠 는 사람이 작성합니다. 웹상의 다른 문자, 기호 및 단어 조합과 완전히 다르며 컴퓨터 텍스트 처리 알고리즘의 영향을 받지 않습니다.
단편은 반복해서 복사되고 사용되는 작은 콘텐츠 조각(예: 인용 부호)입니다. 특히 고유한 콘텐츠가 많은 더 큰 문서에 포함될 때 검색 엔진에 거의 문제를 일으키지 않습니다.
대상 포진. 검색 엔진은 다른 웹 페이지에서 상대적으로 작은 구문 세그먼트(5~6단어)를 찾습니다. 두 문서에 대상 포진이 너무 많으면 검색 엔진이 해당 문서를 중복 콘텐츠로 해석할 수 있습니다.

코드는 무엇입니까?

중복 콘텐츠를 만드는 방법에는 여러 가지가 있습니다. 이것은 웹에 충분한 것 이상이 있는 이유를 설명합니다. 내부 복제 콘텐츠는 최적화 측면에서 최상의 결과를 얻기 위해 특정 전략이 필요합니다. 솔직히 말해서 중복 페이지는 사용자와 검색 엔진 모두에 가치가 없는 페이지입니다. 그런 다음 이 문제를 완전히 피하십시오. 하나의 URL만 각 페이지를 참조하는지 확인하십시오. 또한 이전 URL에 대해 나머지 URL로 301 리디렉션을 수행합니다. 검색 로봇이 가능한 한 빨리 변경 사항을 확인하고 삭제된 페이지의 "링크 주스"를 유지하도록 도와줍니다.

이것이 가능하지 않다면 다른 많은 옵션이 있습니다. 다음은 다양한 시나리오에 대한 가장 쉬운 솔루션의 요약입니다.

robots.txt 파일을 사용하여 검색 엔진 스파이더가 사이트 페이지의 중복 버전을 크롤링하지 못하도록 차단할 수 있습니다.
중복 페이지를 제거하는 두 번째로 좋은 솔루션인 rel=”canonical” 요소를 사용하십시오.
CODE <meta name=”robots” content=”noindex”>를 사용하여 중복 페이지를 표시하지 않도록 SEARCH 엔진에 지시하십시오.

그러나 주의: robots.txt를 사용하여 페이지 보기를 방지하는 경우 페이지에 noindex 또는 nofollow를 적용하는 것은 의미가 없습니다. 스파이더는 페이지를 읽을 수 없으므로 noindex 또는 nofollow 메타 태그를 볼 수 없습니다. 이러한 도구를 염두에 두고 중복 콘텐츠의 특정 상황을 고려하십시오.

콘텐츠 작성이 브랜드와 비즈니스에 중요한 이유는 무엇 입니까 ?

HTTPS 페이지

SSL 프로토콜(전자 상거래에 자주 사용되는 브라우저와 웹 서버 간의 암호화된 데이터 교환)을 사용하는 경우 사이트에 HTTP: 대신 HTTPS:로 시작하는 페이지가 있습니다. HTTPS 페이지의 링크가 절대 링크가 아닌 상대 링크를 사용하여 사이트의 다른 페이지를 가리킬 때 문제가 나타납니다. 예를 들어 홈페이지 링크는 http://www.YourDomain.com 대신 https://www.YourDomain.com이 됩니다.

사이트에 이 문제가 있는 경우 rel=”canonical” 또는 301 리디렉션을 사용하여 문제를 해결할 수 있습니다. 다른 해결책은 링크를 절대 링크로 변경하는 것입니다: /contenthtml 대신 http://www.YourDomain.com/content.html). 이 또한 귀하의 콘텐츠를 훔치는 사람들의 삶을 좀 더 어렵게 만듭니다.

중복 콘텐츠를 생성하는 콘텐츠 관리 시스템

때로는 사이트에 동일한 페이지의 여러 버전이 있을 수 있습니다. 하나 이상의 URL로 동일한 콘텐츠를 참조하는 일부 콘텐츠 관리 시스템의 제한 사항에 발생합니다. 일반적으로 사용자에게 가치가 없는 완전히 추가 복제입니다. 최선의 결정은 중복 페이지를 제거하고 제거된 페이지에 대해 나머지 페이지로 301 리디렉션을 수행하는 것입니다. 작동하지 않으면 다른 방법을 시도하십시오.

인쇄용 페이지 또는 여러 정렬 옵션

많은 사이트에서 사용자에게 동일한 콘텐츠를 프린터에 적합한 형식으로 제공하는 인쇄용 페이지를 제공합니다. 일부 전자 상거래 사이트에서는 다양한 정렬(크기, 색상, 브랜드 및 가격 기준)로 제품 목록을 제공합니다. 이러한 페이지는 사용자에게는 가치가 있지만 검색 엔진에는 가치가 없습니다. 그러므로 그들은 그것이 중복된 내용이라고 생각합니다. 이러한 상황에서 인쇄용 CSS 스프레드시트를 만들 수 있습니다.

블로그 및 보관 시스템의 중복 콘텐츠

블로그는 중복 콘텐츠 문제에 대한 흥미로운 변형의 형태를 가지고 있습니다. 블로그 게시물은 여러 페이지에 표시될 수 있습니다.

블로그의 시작 페이지;
해당 게시물의 퍼머링크 페이지
아카이브 페이지;
카테고리 페이지.

각 사후 사본은 다른 사본의 복제본입니다. 게시자가 블로그 홈 페이지와 퍼머링크 페이지 모두에 게시물이 존재하는 문제를 다루려고 하는 경우는 거의 없습니다. 그리고 검색 엔진은 이 문제에 아주 잘 대처하는 것 같습니다. 그러나 카테고리 및 아카이브 페이지에는 게시물 스니펫만 표시하는 것이 좋습니다.

사용자 생성 중복 콘텐츠(반복 게시물 등)

다양한 사이트에서 구조를 사용하여 블로그, 포럼 또는 게시판과 같은 사용자 생성 콘텐츠를 얻습니다. 이것은 매우 저렴한 비용으로 많은 콘텐츠를 개발할 수 있는 좋은 방법이 될 수 있습니다. 문제는 사용자가 동일한 콘텐츠를 귀하의 사이트와 여러 다른 사이트에 동시에 게시할 수 있어 중복 콘텐츠 문제가 발생할 수 있다는 것입니다. 제어하기 어렵지만 문제를 줄이기 위해 다음과 같이 진행할 수 있습니다.

사이트에 제공하는 콘텐츠는 고유해야 하며 다른 사이트에 게시할 수 없음을 사용자에게 알리는 명확한 정책이 있어야 합니다. 의심의 여지없이 이것을 얻는 것은 어렵지만 귀하의 기대를 실현하는 데 도움이 될 것입니다.
다른 콘텐츠가 필요한 고유한 방식으로 포럼을 다듬습니다. 표준 데이터 입력 필드 외에도 사이트 방문자에게 유용할 일부 고유 필드(다른 사이트와 다름)를 추가하십시오.

비디오 콘텐츠로 SEO를 증폭하는 방법 은 무엇입니까 ?

결론

중복 콘텐츠에 대해 너무 걱정하지 마세요. 일반적으로 그렇게 큰 문제는 아닙니다. 대부분 Google 자체는 마스터 페이지 또는 콘텐츠 인용과 같은 문제를 처리하는 방법을 알고 있습니다. 게다가 많은 사람들이 중복 콘텐츠 문제에 직면합니다. 때로는 복제본이 예상한 위치에 나타나지 않는 경우도 있으므로 사이트에서 항상 복제본을 확인해야 합니다. 이를 방지하려면 페이지마다 고유한 콘텐츠를 만들어야 합니다.

 이 기사는 Isabelle Jordan이 작성했습니다. Isabelle은 ektatraveling.com 보험 회사의 비즈니스 및 마케팅 저널리스트입니다. 그녀는 여행 및 보험 뉴스의 중심에 머무르는 데 도움이 되는 다양한 뉴스 포털과 주제별 블로그에 글을 씁니다. 이러한 작업을 통해 그녀는 오늘날 가장 관련성이 높은 주제에 대한 기사를 작성할 수 있습니다.