인덱싱: 정의 및 달성 방법

게시 됨: 2020-04-22

Google에서 콘텐츠 색인을 생성하는 것은 현재 인터넷에서 귀하의 제품과 서비스를 찾고 있는 많은 사용자를 수용 하기 위해 반드시 고려해야 하는 중요한 요소입니다. 색인 생성

검색 엔진에 웹사이트 이름을 입력할 때 결과에 ​​나타나지 않으면 색인 생성 및 색인 생성 방법에 대해 알려드릴 모든 내용을 계속 읽으십시오. 이 기사에서는 오늘날 가장 중요하고 가장 많이 사용되는 검색 엔진 인 Google에서 인덱싱에 중점을 둘 것입니다. Google이 웹사이트의 색인을 생성하지 않으면 웹사이트가 아무리 잘 설계되어도 웹사이트가 거의 보이지 않는다는 나쁜 소식이 있습니다. 어떤 검색어에도 나타나지 않으며 트래픽도 수신되지 않습니다.

인터넷의 페이지 수는 셀 수 없이 많기 때문에 Google은 가능한 한 최단 시간 에 사용자의 요구에 맞는 최상의 결과 를 제공하기 위해 모든 정보를 분류 해야 합니다.

인덱싱이라는 용어가 무엇을 의미하는지 잘 모르는 사람들을 위해 원칙부터 시작하겠습니다.

인덱싱의 정의

색인이라는 용어는 스페인어 로 색인을 의미하는 영어 색인 에서 유래했습니다.

인덱싱은 검색 엔진이 웹 페이지를 색인에 추가하여 검색 결과에 표시하는 프로세스입니다.

따라서 인덱싱은 각 웹 페이지의 스키마에 따라 검색 엔진의 데이터 구성으로 구성됩니다.

인덱싱의 정의

위키피디아 인덱싱의 정의에 따르면, 이 용어는 웹사이트의 콘텐츠를 인터넷 인덱스에 포함시키는 다양한 방법을 말합니다.

인덱싱이라는 용어에는 해당 웹사이트의 페이지를 식별하고 결과 목록에서 분류하는 검색 엔진을 목표로 하는 웹사이트 내에서 수행할 수 있는 특정 작업이 포함됩니다. 페이지가 검색 엔진 봇에 의해 인덱싱되면 검색 의도에 따라 사용자에게 제공됩니다.

다시 말하지만, 웹 사이트가 검색 엔진의 색인에 없으면 사용자는 액세스하려는 정확한 URL을 알고 입력하는 경우를 제외하고는 절대 찾을 수 없습니다.

중요: 인덱싱이라는 용어는 완전히 다른 개념이므로 검색 엔진 위치 지정과 혼동하지 마십시오. 예를 들어 기존의 의심을 명확히 하기 위해 웹사이트 색인을 생성하면 직업에 참여할 수 있다고 말할 수 있습니다. 검색 엔진에 잘 포지셔닝 하거나 Google에서 최상의 결과를 얻으면 승리할 수 있습니다.

인덱싱 및 위치 지정

웹사이트가 나타나지 않고는 레이스에서 이길 수 없기 때문에 조건이 관련되어 있습니다.

인덱싱. 작동 방식

이 섹션에서 우리는 다음 질문에 답하고자 합니다. Google은 새 웹사이트를 어떻게 인식하고 색인에 추가합니까?

인덱싱 프로세스는 세 단계로 나뉩니다.

1단계: 크롤링/추적

새로운 웹 페이지를 발견하기 위해 Google은 웹사이트를 크롤링하여 찾은 다음 색인 에 추가합니다(다음 단계). 트랙 이라는 용어는 새로운 콘텐츠를 발견하기 위해 웹에서 하이퍼링크를 따라가는 동작을 나타냅니다.

Google에는 색인에 있는 기존 페이지의 업데이트 또는 새 페이지를 웹에서 탐색하는 Googlebot이라는 크롤러 소프트웨어가 있습니다.

GooglebotGoogle이 다른 웹사이트를 방문하는 데 사용하는 로봇입니다. 콘텐츠를 크롤링하고 찾은 내용을 Google 데이터베이스에 추가합니다. 다른 의미에서 Googlebot은 Google이 정보를 수집하기 위해 보내고 링크를 통해 웹 웹에서 이동하는 검색 소프트웨어입니다.

2단계: 인덱싱

크롤링 후 인덱싱이 수행됩니다(인덱싱은 모든 웹 페이지를 데이터베이스에 저장하는 것을 의미합니다).

새로운 페이지나 업데이트를 발견하면 Google은 콘텐츠를 해석하고 순위를 매기고 색인에 추가합니다. 즉, 색인을 생성합니다.

인덱싱

Google은 사용 가능한 데이터에 알고리즘을 적용하고 다양한 조건에서 다양한 요인의 빈도를 측정합니다. 색인에는 다음이 포함됩니다.

  • URL
  • 모든 콘텐츠(텍스트, 이미지 또는 동영상 포함)

원칙적으로 URL의 HTML 코드 안에 있는 모든 것이 포함됩니다.

Googlebot은 이미 색인이 생성된 페이지 크롤링을 시작합니다. 추적은 웹사이트 소유자가 제공한 이전 크롤링 및 사이트 맵의 기존 웹 주소 목록으로 시작됩니다. Googlebot은 이러한 웹사이트를 방문할 때 해당 웹사이트의 링크를 사용하여 다른 페이지를 찾습니다. 링크에서 같은 사이트의 새 페이지를 알 수 있습니다. 그런 다음 Google 로봇이나 스파이더가 새 페이지를 추적하여 찾은 모든 콘텐츠 등을 색인화합니다. Googlebot은 새로운 사이트, 기존 사이트의 변경사항 및 링크에 특별한 주의를 기울입니다.

3단계: 출판 및 포지셔닝

이 프로세스의 마지막 단계는 사용자가 검색을 수행하고 Google이 알고리즘을 사용하여 색인의 모든 데이터 중에서 사용자의 검색에 가장 관련성이 높은 응답을 식별할 때 발생합니다.

사용자가 Google 검색을 수행할 때 색인 내의 모든 관련 페이지를 표시하고 검색과 관련이 있음을 Google에 요청합니다. 앞서 언급했듯이 오늘날 인터넷에는 수백만 개의 웹사이트가 있으며 수천 개의 웹사이트가 사용자의 검색과 관련될 수 있습니다. 이것이 바로 사용자가 가장 관련성이 높은 결과를 먼저 볼 수 있도록 Google이 페이지를 정렬하는 이유입니다.

웹사이트에서 페이지 인덱싱의 중요성

웹사이트에서 발생하는 트래픽의 대부분은 Google 검색결과에서 발생합니다.

웹사이트를 Google 검색결과에 표시하는 것은 트래픽 수신에 거의 필수적입니다.

성공적으로 색인을 생성하면 웹사이트에 대한 트래픽이 증가합니다. 또한 새 콘텐츠를 게시하면 Google에서 더 빨리 검색할 수 있습니다.

반면에 Google에서 웹사이트의 색인을 올바르게 생성할 수 없으면 검색결과에 나타나지 않습니다.

또한 귀하의 웹사이트가 Google에서 색인 생성을 완전히 완료하지 않았기 때문에 Google이 웹사이트의 홈페이지 또는 홈페이지 에 결과를 제공하는 것과 같은 결과를 초래할 수 있지만 웹사이트 내의 다른 페이지와 관련된 모든 결과를 표시하지 않을 수 있습니다.

이러한 문제를 해결하려면 Googlebot이 웹사이트를 방문하여 색인을 다시 생성해야 한다고 Google에 알려야 합니다.

Google에서 웹사이트의 색인을 생성하는 방법은 다음과 같습니다.

Google에서 웹사이트 색인을 생성하는 방법

이 섹션에서는 Google에서 웹페이지의 색인을 올바르게 생성하기 위해 따라야 하는 가장 중요한 단계를 제시합니다. 처음부터 시작하겠습니다.

구글 서치 콘솔 설정

Google Search Console 을 사용하여 웹사이트 페이지의 색인 생성 상태를 이해하는 것은 매우 중요합니다. Google Search Console도 Google의 무료 도구이므로 사용하지 않을 이유가 없습니다!

Google Search Console은 색인을 생성하기 전에 사이트에서 수행할 최적화를 식별하는 데 도움이 되는 구성 오류 및 웹 분석 데이터를 표시할 수 있으므로 다른 후속 단계 전에 해당 구성을 선택했습니다.

사이트맵 만들기

사이트맵은 페이지, 콘텐츠 및 관계에 대한 정보를 표시하는 웹사이트의 맵입니다.

사이트맵은 페이지에서 색인을 생성하려는 항목을 Googlebot에게 정확히 알려주는 자체 색인 색인입니다. 파일에는 봇이 더 쉽게 추적하고 색인을 생성할 수 있도록 계층적으로 정렬된 웹사이트 URL이 포함되어 있습니다.

robots.txt 파일 만들기

robots.txt 파일의 기능은 크롤링하고 색인을 생성할 페이지와 콘텐츠와 그렇지 않은 페이지와 콘텐츠를 Google에 알리는 것입니다. 원하지 않는 페이지가 검색 결과로 나타나지 않도록 하는 데 사용됩니다. 그러나 robots.txt 파일에 특정 페이지를 넣는다고 해서 해당 페이지가 인덱싱되지 않는다는 보장은 없다는 점에 유의해야 합니다. 비인덱싱을 보장하려면 메타 태그가 있는 noindex 로 설정해야 합니다.

중요: Google에서 웹사이트의 색인을 완전히 생성하지 않는 경우 robots.txt 파일의 크롤링 차단 때문일 수 있습니다.

이것이 발생하는 오류인지 확인하려면 Google Search Console의 URL 검사 도구에 URL을 입력하십시오. 적용 범위 블록을 클릭하고 "추적 허용? 아니오: robots.txt에 의해 차단됨' 오류는 페이지가 robots.txt에 잠겨 있음을 나타냅니다.

tudominio.com/robots.txt 로 이동하여 "허용하지 않는" 규칙을 찾을 수도 있습니다.

기술 용어가 어려울 수 있음을 이해하지만 걱정하지 마십시오. 도움이 필요하면 Kiwop 전문가에게 문의 하십시오.

키워드 연구

색인 생성을 촉진하기 위해 웹사이트의 주제에 대한 키워드를 잘 연구하십시오.

특정 검색에 나타나려면 웹사이트 페이지에서 적절한 밀도로 특정 키워드를 사용해야 합니다.

정기적으로 웹사이트에 양질의 콘텐츠 추가

새 콘텐츠에 키워드를 추가하고 기존 키워드를 자주 업데이트하십시오.

새 콘텐츠를 추가하고 기존 콘텐츠를 정기적으로 업데이트하는 것은 웹사이트를 지속적으로 변경하고 있으며 결과적으로 웹사이트가 최신 상태임을 Google에 알리는 것입니다.

Google은 오래된 콘텐츠보다 최신 콘텐츠를 우선시하지만 더 중요한 것은 새 콘텐츠를 추가하면 Googlebot이 웹사이트를 자주 크롤링하게 된다는 것입니다.

따라서 콘텐츠 생성인덱싱 및 포지셔닝 전략과 관련된 작업입니다.

링크 구축 전략

내부 링크:

좋은 내부 링크 구축 전략은 봇이 한 링크에서 다른 링크로 크롤링하는 데 도움이 됩니다. 가능하면 블로그에 글을 쓸 때 다른 콘텐츠에 대한 내부 링크를 넣으십시오. 자세한 내용은 기사와 최종 내부 링크 구축 가이드 를 놓치지 마세요.

외부 링크:

Google에서 인식하는 웹사이트를 가져와 귀하의 페이지에 링크하거나 이러한 사이트의 관련 콘텐츠를 귀하의 게시물에 링크합니다. 가짜 링크를 구매하는 것과 같은 나쁜 관행을 사용하지 않는 것이 중요합니다. 그렇지 않은 것은 장기적입니다. 큰 권위와 관련성이 있는 백링크에 베팅하는 것이 좋습니다!

끊어진 링크 감지

Googlebot이 깨진 링크(웹사이트에서 아무데도 연결되지 않는 링크 또는 URL)를 감지하면 색인 생성 프로세스가 복잡해집니다. 따라서 사용자 경험을 손상시키지 않도록 끊어진 링크를 감지하고 리디렉션을 생성하는 것이 중요합니다. 아래에서는 잘못된 링크를 감지하는 몇 가지 도구를 제안합니다.

  • Google 웹마스터 도구
  • 웹마스터 툴킷
  • W3C 링크 검사기
  • 브로커 링크 검사기

웹사이트가 고유한지 확인하고 품질이 낮은 페이지를 제거하세요.

우리는 알려진 모든 URL을 색인화하지 않습니다. 이는 매우 정상적인 현상입니다. 나는 사이트를 훌륭하고 고무적으로 만드는 데 집중할 것이므로 일이 더 잘되는 경향이 있습니다.

존 뮬러

John Mueller가 이 문구에서 의미하는 것은 Google이 웹사이트의 색인을 생성하려면 독특하고 인상적이어야 한다는 것입니다.

반면에 Google은 사용자에게 가치가 없기 때문에 품질이 낮은 페이지의 색인을 생성하지 않을 가능성이 높습니다. 웹사이트에서 품질 문제에 대해 색인이 생성되지 않은 페이지를 검토하고 Google Search Console에서 색인 재지정을 요청하기 전에 필요한 변경을 하십시오. 색인 생성 예산을 절약하기 위한 또 다른 옵션은 품질이 좋지 않은 페이지를 제거하는 것입니다. 그러면 Googlebot 작업이 절약됩니다.

웹사이트의 SEO 최적화

인덱싱은 사전 위치 지정입니다. 75번의 클릭이 상위 5개 결과에 머무를 때 결과의 세 번째 페이지에 표시되는 것은 그다지 중요하지 않습니다.

웹사이트를 잘 배치하면 도메인 권한을 향상시키고 웹사이트가 사용자에게 가치 있는 콘텐츠를 제공한다는 것을 Google에 보여줄 수 있습니다. 가치 콘텐츠가 Google을 사랑한다는 사실을 이미 알고 계시므로 Google이 모든 새 콘텐츠를 빠르고 원활하게 색인화할 것입니다.

SEO에 투자하는 이유와 SEO얼마나 투자해야 하는지에 대한 기사를 놓치지 마세요. SEO 전문가가 필요한 경우 Kiwop에서 당사에 연락하여 결과를 개선할 수 있도록 도와드립니다.