การเปิดโปงความเชื่อผิดๆ 3 ประการที่อยู่เบื้องหลังการรวบรวมข้อมูลไซต์ การจัดทำดัชนี และแผนผังไซต์ XML

เผยแพร่แล้ว: 2018-03-07

พวกเราหลายคนเชื่ออย่างผิด ๆ ว่าการเปิดตัวเว็บไซต์พร้อมกับแผนผังเว็บไซต์ XML จะทำให้หน้าทั้งหมดถูกรวบรวมข้อมูลและจัดทำดัชนีโดยอัตโนมัติ

ในเรื่องนี้ตำนานและความเข้าใจผิดบางอย่างสร้างขึ้น ที่พบบ่อยที่สุดคือ:

  • Google จะรวบรวมข้อมูลไซต์ทั้งหมดโดยอัตโนมัติและดำเนินการอย่างรวดเร็ว
  • เมื่อรวบรวมข้อมูลเว็บไซต์ Google จะติดตามลิงก์ทั้งหมดและเข้าชมหน้าเว็บทั้งหมด และรวมลิงก์ทั้งหมดไว้ในดัชนีทันที
  • การเพิ่มแผนผังเว็บไซต์ XML เป็นวิธีที่ดีที่สุดในการรวบรวมข้อมูลและจัดทำดัชนีหน้าเว็บไซต์ทั้งหมด

น่าเศร้า การนำเว็บไซต์ของคุณเข้าสู่ดัชนีของ Google นั้นเป็นงานที่ซับซ้อนกว่าเล็กน้อย อ่านต่อไปเพื่อทำความเข้าใจว่ากระบวนการรวบรวมข้อมูลและการทำดัชนีทำงานอย่างไร และแผนผังเว็บไซต์ XML มีบทบาทอย่างไร

ก่อนที่เราจะลงรายละเอียดเกี่ยวกับตำนานที่กล่าวถึงข้างต้น มาเรียนรู้แนวคิด SEO ที่สำคัญบางประการก่อน:

การ รวบรวมข้อมูล เป็นกิจกรรมที่ดำเนินการโดยเครื่องมือค้นหาเพื่อติดตามและรวบรวม URL จากทั่วทั้งเว็บ

การ ทำดัชนี เป็นกระบวนการที่ตามหลังการรวบรวมข้อมูล โดยทั่วไป มันเป็นเรื่องของการแยกวิเคราะห์และจัดเก็บข้อมูลเว็บที่ใช้ในภายหลังเมื่อแสดงผลลัพธ์สำหรับคำค้นหาของเครื่องมือค้นหา ดัชนีเครื่องมือค้นหาเป็นที่เก็บข้อมูลเว็บที่รวบรวมไว้ทั้งหมดเพื่อการใช้งานต่อไป

อันดับการรวบรวมข้อมูล คือค่าที่ Google กำหนดให้กับไซต์และหน้าเว็บของคุณ ยังไม่ทราบวิธีการคำนวณเมตริกนี้โดยเครื่องมือค้นหา Google ยืนยันหลายครั้งว่าความถี่ในการจัดทำดัชนีไม่เกี่ยวข้องกับการจัดอันดับ ดังนั้นจึงไม่มีความสัมพันธ์โดยตรงระหว่างผู้มีอำนาจในการจัดอันดับเว็บไซต์และอันดับการรวบรวมข้อมูล

เว็บไซต์ข่าวสาร ไซต์ที่มีเนื้อหาอันมีค่า และไซต์ที่มีการอัปเดตเป็นประจำ มีโอกาสสูงที่จะได้รับการรวบรวมข้อมูลเป็นประจำ

Crawl Budget คือปริมาณของทรัพยากรการตระเวนที่เครื่องมือค้นหาจัดสรรให้กับเว็บไซต์ โดยปกติ Google จะคำนวณจำนวนเงินนี้ตามอันดับการรวบรวมข้อมูลเว็บไซต์ของคุณ

ความลึกของการรวบรวมข้อมูล คือขอบเขตที่ Google เจาะลึกระดับเว็บไซต์เมื่อทำการสำรวจ

ลำดับความสำคัญของการ รวบรวมข้อมูล คือหมายเลขลำดับที่กำหนดให้กับหน้าเว็บไซต์ที่แสดงถึงความสำคัญที่เกี่ยวข้องกับการรวบรวมข้อมูล

ตอนนี้ เมื่อรู้พื้นฐานทั้งหมดของกระบวนการแล้ว มาดูความเชื่อผิดๆ 3 ประการที่อยู่เบื้องหลังแผนผังเว็บไซต์ XML การรวบรวมข้อมูลและการจัดทำดัชนีกัน

สารบัญ

  • ความเชื่อที่ 1 Google รวบรวมข้อมูลเว็บไซต์ทั้งหมดโดยอัตโนมัติและดำเนินการอย่างรวดเร็ว
  • ซื้อกลับบ้าน
  • ความเชื่อที่ 2 การเพิ่มแผนผังเว็บไซต์ XML เป็นวิธีที่ดีที่สุดในการรวบรวมข้อมูลและจัดทำดัชนีหน้าเว็บไซต์ทั้งหมด
  • ซื้อกลับบ้าน
  • ความเชื่อที่ 3 แผนผังไซต์ XML สามารถแก้ปัญหาการรวบรวมข้อมูลและการจัดทำดัชนีทั้งหมดได้
  • ซื้อกลับบ้าน

ความเชื่อที่ 1 Google รวบรวมข้อมูลเว็บไซต์ทั้งหมดโดยอัตโนมัติและดำเนินการอย่างรวดเร็ว

Google อ้างว่าการรวบรวมข้อมูลเว็บนั้นคล่องตัวและยืดหยุ่น

แต่ความจริงก็คือ เนื่องจากขณะนี้มีหน้าเว็บหลายล้านล้านหน้าในเว็บ ในทางเทคนิคแล้ว เสิร์ชเอ็นจิ้นไม่สามารถรวบรวมข้อมูลทั้งหมดได้อย่างรวดเร็ว

การเลือกเว็บไซต์เพื่อจัดสรรงบประมาณการรวบรวมข้อมูลสำหรับ

อัลกอริทึมของ Google ที่ชาญฉลาด (หรือที่รู้จักว่า Crawl Budget) จะกระจายทรัพยากรของเครื่องมือค้นหาและตัดสินใจว่าไซต์ใดควรค่าแก่การรวบรวมข้อมูลและไซต์ใดไม่ควร

โดยปกติ Google จะจัดลำดับความสำคัญของเว็บไซต์ที่เชื่อถือได้ซึ่งสอดคล้องกับข้อกำหนดที่ตั้งไว้และใช้เป็นพื้นฐานในการกำหนดว่าไซต์อื่นๆ วัดผลอย่างไร

ดังนั้นหากคุณมีเว็บไซต์ที่เพิ่งออกจากเตาอบ หรือเว็บไซต์ที่มีเนื้อหาที่คัดลอกมา ซ้ำกัน หรือบาง โอกาสที่เว็บไซต์จะรวบรวมข้อมูลอย่างเหมาะสมก็ค่อนข้างน้อย

ปัจจัยสำคัญที่อาจส่งผลต่อการจัดสรรงบประมาณการรวบรวมข้อมูล ได้แก่:

  • ขนาดเว็บไซต์,
  • สภาพทั่วไป (เมตริกชุดนี้กำหนดโดยจำนวนข้อผิดพลาดที่คุณอาจมีในแต่ละหน้า)
  • และจำนวนลิงค์ขาเข้าและภายใน

เพื่อเพิ่มโอกาสในการได้รับงบประมาณการรวบรวมข้อมูล ตรวจสอบให้แน่ใจว่าเว็บไซต์ของคุณตรงตามข้อกำหนดทั้งหมดของ Google ที่กล่าวถึงข้างต้น รวมทั้งเพิ่มประสิทธิภาพการรวบรวมข้อมูล (ดูหัวข้อถัดไปในบทความ)

การคาดคะเนกำหนดการรวบรวมข้อมูล

Google ไม่ประกาศแผนการรวบรวมข้อมูล URL ของเว็บ นอกจากนี้ เป็นการยากที่จะคาดเดาระยะเวลาที่เสิร์ชเอ็นจิ้นเข้าเยี่ยมชมบางไซต์

อาจเป็นได้ว่าสำหรับไซต์หนึ่งๆ ไซต์อาจทำการรวบรวมข้อมูลอย่างน้อยวันละครั้ง ในขณะที่ไซต์อื่นๆ ได้รับการเข้าชมเดือนละครั้งหรืออาจน้อยกว่านั้นด้วยซ้ำ

  • ระยะของการรวบรวมข้อมูลขึ้นอยู่กับ:
  • คุณภาพของเนื้อหาเว็บไซต์
  • ความใหม่และความเกี่ยวข้องของข้อมูลที่เว็บไซต์มอบให้
  • และความสำคัญของเครื่องมือค้นหาว่า URL ของไซต์มีความสำคัญหรือเป็นที่นิยมมากเพียงใด

เมื่อพิจารณาปัจจัยเหล่านี้ คุณอาจพยายามคาดการณ์ว่า Google จะเข้าชมเว็บไซต์ของคุณบ่อยเพียงใด

บทบาทของลิงก์ภายนอก/ภายในและแผนผังไซต์ XML

Googlebots ใช้ลิงก์ที่เชื่อมโยงหน้าเว็บไซต์และเว็บไซต์เข้าด้วยกันเป็นแนวทาง ดังนั้น เสิร์ชเอ็นจิ้นจึงเข้าถึงหน้าที่เชื่อมโยงถึงกันหลายล้านล้านหน้าที่มีอยู่บนเว็บ

เครื่องมือค้นหาสามารถเริ่มสแกนเว็บไซต์ของคุณจากหน้าใดก็ได้ ไม่จำเป็นต้องมาจากหน้าหลัก การเลือกจุดเข้าใช้งานการตระเวนขึ้นอยู่กับแหล่งที่มาของลิงก์ขาเข้า สมมติว่าหน้าผลิตภัณฑ์บางหน้าของคุณมีลิงก์มากมายที่มาจากเว็บไซต์ต่างๆ Google เชื่อมโยงจุดต่างๆ และเข้าชมหน้ายอดนิยมดังกล่าวในเทิร์นแรก

แผนผังไซต์ XML เป็นเครื่องมือที่ยอดเยี่ยมในการสร้างโครงสร้างไซต์ที่มีความคิดดี นอกจากนี้ยังสามารถทำให้กระบวนการรวบรวมข้อมูลไซต์ตรงเป้าหมายและชาญฉลาดยิ่งขึ้น

โดยทั่วไป แผนผังเว็บไซต์เป็นฮับที่มีลิงก์ของเว็บไซต์ทั้งหมด แต่ละลิงก์ที่รวมอยู่ในลิงก์นั้นสามารถติดตั้งข้อมูลเพิ่มเติมได้ เช่น วันที่อัปเดตล่าสุด ความถี่ในการอัปเดต ความสัมพันธ์กับ URL อื่นๆ บนไซต์ เป็นต้น

ทั้งหมดนี้มีโรดแมปการรวบรวมข้อมูลเว็บไซต์โดยละเอียดของ Googlebots และทำให้การรวบรวมข้อมูลมีข้อมูลมากขึ้น นอกจากนี้ เครื่องมือค้นหาหลักทั้งหมดยังให้ความสำคัญกับ URL ที่ระบุไว้ในแผนผังเว็บไซต์

สรุปได้ว่า เพื่อให้หน้าเว็บไซต์ของคุณอยู่ในเรดาร์ของ Googlebot คุณต้องสร้างเว็บไซต์ที่มีเนื้อหาที่ยอดเยี่ยมและปรับโครงสร้างการเชื่อมโยงภายในให้เหมาะสม


ซื้อกลับบ้าน

• Google ไม่ได้รวบรวมข้อมูลเว็บไซต์ของคุณทั้งหมดโดยอัตโนมัติ
• ระยะเวลาของการรวบรวมข้อมูลเว็บไซต์ขึ้นอยู่กับความสำคัญหรือความสำคัญของเว็บไซต์และหน้าเว็บที่เป็นที่นิยม
• การอัปเดตเนื้อหาทำให้ Google เข้าชมเว็บไซต์บ่อยขึ้น
• เว็บไซต์ที่ไม่สอดคล้องกับข้อกำหนดของเครื่องมือค้นหาไม่น่าจะได้รับการรวบรวมข้อมูลอย่างถูกต้อง
• เว็บไซต์และหน้าเว็บไซต์ที่ไม่มีลิงก์ภายใน/ภายนอกมักจะถูกละเว้นโดยบอทของเครื่องมือค้นหา
• การเพิ่มแผนผังเว็บไซต์ XML สามารถปรับปรุงกระบวนการรวบรวมข้อมูลเว็บไซต์และทำให้มีความชาญฉลาดมากขึ้น


ความเชื่อที่ 2 การเพิ่มแผนผังเว็บไซต์ XML เป็นวิธีที่ดีที่สุดในการรวบรวมข้อมูลและจัดทำดัชนีหน้าเว็บไซต์ทั้งหมด

เจ้าของเว็บไซต์ทุกคนต้องการให้ Googlebot เยี่ยมชมหน้าเว็บไซต์ที่สำคัญทั้งหมด (ยกเว้นหน้าที่ซ่อนจากการจัดทำดัชนี) ตลอดจนสำรวจเนื้อหาใหม่และเนื้อหาที่อัปเดตทันที

อย่างไรก็ตาม เสิร์ชเอ็นจิ้นมีวิสัยทัศน์เกี่ยวกับลำดับความสำคัญในการรวบรวมข้อมูลเว็บไซต์

เมื่อพูดถึงการตรวจสอบเว็บไซต์และเนื้อหา Google จะใช้ชุดอัลกอริทึมที่เรียกว่า Crawl Budget โดยพื้นฐานแล้วจะช่วยให้เครื่องมือค้นหาสามารถสแกนหน้าเว็บไซต์ได้ในขณะที่ใช้ทรัพยากรของตัวเองอย่างชาญฉลาด

การตรวจสอบงบประมาณการรวบรวมข้อมูลเว็บไซต์

การพิจารณาว่าไซต์ของคุณถูกรวบรวมข้อมูลอย่างไรนั้นค่อนข้างง่าย และคุณมีปัญหาเรื่องงบประมาณในการรวบรวมข้อมูลหรือไม่

คุณเพียงแค่ต้อง:

  • นับจำนวนหน้าในไซต์ของคุณและในแผนผังไซต์ XML
  • ไปที่ Google Search Console ข้ามไปที่ส่วน Crawl -> Crawl Stats และตรวจสอบว่ามีการรวบรวมข้อมูลในเว็บไซต์ของคุณกี่หน้าต่อวัน
  • หารจำนวนหน้าเว็บไซต์ของคุณด้วยจำนวนหน้าที่รวบรวมข้อมูลต่อวัน

หากจำนวนที่คุณได้รับมากกว่า 10 (ไซต์ของคุณมีหน้าเว็บมากกว่าที่ Google รวบรวมข้อมูลในแต่ละวัน 10 เท่า) เรามีข่าวร้ายสำหรับคุณ: เว็บไซต์ของคุณมีปัญหาในการรวบรวมข้อมูล

แต่ก่อนที่คุณจะเรียนรู้วิธีแก้ไข คุณต้องเข้าใจแนวคิดอื่นก่อน นั่นคือ...

ความลึกของการรวบรวมข้อมูล

ความลึกของการรวบรวมข้อมูลคือขอบเขตที่ Google สำรวจเว็บไซต์อย่างต่อเนื่องจนถึงระดับหนึ่ง

โดยทั่วไปแล้ว หน้าแรกจะถือเป็นระดับ 1 หน้าที่อยู่ห่างออกไป 1 คลิกจะเป็นระดับ 2 เป็นต้น

เพจระดับลึกมีเพจแรงก์ที่ต่ำกว่า (หรือไม่มีเลย) และ Googlebot ไม่ค่อยรวบรวมข้อมูล โดยปกติเสิร์ชเอ็นจิ้นจะไม่เจาะลึกกว่าระดับ 4

ในสถานการณ์ที่เหมาะสม หน้าเฉพาะควรอยู่ห่างจากหน้าแรกหรือหมวดหมู่เว็บไซต์หลัก 1-4 คลิก ยิ่งเส้นทางไปยังหน้านั้นยาวขึ้นเท่าใด ก็ยิ่งต้องมีทรัพยากรที่เครื่องมือค้นหาต้องจัดสรรเพื่อเข้าถึงหน้านั้นมากขึ้นเท่านั้น

หากอยู่ในเว็บไซต์ Google ประมาณการว่าเส้นทางนั้นยาวเกินไป จะหยุดรวบรวมข้อมูลเพิ่มเติม

เพิ่มประสิทธิภาพความลึกและงบประมาณในการรวบรวมข้อมูล

เพื่อป้องกันไม่ให้ Googlebot ทำงานช้าลง ให้เพิ่มประสิทธิภาพงบประมาณและความลึกในการรวบรวมข้อมูลเว็บไซต์ของคุณ คุณต้อง:

  • แก้ไขข้อผิดพลาด 404, JS และหน้าอื่น ๆ ทั้งหมด

ข้อผิดพลาดของหน้ามากเกินไปอาจทำให้โปรแกรมรวบรวมข้อมูลของ Google ช้าลงอย่างมาก หากต้องการค้นหาข้อผิดพลาดของเว็บไซต์หลักทั้งหมด ให้ลงชื่อเข้าใช้แผงเครื่องมือของผู้ดูแลเว็บ Google (Bing, Yandex) และปฏิบัติตามคำแนะนำทั้งหมดที่ระบุไว้ที่นี่

  • เพิ่มประสิทธิภาพการแบ่งหน้า;

ในกรณีที่คุณมีรายการการแบ่งหน้ายาวเกินไป หรือรูปแบบการแบ่งหน้าของคุณไม่อนุญาตให้คลิกมากกว่าสองหน้าในรายการ โปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหาจะหยุดขุดค้นหน้าดังกล่าว

นอกจากนี้ หากมีรายการไม่กี่รายการในหน้าดังกล่าว จะถือเป็นรายการเนื้อหาบางและจะไม่ถูกรวบรวมข้อมูลผ่าน

  • ตรวจสอบตัวกรองการนำทาง

รูปแบบการนำทางบางอย่างอาจมาพร้อมกับตัวกรองหลายตัวที่สร้างหน้าใหม่ (เช่น หน้าที่กรองโดยการนำทางแบบเลเยอร์) แม้ว่าหน้าดังกล่าวอาจมีการเข้าชมแบบออร์แกนิก แต่ก็สามารถสร้างการโหลดที่ไม่ต้องการบนโปรแกรมรวบรวมข้อมูลของเครื่องมือค้นหา

วิธีที่ดีที่สุดในการแก้ปัญหานี้คือจำกัดลิงก์ที่เป็นระบบไปยังรายการที่กรอง ตามหลักการแล้ว คุณควรใช้ตัวกรองสูงสุด 1-2 ตัว เช่น หากคุณมีร้านค้าที่มีตัวกรอง LN 3 ตัว (สี/ขนาด/เพศ) คุณควรอนุญาตให้ใช้ตัวกรอง 2 ตัวร่วมกันอย่างเป็นระบบ (เช่น ขนาดสี ขนาดเพศ) ในกรณีที่คุณจำเป็นต้องเพิ่มตัวกรองหลายตัวรวมกัน คุณควรเพิ่มลิงก์ไปยังตัวกรองเหล่านั้นด้วยตนเอง

  • เพิ่มประสิทธิภาพพารามิเตอร์การติดตามใน URL

พารามิเตอร์การติดตาม URL ต่างๆ (เช่น '?source=thispage') สามารถสร้างกับดักสำหรับโปรแกรมรวบรวมข้อมูล เนื่องจากพวกมันสร้าง URL ใหม่จำนวนมาก ปัญหานี้หากเป็นเรื่องปกติสำหรับหน้าเว็บที่มีบล็อก "ผลิตภัณฑ์ที่คล้ายคลึงกัน" หรือ "เรื่องราวที่เกี่ยวข้อง" ซึ่งพารามิเตอร์เหล่านี้ใช้เพื่อติดตามพฤติกรรมของผู้ใช้

เพื่อเพิ่มประสิทธิภาพในการรวบรวมข้อมูลในกรณีนี้ ขอแนะนำให้ส่งข้อมูลการติดตามหลัง '#' ที่ส่วนท้ายของ URL ด้วยวิธีนี้ URL ดังกล่าวจะไม่เปลี่ยนแปลง นอกจากนี้ ยังสามารถเปลี่ยนเส้นทาง URL ด้วยพารามิเตอร์การติดตามไปยัง URL เดียวกันแต่ไม่ต้องติดตาม

  • ลบการเปลี่ยนเส้นทาง 301 ที่มากเกินไป

สมมติว่าคุณมี URL จำนวนมากที่เชื่อมโยงโดยไม่มีเครื่องหมายทับ เมื่อบ็อตของเครื่องมือค้นหาเข้าชมหน้าดังกล่าว บอทจะถูกเปลี่ยนเส้นทางไปยังเวอร์ชันด้วยเครื่องหมายทับ

ดังนั้นบอทจึงต้องทำงานมากเป็นสองเท่าตามที่ควรจะเป็น และในที่สุดก็สามารถเลิกล้มและหยุดคลานได้ เพื่อหลีกเลี่ยงปัญหานี้ เพียงพยายามอัปเดตลิงก์ทั้งหมดภายในไซต์ของคุณทุกครั้งที่คุณเปลี่ยน URL

ลำดับความสำคัญของการรวบรวมข้อมูล

ดังที่กล่าวไว้ข้างต้น Google ให้ความสำคัญกับเว็บไซต์ในการรวบรวมข้อมูล จึงไม่น่าแปลกใจที่มันทำสิ่งเดียวกันกับหน้าต่างๆ ภายในเว็บไซต์ที่มีการรวบรวมข้อมูล

สำหรับเว็บไซต์ส่วนใหญ่ หน้าที่มีลำดับความสำคัญในการรวบรวมข้อมูลสูงสุดคือหน้าแรก

อย่างไรก็ตาม ดังที่ได้กล่าวไว้ก่อนหน้านี้ ในบางกรณี อาจเป็นหมวดหมู่ที่ได้รับความนิยมสูงสุดหรือหน้าสินค้าที่เข้าชมบ่อยที่สุดก็ได้ หากต้องการค้นหาหน้าเว็บที่ Googlebot รวบรวมข้อมูลจำนวนมากขึ้น ให้ดูที่บันทึกเซิร์ฟเวอร์ของคุณ

แม้ว่า Google จะไม่ได้ประกาศอย่างเป็นทางการว่าปัจจัยที่อาจส่งผลต่อลำดับความสำคัญในการรวบรวมข้อมูลของหน้าเว็บไซต์ ได้แก่

  • รวมอยู่ในแผนผังไซต์ XML (และเพิ่มแท็กลำดับความสำคัญ* สำหรับหน้าที่สำคัญที่สุด)
  • จำนวนลิงค์ขาเข้า
  • จำนวนลิงค์ภายใน
  • ความนิยมของหน้า (จำนวนการเข้าชม)
  • จัดอันดับหน้า.

แต่ถึงแม้หลังจากที่คุณได้เคลียร์ทางให้บอทของเครื่องมือค้นหารวบรวมข้อมูลเว็บไซต์ของคุณแล้ว พวกเขาก็ยังอาจเพิกเฉยต่อมันได้ อ่านต่อเพื่อเรียนรู้ว่าทำไม

เพื่อให้เข้าใจถึงความสำคัญของการรวบรวมข้อมูลได้ดียิ่งขึ้น โปรดดูคำปราศรัยเสมือนจริงโดย Gary Illyes

เมื่อพูดถึงแท็กลำดับความสำคัญในแผนผังไซต์ XML คุณสามารถเพิ่มได้ด้วยตนเองหรือด้วยความช่วยเหลือจากฟังก์ชันการทำงานในตัวของแพลตฟอร์มที่ไซต์ของคุณใช้ นอกจากนี้ บางแพลตฟอร์มยังรองรับส่วนขยาย/แอปแผนผังเว็บไซต์ XML ของบริษัทอื่นที่ทำให้กระบวนการง่ายขึ้น
เมื่อใช้แท็กลำดับความสำคัญของแผนผังเว็บไซต์ XML คุณสามารถกำหนดค่าต่อไปนี้ให้กับหมวดหมู่ต่างๆ ของหน้าเว็บไซต์:

  • 0.0-0.3 ไปยังหน้ายูทิลิตี้ เนื้อหาที่ล้าสมัย และหน้าใด ๆ ที่มีความสำคัญรองลงมา
  • 0.4-0.7 สำหรับบทความบล็อกของคุณ คำถามที่พบบ่อยและหน้าที่มีความรู้ หน้าหมวดหมู่และหมวดหมู่ย่อยที่มีความสำคัญรอง และ
  • 0.8-1.0 ไปยังหมวดหมู่ไซต์หลักของคุณ หน้า Landing Page หลัก และโฮมเพจ


ซื้อกลับบ้าน

• Google มีวิสัยทัศน์ของตนเองเกี่ยวกับลำดับความสำคัญของกระบวนการรวบรวมข้อมูล
• หน้าที่ควรจะเข้าสู่เครื่องมือค้นหา ดัชนีควรอยู่ห่างจากหน้าแรก 1-4 คลิกจากหน้าแรก หมวดหมู่เว็บไซต์หลัก หรือหน้าเว็บไซต์ยอดนิยม
• เพื่อป้องกันไม่ให้ Googlebot ทำงานช้าลงและเพิ่มประสิทธิภาพงบประมาณการรวบรวมข้อมูลเว็บไซต์ของคุณและความลึกของการรวบรวมข้อมูล คุณควรค้นหาและแก้ไขข้อผิดพลาด 404, JS และหน้าอื่นๆ เพิ่มประสิทธิภาพตัวกรองการแบ่งหน้าและการนำทางของเว็บไซต์ ลบการเปลี่ยนเส้นทาง 301 ที่มากเกินไป และเพิ่มประสิทธิภาพพารามิเตอร์การติดตามใน URL
• เพื่อเพิ่มลำดับความสำคัญในการรวบรวมข้อมูลของหน้าเว็บไซต์ที่สำคัญ ตรวจสอบให้แน่ใจว่าได้รวมไว้ในแผนผังเว็บไซต์ XML (พร้อมแท็กลำดับความสำคัญ) และเชื่อมโยงอย่างดีกับหน้าเว็บไซต์อื่นๆ มีลิงก์ที่มาจากเว็บไซต์ที่เกี่ยวข้องและเชื่อถือได้อื่นๆ


ความเชื่อที่ 3 แผนผังไซต์ XML สามารถแก้ปัญหาการรวบรวมข้อมูลและการจัดทำดัชนีทั้งหมดได้

ในขณะที่เป็นเครื่องมือสื่อสารที่ดีที่จะแจ้งเตือน Google เกี่ยวกับ URL ไซต์ของคุณและวิธีเข้าถึง URL แผนผังไซต์ XML ไม่รับประกันว่าบอทของเครื่องมือค้นหาจะเข้าชมไซต์ของคุณ (ไม่ต้องพูดถึงการรวมหน้าไซต์ทั้งหมดลงในดัชนี) .

นอกจากนี้ คุณควรเข้าใจว่าแผนผังไซต์จะไม่ช่วยปรับปรุงการจัดอันดับไซต์ของคุณ แม้ว่าหน้าเว็บจะได้รับการรวบรวมข้อมูลและรวมอยู่ในดัชนีเครื่องมือค้นหา แต่ประสิทธิภาพการจัดอันดับของหน้านั้นขึ้นอยู่กับปัจจัยอื่นๆ อีกเป็นจำนวนมาก (ลิงก์ภายในและภายนอก เนื้อหา คุณภาพของเว็บไซต์ ฯลฯ)

อย่างไรก็ตาม เมื่อใช้อย่างถูกต้อง แผนผังไซต์ XML สามารถปรับปรุงประสิทธิภาพการรวบรวมข้อมูลไซต์ของคุณได้อย่างมาก ด้านล่างนี้คือคำแนะนำบางส่วนเกี่ยวกับวิธีการเพิ่มศักยภาพ SEO ของเครื่องมือนี้ให้สูงสุด

คงเส้นคงวา

เมื่อสร้างแผนผังเว็บไซต์ โปรดจำไว้ว่าจะใช้เป็นแผนงานสำหรับโปรแกรมรวบรวมข้อมูลของ Google ดังนั้นจึงเป็นเรื่องสำคัญที่จะไม่ทำให้เครื่องมือค้นหาเข้าใจผิดโดยระบุเส้นทางที่ไม่ถูกต้อง

ตัวอย่างเช่น คุณอาจรวมหน้ายูทิลิตี้บางหน้าลงในแผนผังไซต์ XML ของคุณเป็นครั้งคราว ( ติดต่อเรา หรือหน้า TOS หน้าสำหรับเข้าสู่ระบบ กู้คืนหน้ารหัสผ่านที่สูญหาย หน้าสำหรับแบ่งปันเนื้อหา ฯลฯ)

หน้าเหล่านี้มักจะซ่อนจากการจัดทำดัชนีด้วยเมตาแท็ก noindex robots หรือไม่อนุญาตในไฟล์ robots.txt

ดังนั้นการรวมไว้ในแผนผังไซต์ XML จะทำให้ Googlebot สับสนเท่านั้น ซึ่งอาจส่งผลเสียต่อกระบวนการรวบรวมข้อมูลเกี่ยวกับเว็บไซต์ของคุณ

อัพเดทเรื่อยๆ

เว็บไซต์ส่วนใหญ่บนเว็บเปลี่ยนแปลงเกือบทุกวัน โดยเฉพาะเว็บไซต์อีคอมเมิร์ซที่มีสินค้าและหมวดหมู่สลับไปมาเป็นประจำทั้งในและนอกเว็บไซต์

เพื่อให้ Google มีข้อมูลที่ดีอยู่เสมอ คุณต้องอัปเดตแผนผังเว็บไซต์ XML ของคุณ

บางแพลตฟอร์ม (Magento, Shopify) อาจมีฟังก์ชันในตัวที่ช่วยให้คุณอัปเดตแผนผังเว็บไซต์ XML ของคุณเป็นระยะ หรือสนับสนุนโซลูชันของบริษัทอื่นที่สามารถดำเนินการนี้ได้

ตัวอย่างเช่น ใน Magento 2 คุณสามารถกำหนดระยะเวลาของรอบการอัปเดตแผนผังเว็บไซต์ได้ เมื่อคุณกำหนดในการตั้งค่าการกำหนดค่าของแพลตฟอร์ม คุณจะส่งสัญญาณให้โปรแกรมรวบรวมข้อมูลว่าหน้าเว็บไซต์ของคุณได้รับการอัปเดตในช่วงเวลาหนึ่ง (รายชั่วโมง รายสัปดาห์ รายเดือน) และเว็บไซต์ของคุณต้องการการรวบรวมข้อมูลอีกครั้ง

คลิกที่นี่เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับเรื่องนี้

แต่โปรดจำไว้ว่าแม้ว่าการตั้งค่าลำดับความสำคัญและความถี่สำหรับการอัปเดตแผนผังเว็บไซต์จะช่วยได้ แต่ก็อาจไม่ทันกับการเปลี่ยนแปลงจริงและไม่ให้ภาพที่แท้จริงในบางครั้ง

นั่นคือเหตุผลที่ตรวจสอบให้แน่ใจว่าแผนผังไซต์ของคุณสะท้อนถึงการเปลี่ยนแปลงที่ทำขึ้นเมื่อเร็วๆ นี้ทั้งหมด

แบ่งส่วนเนื้อหาของไซต์และกำหนดลำดับความสำคัญในการรวบรวมข้อมูลที่เหมาะสม

Google กำลังทำงานอย่างหนักเพื่อวัดคุณภาพไซต์โดยรวมและแสดงเฉพาะเว็บไซต์ที่ดีที่สุดและมีความเกี่ยวข้องมากที่สุดเท่านั้น

แต่เนื่องจากมักจะเกิดขึ้น ไม่ใช่ว่าทุกไซต์จะถูกสร้างขึ้นอย่างเท่าเทียมกันและสามารถมอบมูลค่าที่แท้จริงได้

สมมติว่าเว็บไซต์หนึ่งอาจมี 1,000 หน้า และมีเพียง 50 หน้าเท่านั้นที่เป็นเกรด «A» ส่วนอื่นๆ ใช้งานได้จริง มีเนื้อหาที่ล้าสมัยหรือไม่มีเนื้อหาเลย

หาก Google เริ่มสำรวจเว็บไซต์ดังกล่าว เราอาจตัดสินใจว่าเว็บไซต์ดังกล่าวค่อนข้างไร้ค่าเนื่องจากมีหน้าเว็บที่มีมูลค่าต่ำ เป็นสแปม หรือล้าสมัยในเปอร์เซ็นต์ที่สูง

นั่นเป็นสาเหตุว่าทำไมเมื่อสร้างแผนผังเว็บไซต์ XML จึงควรแบ่งกลุ่มเนื้อหาเว็บไซต์และแนะนำบอทของเครื่องมือค้นหาไปยังพื้นที่เว็บไซต์ที่คุ้มค่าเท่านั้น

และอย่างที่คุณอาจจำได้ แท็กลำดับความสำคัญที่กำหนดให้กับหน้าเว็บไซต์ที่สำคัญที่สุดในแผนผังเว็บไซต์ XML ของคุณก็ช่วยได้มากเช่นกัน


ซื้อกลับบ้าน

• เมื่อสร้างแผนผังเว็บไซต์ ตรวจสอบให้แน่ใจว่าคุณไม่ได้รวมหน้าที่ซ่อนจากการจัดทำดัชนีด้วยเมตาแท็ก noindex robots หรือไม่ได้รับอนุญาตในไฟล์ robots.txt
• อัปเดตแผนผังเว็บไซต์ XML (ด้วยตนเองหรือโดยอัตโนมัติ) ทันทีหลังจากที่คุณทำการเปลี่ยนแปลงในโครงสร้างเว็บไซต์และเนื้อหา
• แบ่งกลุ่มเนื้อหาไซต์ของคุณเพื่อรวมเฉพาะหน้าเกรด «A» ลงในแผนผังไซต์
• กำหนดลำดับความสำคัญในการรวบรวมข้อมูลสำหรับหน้าประเภทต่างๆ


ที่เป็นพื้นมัน

มีอะไรจะพูดในหัวข้อหรือไม่? อย่าลังเลที่จะแบ่งปันความคิดเห็นของคุณเกี่ยวกับการรวบรวมข้อมูล การจัดทำดัชนี หรือแผนผังเว็บไซต์ในส่วนความคิดเห็นด้านล่าง