ใครเป็นผู้รับผิดชอบคุณภาพของข้อมูล? เมทริกซ์ความรับผิดชอบสำหรับทีมวิเคราะห์

เผยแพร่แล้ว: 2022-06-11

เนื่องจากข้อมูลคุณภาพต่ำอาจทำให้การดำเนินการใดๆ เพิ่มเติมไร้ประโยชน์ (เช่น การคำนวณการระบุแหล่งที่มา การส่งราคาเสนอไปยังบริการโฆษณา หรือการสร้างรายงาน) การรับรองคุณภาพของข้อมูลยังคงเป็นความท้าทายที่ใหญ่ที่สุดในการวิเคราะห์ดิจิทัล เป็นเรื่องปกติที่จะบอกว่านักวิเคราะห์มีหน้าที่รับผิดชอบปัญหาที่เกี่ยวข้องกับข้อมูลทั้งหมด แต่นี่เป็นความจริงหรือไม่?

ใครเป็นผู้รับผิดชอบคุณภาพข้อมูลในบริษัท? ตรงกันข้ามกับความเชื่อที่นิยม ไม่ใช่แค่นักวิเคราะห์เท่านั้น ตัวอย่างเช่น นักการตลาดทำงานกับแท็ก UTM วิศวกรใช้รหัสติดตาม ฯลฯ ดังนั้นจึงไม่น่าแปลกใจที่ความโกลาหลเกิดขึ้นเมื่อทำงานกับข้อมูล: พนักงานแต่ละคนมีงานมากมาย และไม่ชัดเจนว่าใครกำลังทำอะไร ใครรับผิดชอบอะไร และ ที่ควรถามถึงผล

ในบทความนี้ เราพยายามทำความเข้าใจว่าใครเป็นผู้รับผิดชอบคุณภาพของข้อมูลในแต่ละขั้นตอนและจะจัดการอย่างไร

สารบัญ

  • เวิร์กโฟลว์ข้อมูล
    • 1. รวบรวมข้อมูลเบื้องต้น
    • 2. การนำเข้าข้อมูลเข้าสู่คลังข้อมูล
    • 3. การเตรียมมุมมอง SQL
    • 4. เตรียมข้อมูลให้พร้อมสำหรับธุรกิจ
    • 5. การเตรียมดาต้ามาร์ท
    • 6. การแสดงข้อมูล
  • ประเด็นที่สำคัญ
  • ลิงค์ที่มีประโยชน์

เวิร์กโฟลว์ข้อมูล

แม้แต่ภายในบริษัทเดียว โลกของข้อมูลก็เต็มไปด้วยความคลาดเคลื่อนและความเข้าใจผิด เพื่อให้ผู้ใช้ทางธุรกิจได้รับข้อมูลที่มีคุณภาพและหลีกเลี่ยงข้อมูลที่มีค่าสูญหาย คุณต้องวางแผนการรวบรวมข้อมูลการตลาดที่จำเป็นทั้งหมด การเตรียมเวิร์กโฟลว์ข้อมูลแสดงว่าคุณแสดงให้เห็นว่าข้อมูลเกี่ยวข้องกับเพื่อนร่วมงานในทุกแผนกอย่างไร จึงสามารถเชื่อมต่อจุดต่างๆ ได้ง่าย อย่างไรก็ตาม นั่นเป็นเพียงขั้นตอนแรกเท่านั้น มาดูกันว่าขั้นตอนอื่นๆ ในการเตรียมข้อมูลสำหรับรายงานและแดชบอร์ดมีอะไรบ้าง:

  1. ตั้งค่าการรวบรวมข้อมูลหลัก
  2. รวบรวมข้อมูลดิบลงในการจัดเก็บข้อมูลหรือฐานข้อมูล
  3. เปลี่ยนข้อมูลดิบให้เป็นข้อมูลสำหรับธุรกิจ พร้อมมาร์กอัปที่ล้างข้อมูลแล้ว และในโครงสร้างที่ธุรกิจเข้าใจได้
  4. เตรียมดาต้ามาร์ท — โครงสร้างแบบเรียบที่ทำหน้าที่เป็นแหล่งข้อมูลสำหรับการแสดงข้อมูลเป็นภาพ
  5. แสดงข้อมูลสำหรับแดชบอร์ด

ผู้มีอำนาจตัดสินใจมักพบรายงานหรือแดชบอร์ดที่มีข้อมูลคุณภาพต่ำโดยไม่คำนึงถึงการเตรียมตัว และสิ่งแรกที่พวกเขาทำคือหันไปหานักวิเคราะห์ด้วยคำถาม: ทำไมถึงมีความแตกต่างกัน? หรือ ข้อมูลที่เกี่ยวข้องที่นี่?

อย่างไรก็ตาม ความจริงก็คือผู้เชี่ยวชาญหลายคนมีส่วนร่วมในกระบวนการเหล่านี้: วิศวกรข้อมูลมีส่วนร่วมในการตั้งค่าระบบการวิเคราะห์ นักการตลาดเพิ่มแท็ก UTM ผู้ใช้ป้อนข้อมูล มาดูรายละเอียดกันว่าคุณควรดำเนินการผ่านขั้นตอนใดบ้างและควรนำไปใช้อย่างไรเพื่อให้ข้อมูลคุณภาพสูงแก่ผู้ใช้

ลูกค้าของเรา
เติบโต เร็วขึ้น 22%

เติบโตเร็วขึ้นด้วยการวัดว่าอะไรทำงานได้ดีที่สุดในการทำการตลาดของคุณ

วิเคราะห์ประสิทธิภาพทางการตลาดของคุณ ค้นหาพื้นที่การเติบโต เพิ่ม ROI

รับการสาธิต

1. รวบรวมข้อมูลเบื้องต้น

แม้ว่าขั้นตอนนี้จะดูเหมือนง่ายที่สุด แต่ก็มีอุปสรรคที่ซ่อนอยู่หลายประการ ก่อนอื่น คุณต้องวางแผนรวบรวมข้อมูล ทั้งหมด จากแหล่งที่มา ทั้งหมด แยกตัวประกอบในจุดสัมผัสของลูกค้าทั้งหมด บางครั้งขั้นตอนการวางแผนนี้ถูกข้ามไป แต่การทำเช่นนั้นไม่สมเหตุสมผลและมีความเสี่ยง การใช้แนวทางที่ไม่มีโครงสร้างจะทำให้ได้ข้อมูลที่ไม่สมบูรณ์หรือไม่ถูกต้อง

ความท้าทายหลักคือคุณต้องรวบรวมข้อมูลที่กระจัดกระจายจากแพลตฟอร์มโฆษณาและบริการต่างๆ ที่คุณทำงานด้วย เนื่องจากการประมวลผลอาร์เรย์ข้อมูลขนาดใหญ่ในเวลาที่สั้นที่สุดนั้นซับซ้อนและใช้ทรัพยากรมาก เรามาดูกันว่าปัญหาคอขวดที่อาจเกิดขึ้นได้อย่างไร:

  • ไม่ใช่ทุกหน้าที่มีคอนเทนเนอร์ GTM ติดตั้งอยู่ ดังนั้นข้อมูลจะไม่ถูกส่งไปยัง Google Analytics
  • มีการสร้างบัญชีใหม่บนแพลตฟอร์มโฆษณา แต่นักวิเคราะห์จะไม่ได้รับแจ้งและข้อมูลจะไม่ถูกเก็บรวบรวม
  • API ไม่รองรับพารามิเตอร์ไดนามิกในแท็ก UTM และไม่รวบรวมหรือถ่ายโอน
  • บัตรที่เชื่อมต่อกับโครงการ Google Cloud มีเงินหรือเครดิตไม่เพียงพอ
  • การตรวจสอบข้อมูลที่ป้อนโดยผู้ใช้ไม่ถูกต้อง

ในระหว่างขั้นตอนนี้ ท่ามกลางความท้าทายอื่นๆ คุณต้องพิจารณาควบคุมการเข้าถึงข้อมูล สำหรับสิ่งนี้ เราแนะนำให้ใช้เมทริกซ์ RACI แบบคลาสสิกที่กำหนดบทบาทสำหรับกระบวนการและเน้นว่าใครทำ ควบคุม จัดการ และรับผิดชอบอะไร นี่คือบทบาทที่เป็นไปได้:

  • R (รับผิดชอบ) — คนที่รับผิดชอบและเป็นผู้ดำเนินการกระบวนการเฉพาะ
  • C (Consulted) — บุคคลที่ให้คำปรึกษาและให้ข้อมูลที่จำเป็นในการดำเนินการตามกระบวนการ
  • A (Accountable or Approver) — ผู้รับผิดชอบผลงาน
  • I (Informed) — ผู้ที่ต้องแจ้งความคืบหน้าของงาน

ตามเมทริกซ์ RACI บทบาทและความรับผิดชอบในการรวบรวมข้อมูลมีลักษณะดังนี้:

2. การนำเข้าข้อมูลเข้าสู่คลังข้อมูล

ขั้นตอนต่อไปคือการตัดสินใจว่าจะจัดเก็บข้อมูลที่ได้รับทั้งหมดไว้ที่ใด หากคุณต้องการควบคุมข้อมูลดิบได้อย่างสมบูรณ์โดยไม่ต้องแก้ไข เราขอแนะนำให้ใช้ที่เก็บข้อมูลเดียวที่มีการนำเข้าข้อมูลอัตโนมัติ เนื่องจากการใช้เซิร์ฟเวอร์ของคุณเองในการจัดเก็บข้อมูลทุกไบต์จะมีค่าใช้จ่ายมหาศาล เราขอแนะนำให้ใช้โซลูชันระบบคลาวด์ที่ช่วยประหยัดทรัพยากรของคุณและให้การเข้าถึงข้อมูลได้ทุกที่

ตัวเลือกที่ดีที่สุดสำหรับงานนี้คือ Google BigQuery เนื่องจากพิจารณาความต้องการของนักการตลาดและสามารถใช้เพื่อจัดเก็บข้อมูลดิบจากเว็บไซต์ ระบบ CRM แพลตฟอร์มโฆษณา ฯลฯ ในปัจจุบัน มีโซลูชันซอฟต์แวร์การตลาดจำนวนมาก เราขอแนะนำ OWOX BI ซึ่งจะรวบรวมข้อมูลลงในคลังข้อมูล (หรือ data lake) โดยอัตโนมัติจากบริการและเว็บไซต์ต่างๆ

มาดูกันว่าข้อผิดพลาดแบบคลาสสิกที่อาจเกิดขึ้นเมื่อรวบรวมข้อมูลดิบมีอะไรบ้าง:

  • API ของบริการโฆษณามีการเปลี่ยนแปลง ดังนั้นรูปแบบข้อมูลก็เปลี่ยนไปเช่นกัน
  • API บริการภายนอกไม่พร้อมใช้งาน ผู้มีส่วนได้ส่วนเสียเห็นตัวเลขบางอย่างในบัญชีส่วนตัว แต่ API ของบริการโฆษณาเดียวกันให้ข้อมูลอื่น ข้อมูลนี้ไม่ตรงกันเพราะเช่นเดียวกับในระบบแบบกระจายใดๆ แหล่งข้อมูลสำหรับ API ของบริการโฆษณานั้นแตกต่างจากแหล่งข้อมูลสำหรับเว็บพอร์ทัล
  • ข้อมูลในเว็บอินเตอร์เฟสของบริการภายนอกและ API ต่างกัน รูปแบบเอกสารและการประมวลผลข้อมูลอาจแตกต่างกัน ตัวอย่างเช่น ข้อผิดพลาดที่น่าสนใจในบริการโฆษณายอดนิยมบริการหนึ่งคือค่าใช้จ่ายเป็นศูนย์ทั้งเมื่อไม่มีอยู่จริงและเมื่อเป็นศูนย์จริงๆ วิศวกรข้อมูลและนักวิเคราะห์ทุกคนทราบดีว่า ค่าศูนย์ และ ค่าว่าง เป็นค่าที่ต่างกันและประมวลผลต่างกัน ในกรณีหนึ่ง ค่าใช้จ่ายเหล่านี้อาจปรากฏขึ้นและต้องขออีกครั้ง และศูนย์หมายความว่าไม่มีอยู่จริงและจะถูกนับเป็นศูนย์
  • API ของบริการภายนอกให้ข้อมูลที่ไม่ถูกต้อง

ตามเมตริกซ์ ในกระบวนการนี้ นักการตลาดเป็นที่ปรึกษาและแหล่งความรู้ เช่น ความรู้เกี่ยวกับบัญชีที่คุณต้องการดาวน์โหลดข้อมูล แท็ก UTM คืออะไร และมาร์กอัปในแคมเปญโฆษณา

นอกจากนี้ยังมีนักพัฒนาซอฟต์แวร์ที่ต้องการทราบว่าจะเกิดอะไรขึ้นกับคอนเทนเนอร์หากใช้ Google Tag Manager เนื่องจากต้องรับผิดชอบต่อความเร็วในการดาวน์โหลดของเว็บไซต์

ณ จุดนี้ วิศวกรข้อมูลได้ทำ หน้าที่รับผิดชอบ แล้ว เนื่องจากพวกเขากำลังกำหนดค่าไปป์ไลน์ข้อมูล และนักวิเคราะห์มีหน้าที่รับผิดชอบต่อผลงาน แม้ว่าพนักงานคนหนึ่งจะทำหน้าที่เหล่านี้ แต่จริงๆ แล้วจะมีสองบทบาท ดังนั้น หากบริษัทมีนักวิเคราะห์เพียงคนเดียว เรายังคงแนะนำให้ใช้เมทริกซ์ตามบทบาท จากนั้น เมื่อบริษัทเติบโตขึ้น คุณจะมีรายละเอียดงานสำหรับเพื่อนร่วมงานใหม่และจะมีความชัดเจนในหน้าที่ความรับผิดชอบสำหรับบทบาทเฉพาะ

ผู้มีส่วนได้ส่วนเสียในขั้นตอนนี้สนใจที่จะทราบว่าข้อมูลใดที่มีอยู่และปัญหาใดบ้างเกี่ยวกับคุณภาพของข้อมูล เนื่องจากจะระบุลำดับความสำคัญและทรัพยากรที่มุ่งเป้าไปที่การรวบรวมข้อมูล ตัวอย่างเช่น ลูกค้าของเราใช้คุณลักษณะ OWOX BI Data Monitoring อย่างกว้างขวาง

3. การเตรียมมุมมอง SQL

การเตรียมข้อมูลเป็นขั้นตอนต่อไป มักเรียกว่าการจัดเตรียม data mart ซึ่งเป็นโครงสร้างแบบเรียบที่มีพารามิเตอร์และตัวชี้วัดที่จะนำเสนอบนแดชบอร์ด นักวิเคราะห์ที่มีเครื่องมือ งบประมาณ และเวลาจำกัด มักจะข้ามขั้นตอนการเตรียมข้อมูลทางธุรกิจและเตรียมดาต้ามาร์ททันที ดูเหมือนข้อมูลดิบที่รวบรวมในคลังข้อมูล จากนั้น มีการสืบค้น SQL ที่แตกต่างกันนับล้านรายการพร้อมกับสคริปต์ Python และ R — และความยุ่งเหยิงนี้จะส่งผลให้เกิดบางสิ่งบนแดชบอร์ด

หากคุณข้ามการเตรียมข้อมูลที่พร้อมสำหรับธุรกิจอยู่เรื่อยๆ จะทำให้เกิดข้อผิดพลาดซ้ำๆ ที่ต้องแก้ไขในแต่ละแหล่งที่มา สิ่งอื่น ๆ ที่อาจผิดพลาด ได้แก่ :

  • ข้อผิดพลาดปกติในข้อมูลหลัก
  • ตรรกะทางธุรกิจซ้ำกันในแบบสอบถาม SQL ทั้งหมด
  • ต้องใช้เวลามากมายในการค้นหาสาเหตุของความคลาดเคลื่อนของข้อมูล
  • ถึงเวลาปรับแต่งดาต้ามาร์ทที่มีอยู่แล้วเทียบได้กับเวลาในการเขียนคำขอใหม่
  • รายงานตรรกะที่ลูกค้าเข้าใจยาก

ตัวอย่างที่ง่ายและธรรมดาที่สุดของข้อผิดพลาดคือคำจำกัดความของ ผู้ใช้ใหม่ และ ผู้ใช้ที่กลับมา ธุรกิจส่วนใหญ่ไม่ได้สร้างความแตกต่างในลักษณะเดียวกับ Google Analytics ดังนั้น ตรรกะของคำนิยามประเภทผู้ใช้จึงมักถูกทำซ้ำในรายงานต่างๆ ข้อผิดพลาดบ่อยครั้งยังรวมถึงตรรกะของรายงานที่เข้าใจยากอีกด้วย สิ่งแรกที่ลูกค้าธุรกิจจะถามเมื่อดูรายงานคือการสร้างรายงาน ใช้สมมติฐานอะไร เหตุใดจึงใช้ข้อมูล และอื่นๆ ดังนั้น การเตรียมข้อมูลทางธุรกิจจึงเป็นขั้นตอนที่คุณไม่ควรพลาดเป็นอย่างยิ่ง การสร้างดาต้ามาร์ทจากข้อมูลดิบก็เหมือนกับการไม่ล้างผักและผลไม้ก่อนรับประทาน

หากเรากำหนดความรับผิดชอบตามเมทริกซ์ สำหรับการเตรียมข้อมูล เราจะได้สิ่งนี้:

4. เตรียมข้อมูลให้พร้อมสำหรับธุรกิจ

ข้อมูลที่พร้อมสำหรับธุรกิจคือชุดข้อมูลสุดท้ายที่สะอาดหมดจดซึ่งสอดคล้องกับโมเดลธุรกิจ เป็นข้อมูลสำเร็จรูปที่สามารถส่งไปยังบริการสร้างภาพข้อมูล (Power BI, Tableau, Google Data Studio เป็นต้น)

โดยปกติ ธุรกิจต่างๆ จะดำเนินการโดยใช้โมเดลที่แตกต่างกัน ตัวอย่างเช่น คำจำกัดความของ "ผู้ใช้" "ผู้ใช้ B2B" "ธุรกรรม" "ลูกค้าเป้าหมาย" ฯลฯ จะหมายถึงสิ่งที่แตกต่างกันสำหรับบริษัทต่างๆ วัตถุทางธุรกิจเหล่านี้ตอบคำถามว่าธุรกิจคิดอย่างไรเกี่ยวกับรูปแบบธุรกิจในแง่ของข้อมูล นี่คือคำอธิบายของธุรกิจที่เป็นแกนหลัก ไม่ใช่โครงสร้างของเหตุการณ์ใน Google Analytics

โมเดลข้อมูลช่วยให้พนักงานทุกคนสามารถซิงโครไนซ์และมีความเข้าใจทั่วไปเกี่ยวกับวิธีการใช้ข้อมูลและสิ่งที่เข้าใจได้ ดังนั้นการแปลงข้อมูลดิบเป็นข้อมูลที่พร้อมสำหรับธุรกิจจึงเป็นขั้นตอนสำคัญที่ไม่สามารถข้ามได้

สิ่งที่อาจผิดพลาดได้ในขั้นตอนนี้:

  • ไม่ชัดเจนซึ่งรูปแบบข้อมูลที่บริษัทมี/ใช้
  • ยากต่อการเตรียมและบำรุงรักษาข้อมูลจำลอง
  • ยากที่จะควบคุมการเปลี่ยนแปลงในตรรกะการเปลี่ยนแปลง

ที่นี่ คุณต้องตัดสินใจว่าจะเลือกโมเดลข้อมูลใดและจะควบคุมการเปลี่ยนแปลงตรรกะของการแปลงข้อมูลได้อย่างไร ดังนั้น นี่คือบทบาทของผู้เข้าร่วมในกระบวนการเปลี่ยนแปลง:

ผู้มีส่วนได้ส่วนเสียไม่ได้รับแจ้งอีกต่อไปแต่กลายเป็นที่ปรึกษา พวกเขาทำการตัดสินใจเช่นสิ่งที่ควรจะเข้าใจในฐานะผู้ใช้ใหม่หรือผู้ใช้ที่กลับมา งานของนักวิเคราะห์ในขั้นตอนนี้คือการมีส่วนร่วมของผู้มีส่วนได้ส่วนเสียให้มากที่สุดในการตัดสินใจเหล่านี้ มิฉะนั้น สิ่งที่ดีที่สุดที่สามารถเกิดขึ้นได้คือนักวิเคราะห์จะถูกขอให้ทำรายงานซ้ำ

จากประสบการณ์ของเรา บางบริษัทยังไม่ได้เตรียมข้อมูลให้พร้อมสำหรับธุรกิจและสร้างรายงานเกี่ยวกับข้อมูลดิบ ปัญหาหลักของวิธีนี้คือการดีบักและเขียนข้อความค้นหา SQL ใหม่ไม่รู้จบ ในระยะยาว การทำงานกับข้อมูลที่เตรียมไว้จะถูกกว่าและง่ายกว่า แทนที่จะเรียกใช้ข้อมูลดิบที่ทำสิ่งเดิมซ้ำแล้วซ้ำอีก

OWOX BI รวบรวมข้อมูลดิบจากแหล่งต่างๆ โดยอัตโนมัติ และแปลงเป็นรูปแบบที่เหมาะกับรายงาน เป็นผลให้คุณได้รับชุดข้อมูลสำเร็จรูปที่แปลงเป็นโครงสร้างที่ต้องการโดยอัตโนมัติ โดยคำนึงถึงความแตกต่างที่สำคัญสำหรับนักการตลาด คุณไม่จำเป็นต้องใช้เวลาในการพัฒนาและสนับสนุนการเปลี่ยนแปลงที่ซับซ้อน เจาะลึกโครงสร้างข้อมูล และใช้เวลาหลายชั่วโมงเพื่อค้นหาสาเหตุของความคลาดเคลื่อน

จองการสาธิตฟรีเพื่อดูว่า OWOX BI ช่วยเหลือในการเตรียมข้อมูลธุรกิจอย่างไร และคุณจะได้รับประโยชน์จากการจัดการข้อมูลอัตโนมัติเต็มรูปแบบได้อย่างไรในวันนี้

จองการสาธิต

5. การเตรียมดาต้ามาร์ท

ขั้นตอนต่อไปคือการเตรียมดาต้ามาร์ท พูดง่ายๆ ว่านี่คือตารางที่เตรียมไว้ซึ่งมีข้อมูลที่แน่นอนซึ่งผู้ใช้บางคนของแผนกนั้นๆ ต้องการ ซึ่งทำให้สมัครได้ง่ายขึ้นมาก

ทำไมนักวิเคราะห์ถึงต้องการ data mart และทำไมคุณไม่ควรข้ามขั้นตอนนี้? นักการตลาดและพนักงานคนอื่นๆ ที่ไม่มีทักษะในการวิเคราะห์พบว่าการทำงานกับข้อมูลดิบเป็นเรื่องยาก งานของนักวิเคราะห์คือการให้พนักงานทุกคนเข้าถึงข้อมูลในรูปแบบที่สะดวกที่สุด เพื่อไม่ให้พวกเขาต้องเขียนคำสั่ง SQL ที่ซับซ้อนทุกครั้ง

ดาต้ามาร์ทช่วยแก้ปัญหานี้ได้ แท้จริงแล้ว ด้วยการกรอกข้อมูลที่มีความสามารถ มันจะรวมส่วนข้อมูลที่จำเป็นสำหรับการทำงานของแผนกหนึ่งๆ และผู้ร่วมงานจะทราบวิธีการใช้ฐานข้อมูลดังกล่าวอย่างชัดเจน และจะเข้าใจบริบทของพารามิเตอร์และเมตริกที่นำเสนอ

กรณีหลักที่อาจเกิดข้อผิดพลาดในการเตรียมดาต้ามาร์ทคือ:

  • ตรรกะการผสานข้อมูลไม่สามารถเข้าใจได้ ตัวอย่างเช่น อาจมีข้อมูลจากแอปพลิเคชันมือถือและเว็บไซต์ และคุณจำเป็นต้องตัดสินใจว่าจะรวมข้อมูลดังกล่าวอย่างไรและใช้คีย์ใด หรือตัดสินใจว่าจะรวมแคมเปญโฆษณากับกิจกรรมในแอปบนอุปกรณ์เคลื่อนที่อย่างไร มีคำถามมากมาย ด้วยการตัดสินใจเหล่านี้เมื่อเตรียมข้อมูลธุรกิจ เราทำได้เพียงครั้งเดียวและคุณค่าของข้อมูลเหล่านั้นมีค่ามากกว่าการตัดสินใจเฉพาะกิจสำหรับรายงานเฉพาะที่นี่และเดี๋ยวนี้ การตัดสินใจเฉพาะกิจดังกล่าวต้องทำซ้ำๆ
  • คิวรี SQL ไม่ทำงานเนื่องจากข้อจำกัดทางเทคนิคของคลังข้อมูล การเตรียมข้อมูลทางธุรกิจเป็นวิธีหนึ่งในการล้างข้อมูลและนำข้อมูลดังกล่าวมาไว้ในโครงสร้างจำลอง ซึ่งจะทำให้มีราคาถูกลงในการประมวลผลและเร่งการสืบค้นข้อมูล
  • วิธีการตรวจสอบคุณภาพข้อมูลไม่ชัดเจน

มาดูกันว่าใครรับผิดชอบอะไรในขั้นตอนนี้ตามเมทริกซ์:

เห็นได้ชัดว่าการเตรียมข้อมูลเป็นความรับผิดชอบของนักวิเคราะห์ข้อมูลร่วมกับผู้มีส่วนได้ส่วนเสียและวิศวกรข้อมูล ซึ่งเป็นที่ปรึกษาในกระบวนการ โปรดทราบว่านักวิเคราะห์ OWOX BI สามารถจัดการงานนี้ให้คุณได้ เราสามารถรวบรวมและผสานข้อมูล สร้างแบบจำลองสำหรับโมเดลธุรกิจของคุณ และเตรียมดาต้ามาร์ทพร้อมด้วยคำแนะนำโดยละเอียดพร้อมคำอธิบายของตรรกะของบิลด์ ช่วยให้คุณทำการเปลี่ยนแปลงในด้านของคุณหากจำเป็น (เช่น การเพิ่มฟิลด์ใหม่)

6. การแสดงข้อมูล

การนำเสนอข้อมูลด้วยสายตาในรายงานและแดชบอร์ดเป็นขั้นตอนสุดท้ายที่ทุกอย่างเริ่มต้นขึ้นจริง เห็นได้ชัดว่าควรนำเสนอข้อมูลในลักษณะที่เป็นข้อมูลและใช้งานง่าย ไม่ต้องพูดถึงว่าการแสดงภาพแบบอัตโนมัติและกำหนดค่าอย่างเหมาะสมช่วยลดเวลาในการค้นหาโซนความเสี่ยง ปัญหา และความเป็นไปได้ในการเติบโตอย่างมาก

หากคุณได้เตรียมข้อมูลที่พร้อมสำหรับธุรกิจและดาต้ามาร์ท คุณจะไม่มีปัญหากับการสร้างภาพข้อมูล อย่างไรก็ตาม ยังอาจปรากฏข้อผิดพลาดเช่น:

  • ข้อมูลที่ไม่เกี่ยวข้องในดาต้ามาร์ท หากธุรกิจไม่แน่ใจเกี่ยวกับคุณภาพของข้อมูล แม้ว่าข้อมูลจะมีคุณภาพสูงก็ตาม ขั้นตอนแรกคือการที่ลูกค้าธุรกิจต้องขอให้นักวิเคราะห์ตรวจสอบทุกอย่างอีกครั้ง สิ่งนี้ไม่มีประสิทธิภาพ เป็นที่ชัดเจนว่าธุรกิจต้องการได้รับการปกป้องจากข้อผิดพลาดและไม่รีบเร่งที่จะสรุป ดังนั้นข้อมูลคุณภาพสูงจึงรับประกันได้ว่ามีคนจะใช้ในภายหลัง
  • การเลือกวิธีการสร้างภาพข้อมูลที่ไม่ถูกต้อง
  • ไม่ได้อธิบายตรรกะของการคำนวณเมตริกและพารามิเตอร์ให้กับลูกค้าอย่างเหมาะสม บ่อยครั้ง สำหรับลูกค้าธุรกิจที่ไม่ได้อาศัยอยู่ใน SQL และตัววัดในการตีความข้อมูลอย่างถูกต้อง พวกเขาจำเป็นต้องดูความหมายของแต่ละตัวชี้วัดในบริบทของรายงาน วิธีคำนวณ และเหตุผล นักวิเคราะห์ไม่ควรลืมว่าผู้ใดก็ตามที่ใช้รายงานควรมีสิทธิ์เข้าถึงคำอธิบายของสิ่งที่อยู่เบื้องหลังรายงาน สมมติฐานที่เป็นหัวใจของรายงาน เป็นต้น

ตามเมทริกซ์ RACI นักวิเคราะห์มีบทบาทสองประการอยู่แล้ว — ผู้อนุมัติ และ รับผิดชอบ ผู้มีส่วนได้ส่วนเสียเป็นที่ ปรึกษา ที่นี่ และเป็นไปได้มากว่าพวกเขาจะตอบคำถามล่วงหน้าเกี่ยวกับการตัดสินใจที่พวกเขาวางแผนจะทำ และสมมติฐานใดที่พวกเขาต้องการทดสอบ สมมติฐานเหล่านี้เป็นพื้นฐานสำหรับการออกแบบการแสดงภาพที่นักวิเคราะห์ใช้

ประเด็นที่สำคัญ

เมทริกซ์ RACI ไม่ใช่คำตอบสำหรับคำถามที่เป็นไปได้ทั้งหมดเกี่ยวกับการทำงานกับข้อมูล แต่สามารถลดการใช้งานและการประยุกต์ใช้โฟลว์ข้อมูลในบริษัทของคุณได้อย่างแน่นอน

เนื่องจากบุคคลที่มีบทบาทต่างกันมีส่วนร่วมในขั้นตอนต่างๆ ของกระแสข้อมูล จึงผิดที่จะถือว่านักวิเคราะห์เป็นผู้รับผิดชอบคุณภาพของข้อมูลแต่เพียงผู้เดียว คุณภาพของข้อมูลยังเป็นความรับผิดชอบของเพื่อนร่วมงานทุกคนที่เกี่ยวข้องกับการมาร์กอัปข้อมูล การส่งมอบ การจัดเตรียม หรือการตัดสินใจในการจัดการ

ข้อมูลทั้งหมดมีคุณภาพต่ำอยู่เสมอ และเป็นไปไม่ได้ที่จะขจัดความคลาดเคลื่อนของข้อมูลอย่างถาวร ทำให้ข้อมูลมีความสอดคล้องกัน และขจัดเสียงรบกวนและความซ้ำซ้อน สิ่งนี้เกิดขึ้นเสมอ โดยเฉพาะอย่างยิ่งในความเป็นจริงของข้อมูลที่รวดเร็วและเปลี่ยนแปลงแบบไดนามิก เช่น การตลาด อย่างไรก็ตาม คุณสามารถระบุปัญหาเหล่านี้ในเชิงรุกและตั้งเป้าหมายเพื่อให้ทราบถึงคุณภาพข้อมูลของคุณ ตัวอย่างเช่น คุณสามารถรับคำตอบสำหรับคำถามต่างๆ เช่น ข้อมูลได้รับการอัปเดตเมื่อใด ข้อมูลที่มีอยู่ในรายละเอียดใด? เรารู้ข้อผิดพลาดอะไรบ้างในข้อมูล? และเมตริกใดบ้างที่เราสามารถใช้ได้?

สำหรับผู้ที่ต้องการมีส่วนร่วมในการปรับปรุงคุณภาพข้อมูลของบริษัท เราขอแนะนำสามขั้นตอนง่ายๆ:

  1. สร้างสคีมาการไหลของข้อมูล ตัวอย่างเช่น ใช้ Miro และร่างวิธีที่บริษัทของคุณใช้ข้อมูล คุณจะแปลกใจว่ามีความคิดเห็นที่แตกต่างกันมากมายเกี่ยวกับสคีมานี้ภายในบริษัทเดียว
  2. รวบรวมเมทริกซ์ความรับผิดชอบ และตกลงกันว่าใครรับผิดชอบอะไร อย่างน้อยก็ในกระดาษ
  3. อธิบายรูปแบบข้อมูลธุรกิจ

ด้วยความเชี่ยวชาญเป็นเวลาหลายปี ทีมงาน OWOX BI รู้ว่าควรจัดสรรความรับผิดชอบอย่างไรและนักวิเคราะห์ต้องการอะไร จากความรู้นี้ เราได้เตรียมเทมเพลตเมทริกซ์การจัดสรรความรับผิดชอบสำหรับทีมนักวิเคราะห์

รับเมทริกซ์

นอกจากนี้ ทีมงาน OWOX BI สามารถช่วยเหลือคุณในการกำหนดค่าและทำให้ขั้นตอนข้อมูลทั้งหมดเป็นไปโดยอัตโนมัติตามที่อธิบายไว้ในบทความนี้ หากคุณต้องการความช่วยเหลือเกี่ยวกับงานใดๆ เหล่านี้ หรือต้องการตรวจสอบระบบวิเคราะห์และคุณภาพข้อมูลของคุณ ให้จองการสาธิต

ลิงค์ที่มีประโยชน์

  1. ข้อมูลมืด: ทำไมสิ่งที่คุณไม่รู้เรื่อง โดย David J. Hand
  2. สัญญาณและเสียงรบกวน: เหตุใดการคาดการณ์จำนวนมากจึงล้มเหลว แต่บางอย่างไม่ทำ โดย Nate Silver
  3. คาดเดาไม่ลงตัว โดย Dr. Dan Ariely
  4. The Irrational Ape: ทำไมเราถึงตกหลุมรักการบิดเบือน ทฤษฎีสมคบคิด และโฆษณาชวนเชื่อ โดย David Robert Grimes
  5. ประสบการณ์ของ “ระบบนิเวศข้อมูล” โดย Antriksh Goel