Data Virtualization คืออะไร และเหตุใดเราจึงต้องใช้
เผยแพร่แล้ว: 2022-12-26การจำลองข้อมูลเสมือนเป็นเทคโนโลยีที่ช่วยให้องค์กรสามารถจัดการ ผสานรวม และวิเคราะห์ข้อมูลของตนโดยให้มุมมองเชิงตรรกะของข้อมูลที่สามารถเข้าถึงได้จากหลายแหล่งราวกับว่าเป็นฐานข้อมูลเดียวที่รวมเป็นหนึ่งเดียว
ในสภาพแวดล้อมทางธุรกิจดิจิทัลในปัจจุบัน ข้อมูลขององค์กรถูกสร้างและรวบรวมจากแหล่งข้อมูลที่หลากหลาย รวมถึงระบบและกระบวนการภายใน คู่ค้าและลูกค้าภายนอก และแหล่งข้อมูลบุคคลที่สาม ข้อมูลนี้สามารถจัดโครงสร้างได้ เช่น ข้อมูลที่จัดเก็บไว้ในฐานข้อมูลแบบดั้งเดิม หรือไม่มีโครงสร้าง เช่น เอกสาร รูปภาพ และไฟล์วิดีโอ
ข้อมูลนี้มักถูกจัดเก็บไว้ในตำแหน่งต่างๆ ที่หลากหลาย รวมถึงเซิร์ฟเวอร์ภายในองค์กรและระบบจัดเก็บข้อมูล ตลอดจนในระบบคลาวด์ เป็นผลให้องค์กรอาจได้รับมุมมองที่ครอบคลุมของข้อมูลและจัดการและวิเคราะห์ได้อย่างมีประสิทธิภาพ การจำลองข้อมูลเสมือนเป็นเครื่องมือที่มีประโยชน์ในการรับมือกับความท้าทายนี้
Data Virtualization คืออะไร?
การจำลองเสมือนของข้อมูลเป็นแนวคิดที่ข้อมูลจากหลายแหล่งที่แตกต่างกันมารวมเข้าด้วยกันและทำให้เข้าถึงได้ราวกับว่าเป็นที่เก็บข้อมูลเดียวที่รวมเป็นหนึ่งเดียว ช่วยให้สามารถสร้างชั้นข้อมูลเสมือน (VDL) ที่แอปพลิเคชันและผู้ใช้สามารถเข้าถึงและสืบค้นได้โดยไม่จำเป็นต้องทำซ้ำหรือย้ายข้อมูลจากแหล่งดั้งเดิม
เลเยอร์เสมือนนี้มีหน้าที่แยกข้อมูลจากแหล่งข้อมูลทางกายภาพที่อยู่ภายใต้ ทำให้ดูเหมือนว่ามาจากแหล่งข้อมูลเดียว
การจำลองเสมือนของข้อมูลมักใช้ร่วมกับการจัดการข้อมูลและเทคโนโลยีการผสานรวมอื่นๆ เช่น data lake คลังข้อมูล และเครื่องมือการรวมข้อมูล ซึ่งจะมีประโยชน์อย่างยิ่งสำหรับองค์กรที่มีสภาพแวดล้อมข้อมูลขนาดใหญ่และหลากหลาย โดยข้อมูลที่จัดเก็บในรูปแบบและตำแหน่งที่ตั้งที่หลากหลาย
การจำลองเสมือนของข้อมูลมีประโยชน์หลายประการที่ทำให้มีประโยชน์สำหรับอุตสาหกรรมต่างๆ ที่หลากหลาย:
- ความคล่องตัวที่เพิ่มขึ้น : การจำลองข้อมูลเสมือนช่วยให้องค์กรสามารถเข้าถึงข้อมูลจากหลายแหล่งได้อย่างรวดเร็วและง่ายดาย โดยไม่ต้องใช้กระบวนการรวมข้อมูลที่ซับซ้อนและใช้เวลานาน สิ่งนี้สามารถช่วยให้องค์กรตัดสินใจได้เร็วขึ้นและมีข้อมูลมากขึ้นโดยพิจารณาจากข้อมูลที่สมบูรณ์ยิ่งขึ้น
- ลดความซับซ้อน : ลดความซับซ้อนของกระบวนการเข้าถึงและบูรณาการข้อมูลจากหลายแหล่ง ซึ่งช่วยลดความซับซ้อนและปรับปรุงประสิทธิภาพ
- การรักษาความปลอดภัยขั้นสูง : นอกจากนี้ยังช่วยปรับปรุงความปลอดภัยของข้อมูลโดยอนุญาตให้องค์กรเข้าถึงข้อมูลโดยไม่ต้องย้ายหรือคัดลอก สิ่งนี้สามารถช่วยลดความเสี่ยงของการละเมิดข้อมูลและการเข้าถึงข้อมูลที่ละเอียดอ่อนโดยไม่ได้รับอนุญาต
- ความสามารถในการปรับขนาดที่เพิ่มขึ้น ช่วยให้องค์กรสามารถเพิ่มขนาดการรวมข้อมูลได้อย่างง่ายดายและความพยายามในการวิเคราะห์ตามความต้องการที่เปลี่ยนไปโดยไม่ต้องใช้ฮาร์ดแวร์หรือโครงสร้างพื้นฐานเพิ่มเติม
- ลดความซ้ำซ้อนของข้อมูล : การจำลองเสมือนของข้อมูลสามารถช่วยลดความจำเป็นในการจำลองข้อมูลทางกายภาพ ซึ่งช่วยประหยัดพื้นที่จัดเก็บและทรัพยากรการประมวลผล นอกจากนี้ยังสามารถช่วยลดความเสี่ยงของข้อผิดพลาดและความไม่สอดคล้องกันที่อาจเกิดขึ้นจากการทำซ้ำข้อมูล
และยังสามารถใช้แนวคิดการจำลองข้อมูลเสมือนเพื่อเปิดใช้งานการวิเคราะห์แบบเรียลไทม์ การตัดสินใจที่ขับเคลื่อนด้วยข้อมูล และการจัดการข้อมูลที่คล่องตัว สิ่งนี้มีประโยชน์อย่างยิ่งในอุตสาหกรรมที่ข้อมูลมีการเปลี่ยนแปลงตลอดเวลา เช่น การเงินหรืออีคอมเมิร์ซ
การจำลองเสมือนของข้อมูลยังสามารถสนับสนุนการกำกับดูแลข้อมูลและการปฏิบัติตามกฎระเบียบ โดยช่วยให้องค์กรติดตามและควบคุมการเข้าถึงข้อมูลได้ง่ายขึ้น รวมทั้งรับประกันว่าข้อมูลจะถูกใช้ในลักษณะที่เป็นไปตามข้อกำหนด ตัวอย่างเช่น สามารถช่วยให้องค์กรบังคับใช้การควบคุมการเข้าถึงข้อมูลและใช้การปกปิดข้อมูลหรือการปกปิดข้อมูลกับข้อมูลที่ละเอียดอ่อน
การทำ Data Virtualization ทำอย่างไร

การทำ Data Virtualization มักทำได้โดยใช้ซอฟต์แวร์หรือเครื่องมือพิเศษ หรือโดยการสร้างโซลูชันแบบกำหนดเอง มีหลายวิธีในการปรับใช้การจำลองข้อมูลเสมือน ได้แก่ :
การใช้เซิร์ฟเวอร์การจำลองข้อมูลเสมือน:
วิธีการหนึ่งทั่วไปในการนำ data virtualization ไปใช้งานคือการใช้ data virtualization server เซิร์ฟเวอร์การจำลองข้อมูลสามารถเข้าถึงได้ผ่านอินเทอร์เฟซบนเว็บหรือผ่าน API
สามารถใช้ร่วมกับแหล่งข้อมูลต่างๆ รวมถึงฐานข้อมูล ไฟล์แฟลต และที่เก็บข้อมูลบนคลาวด์ สิ่งนี้มีประโยชน์ในสถานการณ์ที่ต้องมีการแชร์ข้อมูลระหว่างแผนกหรือองค์กร หรือเมื่อจำเป็นต้องรวมข้อมูลจากหลายแหล่งเพื่อการวิเคราะห์หรือการรายงาน
การสร้างโซลูชันการจำลองข้อมูลเสมือนแบบกำหนดเอง:
ในบางกรณี องค์กรอาจเลือกที่จะสร้างโซลูชันการจำลองข้อมูลเสมือนของตนเองโดยใช้ซอฟต์แวร์หรือเครื่องมือที่กำหนดเอง สิ่งนี้อาจเกี่ยวข้องกับการสร้างเลเยอร์การรวมข้อมูลแบบกำหนดเองที่อยู่ระหว่างแหล่งข้อมูลและผู้ใช้หรือแอปพลิเคชันที่จำเป็นต้องเข้าถึงข้อมูล
การใช้บริการจำลองข้อมูลบนคลาวด์:
บริการดาต้าเวอร์ช่วลไลเซชั่นบนคลาวด์ เช่น ที่ให้บริการโดย Amazon Web Services (AWS) หรือ Microsoft Azure ช่วยให้องค์กรต่างๆ เข้าถึงและรวมข้อมูลจากหลายแหล่งโดยไม่จำเป็นต้องสร้างหรือบำรุงรักษาโครงสร้างพื้นฐานดาต้าเวอร์ช่วลไลเซชั่นของตนเอง
ขั้นตอนใน Data Virtualization

กระบวนการของ data virtualization โดยทั่วไปเกี่ยวข้องกับขั้นตอนต่อไปนี้:
#1. ระบุแหล่งข้อมูล
ขั้นตอนแรกในการปรับใช้การจำลองข้อมูลเสมือนคือการระบุแหล่งข้อมูลที่จำเป็นต้องเข้าถึงและรวมเข้าด้วยกัน แหล่งข้อมูลเหล่านี้อาจเป็นฐานข้อมูล ไฟล์ แอปพลิเคชัน หรือแหล่งข้อมูลอื่นๆ
#2. เชื่อมต่อกับแหล่งข้อมูล
ขั้นตอนต่อไปคือการเชื่อมต่อกับแหล่งข้อมูลและดึงข้อมูลที่ต้องการจำลองเสมือน ซึ่งอาจเกี่ยวข้องกับการใช้ตัวเชื่อมต่อหรือไดรเวอร์เพื่อเข้าถึงข้อมูล และอาจต้องกำหนดค่าสิทธิ์การเข้าถึงและการรับรองความถูกต้อง

#3. แปลงและล้างข้อมูล
เมื่อแยกข้อมูลแล้ว อาจต้องแปลงและล้างข้อมูลเพื่อให้แน่ใจว่าอยู่ในรูปแบบที่ใช้งานได้ ซึ่งอาจเกี่ยวข้องกับการใช้การแปลงหรือกฎคุณภาพข้อมูลกับข้อมูล หรือการลบข้อมูลที่ซ้ำกันหรือบันทึกที่ไม่ถูกต้อง
#4. สร้างชั้นข้อมูลเสมือน
ชั้นข้อมูลเสมือนเป็นองค์ประกอบหลักของโซลูชันการจำลองข้อมูลเสมือน มันเกี่ยวข้องกับการสร้างมุมมองเสมือนของข้อมูลที่สามารถเข้าถึงและสืบค้นได้โดยไม่ต้องย้ายหรือคัดลอกจากตำแหน่งเดิม ซึ่งอาจเกี่ยวข้องกับการสร้างแบบจำลองข้อมูลเชิงตรรกะหรือมุมมองที่แมปกับแหล่งข้อมูลพื้นฐาน
#5. เข้าถึงและสอบถามข้อมูลเสมือนจริง
เมื่อสร้างชั้นข้อมูลเสมือนแล้ว ผู้ใช้และแอปพลิเคชันจะสามารถเข้าถึงและสืบค้นข้อมูลโดยใช้ SQL มาตรฐานหรือภาษาสืบค้นอื่นๆ ชั้นข้อมูลเสมือนจะแปลข้อความค้นหาเป็นรูปแบบที่เหมาะสมสำหรับแหล่งข้อมูลพื้นฐาน และส่งกลับผลลัพธ์ไปยังผู้ใช้หรือแอปพลิเคชัน
#6. ตรวจสอบและบำรุงรักษาชั้นข้อมูลเสมือน
โดยทั่วไปโซลูชันการจำลองข้อมูลเสมือนจะรวมเครื่องมือและกระบวนการสำหรับการตรวจสอบและบำรุงรักษาชั้นข้อมูลเสมือน ซึ่งอาจเกี่ยวข้องกับการติดตามการเปลี่ยนแปลงของแหล่งข้อมูลพื้นฐานและการอัปเดตชั้นข้อมูลเสมือนเพื่อแสดงถึงการเปลี่ยนแปลงเหล่านี้ นอกจากนี้ยังอาจเกี่ยวข้องกับการปรับชั้นข้อมูลเสมือนให้เหมาะสมเพื่อประสิทธิภาพและตรวจสอบให้แน่ใจว่าสอดคล้องกับความต้องการและข้อกำหนดทางธุรกิจที่เปลี่ยนแปลง
Data Virtualization กับ Data Visualization
การจำลองข้อมูลเสมือนจริงและการแสดงข้อมูลเป็นภาพเป็นสองแนวคิดที่แตกต่างกันซึ่งมักจะใช้ร่วมกัน แต่มีจุดประสงค์ที่แตกต่างกัน ต่อไปนี้เป็นข้อแตกต่างที่สำคัญบางประการระหว่างการแสดงข้อมูลเสมือนจริงและการแสดงข้อมูลเป็นภาพ:
การจำลองข้อมูลเสมือนจริง | การแสดงข้อมูล |
เปิดใช้งานการเข้าถึงและการรวมข้อมูลจากหลายแหล่ง | นำเสนอข้อมูลในรูปแบบกราฟิกหรือภาพเพื่อช่วยให้ผู้คนเข้าใจและตีความข้อมูล |
มันเกี่ยวข้องกับการสร้างมุมมองเสมือนของข้อมูลที่สามารถเข้าถึงและสืบค้นได้โดยไม่ต้องย้ายหรือคัดลอกข้อมูล | เกี่ยวข้องกับการเลือกและแปลงข้อมูลเพื่อสร้างแผนภูมิ กราฟ หรือการแสดงภาพอื่นๆ |
ให้ชั้นข้อมูลเสมือนหรืออินเทอร์เฟซที่ผู้ใช้หรือแอปพลิเคชันสามารถเข้าถึงได้ | สร้างเอาต์พุตกราฟิกหรือภาพที่ผู้คนสามารถดูได้ |
มักใช้ในสถานการณ์ที่ข้อมูลถูกจัดเก็บในสถานที่ รูปแบบ หรือระบบหลายแห่ง หรือในกรณีที่ไม่สามารถรวมข้อมูลทางกายภาพเข้าด้วยกันได้ | มักใช้เพื่อสื่อสารแนวคิดที่ซับซ้อน เน้นข้อมูลเชิงลึกที่สำคัญ หรือสนับสนุนการตัดสินใจ |
ซึ่งอาจเกี่ยวข้องกับการใช้ซอฟต์แวร์หรือเครื่องมือพิเศษ การสร้างโซลูชันแบบกำหนดเอง หรือการใช้บริการบนคลาวด์ | ซึ่งอาจเกี่ยวข้องกับการใช้เครื่องมือต่างๆ เช่น แผนภูมิ กราฟ แผนที่ หรืออินโฟกราฟิก ตลอดจนเทคนิคต่างๆ เช่น การจัดการข้อมูล การรวม และการแปลงข้อมูล |
สามารถช่วยลดความซ้ำซ้อนและเวลาแฝงของข้อมูล และปรับปรุงการรวมข้อมูลและการทำงานร่วมกัน | สามารถช่วยเปิดเผยรูปแบบ แนวโน้ม และความสัมพันธ์ที่อาจไม่ปรากฏทันทีในข้อมูลดิบ |
สามารถใช้เพื่อสนับสนุนการกำกับดูแลข้อมูลและการปฏิบัติตามกฎระเบียบ | สามารถใช้เพื่อนำเสนอข้อมูลในลักษณะที่มีส่วนร่วมและโต้ตอบได้ |
สามารถช่วยในการจัดการข้อมูลที่คล่องตัว | สามารถช่วยสื่อสารข้อมูลเชิงลึกที่ขับเคลื่อนด้วยข้อมูลไปยังผู้ชมที่กว้างขึ้น |
ในทางปฏิบัติมักใช้ data virtualization และ data visualization ร่วมกัน การจำลองเสมือนของข้อมูลสามารถให้ข้อมูลที่จำเป็นสำหรับการแสดงภาพ และการแสดงภาพสามารถให้วิธีที่ใช้งานง่ายและโต้ตอบได้มากขึ้นในการสำรวจและทำความเข้าใจข้อมูล
ตัวอย่างเช่น ธุรกิจอาจใช้การจำลองข้อมูลเสมือนเพื่อเข้าถึงและรวมข้อมูลจากหลายแหล่ง แล้วใช้การแสดงข้อมูลเพื่อสร้างแผนภูมิ กราฟ หรือแดชบอร์ดที่ช่วยเปิดเผยข้อมูลเชิงลึกและแนวโน้มในข้อมูล
กรณีการใช้งานของ Data Virtualization

ต่อไปนี้เป็นกรณีการใช้งานของ data virtualization
การเตรียมข้อมูล : การจำลองเสมือนของข้อมูลสามารถใช้เพื่อเตรียมข้อมูลสำหรับการวิเคราะห์หรือวัตถุประสงค์อื่นๆ โดยจัดเตรียมมุมมองเสมือนของข้อมูลที่สามารถเข้าถึงและแปลงได้ตามต้องการ ตัวอย่างเช่น นักวิทยาศาสตร์ข้อมูลอาจใช้การจำลองข้อมูลเสมือนเพื่อเข้าถึงและรวมข้อมูลจากหลายแหล่ง แล้วนำการแปลงหรือกฎคุณภาพข้อมูลไปใช้กับข้อมูลเพื่อเตรียมข้อมูลสำหรับการวิเคราะห์
การแบ่งปันข้อมูลบนคลาวด์ : นอกจากนี้ยังใช้เพื่อแบ่งปันข้อมูลที่เก็บไว้ในคลาวด์ระหว่างทีมหรือแผนกต่าง ๆ ภายในองค์กร สิ่งนี้สามารถช่วยให้แน่ใจว่าทุกคนสามารถเข้าถึงข้อมูลที่ต้องการได้ ในขณะเดียวกันก็ช่วยลดความจำเป็นในการทำซ้ำข้อมูล
การเปิดใช้งานฮับข้อมูล : การจำลองเสมือนข้อมูลสามารถใช้เพื่อสร้างฮับข้อมูลส่วนกลางที่อนุญาตให้ผู้ใช้เข้าถึงและรวมข้อมูลจากหลายแหล่ง
ตัวอย่างเช่น องค์กรอาจใช้การจำลองข้อมูลเสมือนเพื่อสร้างฮับข้อมูลที่รวมข้อมูลจากระบบธุรกิจต่างๆ เช่น ERP, CRM และระบบ HR เพื่อสนับสนุนการตัดสินใจที่ขับเคลื่อนด้วยข้อมูล
ผู้ใช้และแอปพลิเคชันสามารถเข้าถึงฮับข้อมูลได้ผ่านมุมมองเสมือนจริง ซึ่งช่วยลดความซับซ้อนในการเข้าถึงและบูรณาการข้อมูลจากหลายแหล่งได้
บทสรุป
การจำลองเสมือนของข้อมูลสามารถปรับปรุงความคล่องตัว ความยืดหยุ่น และคุณภาพของข้อมูล ในขณะที่ลดค่าใช้จ่ายและปรับปรุงความปลอดภัย มีแอปพลิเคชันและกรณีการใช้งานมากมายในหลากหลายอุตสาหกรรม รวมถึงการเงิน การดูแลสุขภาพ การค้าปลีก การผลิต และรัฐบาล
การพิจารณาการนำ Data Virtualization ไปใช้ในองค์กรของคุณ สิ่งสำคัญคือต้องประเมินแหล่งข้อมูลของคุณอย่างรอบคอบ เลือกเครื่องมือ Data Virtualization ที่เหมาะสม และตั้งค่าและเพิ่มประสิทธิภาพระบบ Data Virtualization เพื่อให้ตรงกับความต้องการทางธุรกิจของคุณ
ฉันหวังว่าคุณจะพบว่าบทความนี้มีประโยชน์ในการเรียนรู้ data virtualization คุณอาจสนใจเรียนรู้เกี่ยวกับเครื่องมือตรวจสอบการจำลองเสมือน