เนื้อหา
- คำจำกัดความ - Dirty Data หมายถึงอะไร
- ข้อมูลเบื้องต้นเกี่ยวกับ Microsoft Azure และ Microsoft Cloud | ในคู่มือนี้คุณจะได้เรียนรู้ว่าการประมวลผลแบบคลาวด์คืออะไรและ Microsoft Azure สามารถช่วยคุณโยกย้ายและดำเนินธุรกิจจากคลาวด์ได้อย่างไร
- Techopedia อธิบาย Dirty Data
คำจำกัดความ - Dirty Data หมายถึงอะไร
ข้อมูลสกปรกหมายถึงข้อมูลที่มีข้อมูลที่ผิดพลาด มันอาจจะใช้เมื่ออ้างถึงข้อมูลที่อยู่ในหน่วยความจำและยังไม่ได้โหลดลงในฐานข้อมูล การลบข้อมูลที่สกปรกทั้งหมดออกจากแหล่งข้อมูลนั้นเป็นไปไม่ได้หรือเป็นไปไม่ได้จริง
ข้อมูลต่อไปนี้ถือเป็นข้อมูลที่สกปรก:
- ข้อมูลที่ทำให้เข้าใจผิด
- ข้อมูลที่ซ้ำกัน
- ข้อมูลไม่ถูกต้อง
- ข้อมูลไม่ถูกต้อง
- ข้อมูลที่ไม่รวม
- ข้อมูลที่ละเมิดกฎทางธุรกิจ
- ข้อมูลที่ไม่มีการจัดรูปแบบทั่วไป
- ข้อมูลคั่นหรือสะกดผิดไม่ถูกต้อง
ข้อมูลเบื้องต้นเกี่ยวกับ Microsoft Azure และ Microsoft Cloud | ในคู่มือนี้คุณจะได้เรียนรู้ว่าการประมวลผลแบบคลาวด์คืออะไรและ Microsoft Azure สามารถช่วยคุณโยกย้ายและดำเนินธุรกิจจากคลาวด์ได้อย่างไร
Techopedia อธิบาย Dirty Data
นอกเหนือจากการป้อนข้อมูลที่ไม่ถูกต้องข้อมูลสกปรกสามารถสร้างขึ้นได้เนื่องจากวิธีการที่ไม่เหมาะสมในการจัดการข้อมูลและการจัดเก็บข้อมูล มีการอธิบายชนิดข้อมูลสกปรกบางอย่างด้านล่าง:
- ข้อมูลไม่ถูกต้อง - เพื่อให้แน่ใจว่าข้อมูลนั้นถูกต้องหรือถูกต้องค่าที่ป้อนควรเป็นไปตามค่าที่ถูกต้องของฟิลด์ ตัวอย่างเช่นค่าที่ป้อนในฟิลด์เดือนควรมีค่าตั้งแต่ 1 ถึง 12 หรืออายุบุคคลต้องน้อยกว่า 130 ค่าความถูกต้องของข้อมูลอาจถูกบังคับใช้โดยทางโปรแกรมโดยใช้ตารางการค้นหาหรือตรวจสอบการแก้ไข
- ข้อมูลไม่ถูกต้อง - เป็นไปได้ที่ค่าข้อมูลอาจถูกต้อง แต่ไม่ถูกต้อง ในบางครั้งมันเป็นประโยชน์ในการตรวจสอบกับไฟล์หรือเขตข้อมูลอื่น ๆ เพื่อค้นหาว่าค่าข้อมูลมีความถูกต้องตามการใช้งาน ยังคงความถูกต้องสามารถตรวจสอบได้โดยการตรวจสอบด้วยตนเองเท่านั้น
- การละเมิดกฎธุรกิจ - ข้อมูลที่ละเมิดกฎธุรกิจเป็นข้อมูลสกปรกอีกประเภทหนึ่ง ตัวอย่างเช่นวันที่มีผลจะต้องมาก่อนวันหมดอายุ อีกตัวอย่างของการละเมิดกฎธุรกิจอาจเป็นผู้ป่วยประกันสุขภาพของ Medicare ที่ผู้ป่วยอาจยังอยู่ภายใต้อายุเกษียณและไม่ได้รับสิทธิ์ Medicare
- ข้อมูลที่ไม่สอดคล้องกัน - ความซ้ำซ้อนของข้อมูลที่ไม่ได้ตรวจสอบนำไปสู่ความไม่สอดคล้องของข้อมูล แต่ละองค์กรได้รับผลกระทบด้วยข้อมูลที่ไม่สอดคล้องและซ้ำซ้อน โดยเฉพาะอย่างยิ่งกับข้อมูลลูกค้า
- ข้อมูลไม่สมบูรณ์ - ข้อมูลที่มีค่าที่ขาดหายไปเป็นประเภทหลักของข้อมูลที่ไม่สมบูรณ์
- ข้อมูลที่ซ้ำกัน - ข้อมูลที่ซ้ำกันอาจเกิดขึ้นเนื่องจากการส่งซ้ำการเข้าร่วมข้อมูลที่ไม่เหมาะสมหรือข้อผิดพลาดของผู้ใช้
เพื่อเพิ่มคุณภาพของข้อมูลและป้องกันข้อมูลที่สกปรกองค์กรควรรวมวิธีการเพื่อให้มั่นใจในความสมบูรณ์ความถูกต้องความสอดคล้องและความถูกต้องของข้อมูล