ข้อมูลสกปรก

ผู้เขียน: Randy Alexander
วันที่สร้าง: 27 เมษายน 2021
วันที่อัปเดต: 15 พฤษภาคม 2024
Anonim
อะไรคือข้อมูลที่สกปรก (Dirty Data)
วิดีโอ: อะไรคือข้อมูลที่สกปรก (Dirty Data)

เนื้อหา

คำจำกัดความ - Dirty Data หมายถึงอะไร

ข้อมูลสกปรกหมายถึงข้อมูลที่มีข้อมูลที่ผิดพลาด มันอาจจะใช้เมื่ออ้างถึงข้อมูลที่อยู่ในหน่วยความจำและยังไม่ได้โหลดลงในฐานข้อมูล การลบข้อมูลที่สกปรกทั้งหมดออกจากแหล่งข้อมูลนั้นเป็นไปไม่ได้หรือเป็นไปไม่ได้จริง


ข้อมูลต่อไปนี้ถือเป็นข้อมูลที่สกปรก:

  • ข้อมูลที่ทำให้เข้าใจผิด
  • ข้อมูลที่ซ้ำกัน
  • ข้อมูลไม่ถูกต้อง
  • ข้อมูลไม่ถูกต้อง
  • ข้อมูลที่ไม่รวม
  • ข้อมูลที่ละเมิดกฎทางธุรกิจ
  • ข้อมูลที่ไม่มีการจัดรูปแบบทั่วไป
  • ข้อมูลคั่นหรือสะกดผิดไม่ถูกต้อง

ข้อมูลเบื้องต้นเกี่ยวกับ Microsoft Azure และ Microsoft Cloud | ในคู่มือนี้คุณจะได้เรียนรู้ว่าการประมวลผลแบบคลาวด์คืออะไรและ Microsoft Azure สามารถช่วยคุณโยกย้ายและดำเนินธุรกิจจากคลาวด์ได้อย่างไร

Techopedia อธิบาย Dirty Data

นอกเหนือจากการป้อนข้อมูลที่ไม่ถูกต้องข้อมูลสกปรกสามารถสร้างขึ้นได้เนื่องจากวิธีการที่ไม่เหมาะสมในการจัดการข้อมูลและการจัดเก็บข้อมูล มีการอธิบายชนิดข้อมูลสกปรกบางอย่างด้านล่าง:

  • ข้อมูลไม่ถูกต้อง - เพื่อให้แน่ใจว่าข้อมูลนั้นถูกต้องหรือถูกต้องค่าที่ป้อนควรเป็นไปตามค่าที่ถูกต้องของฟิลด์ ตัวอย่างเช่นค่าที่ป้อนในฟิลด์เดือนควรมีค่าตั้งแต่ 1 ถึง 12 หรืออายุบุคคลต้องน้อยกว่า 130 ค่าความถูกต้องของข้อมูลอาจถูกบังคับใช้โดยทางโปรแกรมโดยใช้ตารางการค้นหาหรือตรวจสอบการแก้ไข
  • ข้อมูลไม่ถูกต้อง - เป็นไปได้ที่ค่าข้อมูลอาจถูกต้อง แต่ไม่ถูกต้อง ในบางครั้งมันเป็นประโยชน์ในการตรวจสอบกับไฟล์หรือเขตข้อมูลอื่น ๆ เพื่อค้นหาว่าค่าข้อมูลมีความถูกต้องตามการใช้งาน ยังคงความถูกต้องสามารถตรวจสอบได้โดยการตรวจสอบด้วยตนเองเท่านั้น
  • การละเมิดกฎธุรกิจ - ข้อมูลที่ละเมิดกฎธุรกิจเป็นข้อมูลสกปรกอีกประเภทหนึ่ง ตัวอย่างเช่นวันที่มีผลจะต้องมาก่อนวันหมดอายุ อีกตัวอย่างของการละเมิดกฎธุรกิจอาจเป็นผู้ป่วยประกันสุขภาพของ Medicare ที่ผู้ป่วยอาจยังอยู่ภายใต้อายุเกษียณและไม่ได้รับสิทธิ์ Medicare
  • ข้อมูลที่ไม่สอดคล้องกัน - ความซ้ำซ้อนของข้อมูลที่ไม่ได้ตรวจสอบนำไปสู่ความไม่สอดคล้องของข้อมูล แต่ละองค์กรได้รับผลกระทบด้วยข้อมูลที่ไม่สอดคล้องและซ้ำซ้อน โดยเฉพาะอย่างยิ่งกับข้อมูลลูกค้า
  • ข้อมูลไม่สมบูรณ์ - ข้อมูลที่มีค่าที่ขาดหายไปเป็นประเภทหลักของข้อมูลที่ไม่สมบูรณ์
  • ข้อมูลที่ซ้ำกัน - ข้อมูลที่ซ้ำกันอาจเกิดขึ้นเนื่องจากการส่งซ้ำการเข้าร่วมข้อมูลที่ไม่เหมาะสมหรือข้อผิดพลาดของผู้ใช้

เพื่อเพิ่มคุณภาพของข้อมูลและป้องกันข้อมูลที่สกปรกองค์กรควรรวมวิธีการเพื่อให้มั่นใจในความสมบูรณ์ความถูกต้องความสอดคล้องและความถูกต้องของข้อมูล