Wie misst man Datenqualität?
Datenqualität wird entlang definierter Dimensionen gemessen: Vollständigkeit (fehlen Werte?), Korrektheit (stimmen die Werte?), Aktualität (wie alt sind die Daten?), Konsistenz (widersprechen sich Quellen?) und Eindeutigkeit (gibt es Duplikate?).
In der Praxis werden diese Dimensionen durch automatisierte Qualitätschecks in den Data Pipelines überwacht. Jeder Datensatz durchläuft bei der Ingestion eine Validierung. Der Data Catalog dokumentiert die Qualitätsmetriken je Datenquelle. Data Stewards überprüfen regelmäßig die Ergebnisse und eskalieren bei Abweichungen. So entsteht ein kontinuierlicher Qualitätsprozess statt einmaliger Bereinigungsaktionen.

Bereit wenn Sie es sind
Zukunft beginnt, wenn menschliche Intelligenz künstliche Intelligenz entwickelt. Der erste Schritt ist nur ein Klick.
Zukunft beginnt, wenn menschliche Intelligenz künstliche Intelligenz entwickelt. Der erste Schritt ist nur ein Klick.