Datenqualität


Saubere Daten sind der Schlüssel für eine erfolgreiche Digitalisierung


Was ist Datenqualität?

Definition: Datenqualität ist die Bewertung von Datenbeständen hinsichtlich ihrer Eignung, einen bestimmten Zweck zu erfüllen. Als Kriterien gelten dabei die Korrektheit, die Relevanz und die Verlässlichkeit der Daten, sowie ihre Konsistenz und Verfügbarkeit auf verschiedenen Systemen.

Heute wird unternehmensweite Datenqualität als Produktionsfaktor und Teil des Unternehmenswerts betrachtet, welcher somit aktiv gemanagt werden kann und muss.


Darum ist Datenqualität entscheidend:

  • Der Gewinn des operativen Geschäfts geht durch schlechte Datenqualität verloren
  • Unternehmen mit hoher Datenqualität, haben ein wesentlich höheres Wachstum, als der Branchendurchschnitt
Mit Datenqualität digitale Prozesse beschleunigen, die Produktivität erhöhen und den Unternehmenserfolg steigern.


Jede Software ist nur so gut wie die zugrunde liegenden Daten!

Die digitale Transformation führt zu massiven prozessualen Veränderungen in der Geschäftswelt und wer sich nicht weiterentwickelt, der wird obsolet. Doch während sich e-Business-Anwendungen immer weiter verbessern, wird das grundlegende Problem der Datenqualität (Data Quality) oft vernachlässigt. Die intelligenteste Software (operative und analytische Systeme, z.B. CRM, BI) entfaltet ihr Potenzial erst bei hoher Datenqualität. Kein Wunder also, dass ein Großteil der Digitalisierungsprojekte nicht den gewünschten Erfolg bringen. Jede Software ist nur so gut wie die zugrunde liegenden Daten!

Die Digitale Transformation ermöglicht bessere Prozesse bezogen auf die Dimensionen

  • Kosten
  • Qualität
  • Flexibilität und
  • Geschwindigkeit
Schlechte Daten wirken sich negativ auf jede der vier Dimensionen aus und das bei jedem Prozess. Wer das Thema Data Quality angeht, schafft auf einen Schlag das Fundament für eine erfolgreiche unternehmensweite Digitalisierung (digitale Evolution).


Datenstrom (Big Data)

Im Schnitt verdoppelt sich die Menge an Daten alle 2 Jahre. Dieser gewaltig Datenstrom (Big Data) erhöht aber auch die Anforderungen an die IT-Systeme und damit auch an die Daten. Anders als es der Name vermuten lässt, sind Stammdaten permanenten Veränderungen unterworfen. Kunden wechseln unter anderem ihren Standort oder ihre Bankverbindung. Auch fehlerhafte Eingaben und Dubletten verfälschen den Datenbestand. In der Praxis bedeutet das direkte oder indirekte Kosten.


Datenqualitätskriterien

Erfahrungsgemäß kommen die aufgeführten Datenqualitätskriterien zur Anwendung:
  • Vollständigkeit
  • Eindeutigkeit
  • Korrektheit
  • Aktualität
  • Genauigkeit
  • Konsistenz
  • Redundanzfreiheit
  • Relevanz
  • Einheitlichkeit
  • Zuverlässigkeit
  • Verständlichkeit

Im Laufe der Zeit, kommen in einem iterativen Prozess, weitere Kriterien hinzugenommen.


In drei Schritten zu sauberen Daten

Beim Data Profiling werden die Daten in Bezug auf Inkonsistenzen, Fehler und Widersprüche in den Beständen analysiert. Aus den daraus gewonnenen Informationen können Maßnahmen zur Verbesserung der Datenqualität abgeleitet werden.

Im Teilprozess Data Cleansing (Datenbereinigung), werden die erkannten Probleme durch Anwendung verschiedener Algorithmen wie Datentypkonvertierungen, Dublettenerkennung oder Vervollständigung lückenhafter Daten direkt behoben.

Beim Monitoring werden die Daten vor der Speicherung in den operativen und analytischen Systemen überprüft. In bestimmten Zeitabständen wird der gesamte Bestand geprüft, um die einmal erreichte Datenqualität zu gewährleisten.



Bei der Digitalisierung der Prozesse spielt Datenqualität eine entscheidende Schlüsselrolle!




Zurück nach oben Top

© Ralf Bauer ICT-Solutions 2019