Auf dem Weg in die Digitalisierung sind zuverlässige Daten ein notwendiges Fundament. Dies entsteht nicht von selbst, sondern bedarf Investitionen in Manpower und Technologie. Der Schaden, der jedoch durch unstrukturierte, unvollständige, doppelte oder veraltete Daten entsteht, kommt Unternehmen noch teurer zu stehen.
Gartner bezifferte die Kosten schon vor ein paar Jahren auf mehrere Millionen US-Dollar. Andere Experten wie Thomas C. Redmann, in der community genannt „Data doc“, schätzen den Ausfall auf 15-25% des Unternehmensumsatzes.
Folgen schlechter Datenqualität
Jeder hat es schon erlebt:
- Die Suchergebnisse passen nicht zu dem, was ich angefragt habe.
- Schwere Vergleichbarkeit: Ich brauche einen neuen Staubsauger. Schaue ich mir die verschiedenen Modelle im Shop an, sind Produktinformationen in unterschiedlicher Fülle, Sprache und mit unterschiedlichen Maßeinheiten beschrieben.
- Recommendation Engine funktioniert nicht: Nachdem ich erfolgreich einen Staubsauger erstanden habe, werden mir in den nächsten Wochen anstelle von passendem Zubehör wie Staubsaugerbeutel weitere Staubsauger empfohlen. Ich bekomme sinnlose Cross-Selling-Produkte vorgeschlagen.
- Höhere Reklamationen und Retouren: Als mein Staubsauger zuhause eintrifft, lese ich in der Bedienungsanleitung, dass er für bestimmte Teppich-Arten nicht geeignet ist. Diese Information hätte ich eher gebraucht und schicke das Produkt zurück.
Mangelnde Produktdatenqualität hinterlässt nicht nur in der Kundeninteraktion negative Spuren. Um in den Google-Rankings oder bei Amazon zu einer gewissen Sichtbarkeit zu gelangen, sind hohe Qualitätsanforderungen gefragt.
Genauso führen veraltete, fehlerhafte oder unvollständige Kundendaten zu unnötigen Kosten durch Rückläufer, Reklamationen oder Retouren oder eben zu entgangenem Umsatz durch falsche Ansprache. Kundendatenqualität betrifft dabei schon lange nicht mehr nur die klassische Adresspflege, sondern das gesamte Wissen um den Kunden entlang der Customer Journey.
Was macht gute Datenqualität aus und was verhindert sie?
Um erste Erfolge in der Verbesserung der Datenqualität zu erreichen, gilt es auf folgende Kriterien zu achten:
- Vollständigkeit: Sind alle notwendigen Daten vorhanden? Welche Stammdaten und Produktattribute müssen ausgefüllt werden, damit mein Produkt im Shop oder auf dem Marktplatz live gehen kann?
- Korrektheit: Sind die Daten in der richtigen Sprache, ohne Rechtschreibfehler? Ändert beispielsweise ein Lieferant die Materialzusammensetzung, wer verändert die Produktbeschreibung?
- Aktualität: Insbesondere bei Kontaktdaten spielt die Aktualität eine hohe Rolle. Wie können Adressen, Vorlieben, demographische Kriterien von Kunden aktuell gehalten werden?
- Eindeutig: Existiert der Datensatz nur genau einmal?
- Konsistenz: Sind die Daten in sich schlüssig oder gibt es z.B. unterschiedliche Maßgrößen? Sind auf den unterschiedlichen Kanälen einheitliche Produktinformationen zu finden?
Je größer die Datenmengen, je höher die Anzahl der Datenquellen und je mehr Menschen damit arbeiten, desto anfälliger ist die Datenqualität und desto weniger funktioniert eine manuelle Datenpflege.
Drei Schritte zu mehr Datenqualität
- Zentrale Datenhaltung:
Datenqualität kann nur erreicht werden, wenn eine ganzheitliche Sicht auf die Datensätze ermöglicht wird. Das bedeutet nicht automatisch die Nutzung einer All-in-One-Lösung, sondern vielmehr eine Systemintegration, bei der ein Data Hub als Single Point of Truth die Daten aus den unterschiedlichen Systemen verbindet.
So stellt sich immer wieder die Frage, ob Produktdaten im Shop oder im ERP gepflegt werden sollen. Wenn es sich dann um 1 Mio Artikel handelt, dann ist eine PIM Software als zentrales System für Produkt Content sinnvoll. - Unternehmensstandards definieren:
Qualitätsstandards festlegen:
Welche Felder müssen befüllt sein, damit der Datensatz vollständig ist? Welche Anforderungen bestehen an die Bildqualität? An die Sprache und Textlängen?
Sinnvolle Strukturen festlegen:
Wie fein granular sollen Informationen angelegt werden? Wie sehen Attributsysteme und Tagging für unterschiedliche Empfänger aus?
Freigabeprozesse festlegen:
Wer darf welche Daten verändern? Wer definiert sinnvolle Workflows? - Manuelle Prozesse automatisieren:
Dubletten abgleichen:
Produkte mit derselben Artikelnummer, ein Kunde, der dasselbe Mailing doppelt bekommt, diese Fehler sind peinlich und ziehen viel Arbeit nach sich. Mit Hilfe eines intelligenten Suchmechanismus inclusive Fehlertoleranz lassen sich doppelte Datensätze schnell aufspüren.
Datenaustausch automatisieren:
Häufig werden Produktinformationen direkt von Hersteller übernommen oder müssen aus dem eigenen System in Marktplätze eingespeist werden. Manuelle Übertragung ist immer fehleranfälliger als eine direkte Schnittstelle mit einem Datenaustausch, der die einzelnen Informationen direkt in die passenden Felder mappt.
Rechtschreibprüfung oder falsche Formatierung:
Aus Textprogrammen ist man es gewöhnt, die Autokorrektur bei Rechtschreibfehlern. Genauso wichtig ist die Überprüfung der eingegebenen Standards an die Bildqualität oder an bestimmte Formatierungen.
Auch wenn Datenqualität schon seit Jahren auf der To-Do-Liste von Unternehmen steht, so gewinnt das Thema jetzt mit einem Digitalisierungs-Push durch Corona und einem rasanten Datenzuwachs immer mehr an Bedeutung. Es ist sozusagen eine Grundvoraussetzung für die Digitalisierung, für Künstliche Intelligenz und Automatisierung.