Von 0 & 1 zum A & O: Was Daten wirklich Wert sind

So gelingt der Einsatz von KI 

in Unternehmen – Teil 3

27. October 2023
Sebastian Bluhm
Von 0 & 1 zum A & O: Was Daten wirklich Wert sind

Ja, Sie haben sich grundsätzlich für den Einsatz von künstlicher Intelligenz im Unternehmen entschieden. Und ja, Sie haben bereits einen konkreten Anwendungsfall ins Auge gefasst, der zielgenau auf Ihre Unternehmensstrategie abgestimmt ist. Damit sind die zwei ersten großen Schritte getan. Nun geht es darum, eine realistische Einschätzung über die Umsetzbarkeit Ihrer Wunsch-KI zu erhalten. Welche Ressourcen benötige ich für den erfolgreichen Einsatz? Welches Know-how brauche ich für die Implementierung? Welche (Folge-) Kosten kommen auf mich zu?
 

In meinem letzten Newsletter versuchte ich zu zeigen, dass nur unter Berücksichtigung der erforderlichen Datenverfügbarkeit, der technischen Umsetzbarkeit und der Wirtschaftlichkeit der erfolgreiche, d.h. nutz- und gewinnbringende Einsatz von KI im Unternehmen gelingt.
 

In diesem Beitrag möchte ich auf einen dieser Faktoren genauer eingehen: die Datenverfügbarkeit. Was sind Daten eigentlich? Was unterscheidet „gute“ von „schlechten“ Daten? Wie können Sie welche beschaffen? Und was macht sie so wertvoll – für Ihr KI-Projekt und für Ihr Unternehmen?

Wer KI will, braucht Daten.

Ich muss oft an Niki Lauda denken. Nach seinem Erfolgsrezept befragt, gab der dreifache Formel-1-Weltmeister zur Antwort: Er habe einfach als Erster erkannt, dass nicht der beste Fahrer Rennen gewinnt, sondern das schnellste Auto.

Ein bestechend klarer Satz, der für mich die grundlegenden Faktoren jeder erfolgreichen Unternehmung benennt: Momentum, Erkenntnis durch Perspektivwechsel und Ausbau relevanter Ressourcen. Sie erinnern sich: Im ersten Beitrag dieser Reihe haben wir für die heutige Relevanz von künstlicher Intelligenz für Ihr Unternehmen (Momentum) plädiert. Im zweiten Beitrag haben wir verschiedene Ansätze identifiziert, wie Sie die passende KI-Anwendung für Ihr Unternehmen finden (Perspektivwechsel). Hier soll es nun – Sie ahnen es – um die entscheidenden Ressourcen für Ihr KI-Modell gehen: Ihre Daten. Genauer: wie Sie die Verfügbarkeit der für Sie relevanten Daten prüfen, sichern und ausbauen können.

Was sind Daten eigentlich?

Um im Bild zu bleiben: Daten sind der Treibstoff für Ihren KI-Motor. Die Basis von allen digitalen Prozessen. Der Rohstoff, aus dem KI überhaupt erst Informationen bündeln, Berechnungen vornehmen und Prozesse optimieren kann. Daten sind nicht bloß Nullen und Einsen, sie sind das A und O für Ihre KI – und für Ihr Geschäftsmodell.

Die gute Nachricht zuerst: Jedes Unternehmen, auch Ihres, verfügt über massenhaft Daten. Je älter das Unternehmen, desto mehr Daten sind potenziell vorhanden. Von Akten, Kontaktadressen, Support E-Mails, Support Telefonate, Anleitungen, Produktinformationen über interne Wikis, Bilder, Videos bis zu Finanz-, Börsen- und Wetterberichte – alles Datenquellen, die ausgewertet und fürs Unternehmen nutzbar gemacht werden können. Aber wie?

Verschiedene Daten für KI

Wie Daten wertvoll werden

Für sich allein genommen, isoliert, haben Daten keine Bedeutung und damit keinen Wert. Stellen Sie sich eine Ansammlung von Zahlen und Buchstaben auf einem Blatt Papier vor. Bloße Zeichen. Erst die Organisation und Lesbarkeit nach einem allgemeinen Muster, einer Syntax, lassen Sie erkennen, dass es sich z. B. um eine Telefonliste samt Telefonnummern, Anrufzeit- und Datum handelt. Aus Zeichen werden Daten.

Stellen Sie diese Daten nun in den Kontext anderer Daten Ihrer unternehmerischen Tätigkeit – etwa häufig gestellter Fragen bei Ihrer Service-Hotline –, so erhalten Sie neue Einsichten über diese Tätigkeitsfelder. Zum Beispiel, wer wann welche Fragen an Ihre Hotline richtet. Aus der Verknüpfung von Daten und Kontext entstehen Informationen.

Wie aus Daten Unternehmenswert wird

Integrieren Sie diese Informationen in das bestehende Netzwerk Ihres Unternehmens, etwa der Personalabteilung, und verknüpfen sie wiederum mit anderen Informationen, sagen wir aus Produktanleitungen, Wissensdatenbanken etc., können neue Erkenntnisse z. B. für die Personal-Einsatzplanung und Qualifikation der Hotline-Mitarbeitenden abgeleitet werden. Aus Information wird Wissen.

Agiert Ihr Unternehmen nun einige Zeit auf Basis dieses „Wissens“, sammelt es dadurch „Erfahrungen“. Auf Grundlage dieser Erfahrungen – also der Sammlung und Zusammenführung von Daten über einen längeren Zeitraum – lassen sich Vorhersagen für die Zukunft bezüglich Recruiting, Einsatzplanung und Einkauf ableiten. Die Daten wurden maximal effizient genutzt.

Ein Beispiel aus der Praxis

Wie genau KI durch die Zusammenführung von Daten Vorhersagen treffen und dadurch Prozesse optimieren kann, zeigt folgender Case. Für eine Versicherung haben wir eine KI-basierte Kostenprognose entwickelt, die Service-Mitarbeitenden eine schnelle und sichere Entscheidungsgrundlage im Falle einer Schadensmeldung ermöglicht.

Kfz Reparaturkostenprognose mit KI

Dazu analysierten wir zunächst die gesammelten Daten des Unternehmens, ihren “Erfahrungsschatz”, nämlich die Schadensmeldungen der vergangenen zehn Jahre. Auf dieser Grundlage kombinierten wir das Kfz-Expertenwissen unseres Kunden mit den individuellen Steuerungsregeln der Versicherung. Das von uns entwickelte KI-Modell konnte auf Basis dieser Datenverknüpfung den Service-Mitarbeitenden schnellere und präzisere Kostenprognosen bereitstellen.

Das Ergebnis: optimiertes Schadenmanagement, Reduzierung der Schadenskosten, zufriedenere Kund:innen und Mitarbeitende.

Gute Daten, schlechte Daten

Klingt einfach, ist es aber nicht. KI kann diese Verknüpfung und Zusammenführung von Daten in Sekundenbruchteilen leisten, ja. Damit die Verknüpfung aber auch zutreffende Vorhersagen hervorbringt, brauchen Sie nicht nur die entsprechende Datenmenge. Auch die Daten-Qualität muss gegeben sein, um Fehlschlüsse innerhalb der vielen Herleitungs-Prozesse zu vermeiden. Die Ergebnisse einer KI sind immer nur so gut wie die Daten, aus denen sie gelernt hat. 

Grundsätzlich gilt: Je strukturierter und fehlerfreier die Daten, desto einfacher und zutreffender die automatische Verarbeitung und Auswertung durch KI. Als Faustformel gilt daher folgende Minimalanforderung: Die gewünschte Datenqualität ist dann erreicht, wenn ein anvisierter Use Case mit den verfügbaren Daten fehlerfrei realisiert werden kann.

Darauf sollten Sie achten

Bevor eine KI handlungsfähig ist bzw. verlässliche Ergebnisse liefert, muss also ein solides, sauberes Datenfundament aufgebaut werden oder zumindest in absehbarer Zukunft verfügbar sein. Wie schaffen Sie das? 

Dies sind die Top 5 in der Hit-List der zu beachtenden Daten-Aspekte:

1. Unvollständige Daten:

Ungenaue Zahlenangaben, fehlende Datenfelder, begrenzte Zeitausschnitte und Auflösungen der Daten können die Qualität des KI-Trainings beeinträchtigen. Prüfen Sie also, ob alle nötigen Datenpunkte zur Umsetzung Ihres KI-Modells vorhanden oder zumindest potenziell verfügbar sind.

2. Falsche, verzerrte oder mehrdeutige Daten:

Nicht-repräsentative oder inkorrekte Datensätze verzerren die Ergebnisse von KI-Modellen. Schiefe, unausgewogene Datenverhältnisse können zu ethisch inakzeptablen und/oder faktisch unbegründeten Schlüssen führen, die z. B. Diskriminierung bestimmter Personengruppen zur Folge haben.

3. Datenmengen:

Zu wenige Daten können das KI Training ineffektiv machen, während zu viele Daten unhandlich werden, zu Skalierungsproblemen führen und unverhältnismäßige Rechenkapazitäten benötigen. Zur Orientierung: Je nach Anwendung sind etwa 10.000 bis 500.000 Datensätze eine hinreichende Größenordnung. Ist die nötige Balance nicht gegeben, muss nachgebessert werden, etwa durch neues Auslesen oder synthetische Generierung.

4. Datenschutz und Datensicherheit:

Um die Einhaltung von Regulierungen und Compliance zu gewährleisten, ist besondere Sorgfalt beim Umgang mit sensiblen, personenbezogenen und anderweitig schützenswerten Daten erforderlich. Wo bspw. Bankdaten, Personendaten von Mitarbeitern, Vermögensinformationen oder Informationen über Krankheitsbilder verwendet werden, ist Know-how in Sachen Regulatorik und IT-Sicherheit gefragt.

5. Nicht-standardisierte Daten:

Daten aus nicht einheitlichen Quellen oder in proprietären Formaten erfordern komplexere Verfahren füs Auslesen und zur Vereinheitlichung. Zum Beispiel Microsoft Word Dokumente, Fließtexte aus PDF-Dateien, Dateiformate spezieller Branchensoftware oder AutoCAD-Zeichnung. Das kann mitunter mehr als nur Überstunden für Ihre Data Engineers und Entwickler:innen bedeuten.

Daten als Unternehmenswert

Bitte, verstehen Sie mich richtig: Dies sind keine Gründe, den Kopf in den Sand zu stecken und sich nicht mit Daten zu beschäftigen. Im Gegenteil. Damit die Einführung von KI in Ihrem Unternehmen erfolgreich gelingt, ist es meiner Meinung nach unerlässlich, diese Punkte im Vorfeld zu berücksichtigen. Sie alle sind Teil einer realistischen Ressourcen-, Kosten- und Nutzen-Kalkulation. Erst wenn Sie das Feld der Datenverfügbarkeit überblicken, können Sie das volle Potenzial Ihres KI-Modells und Ihres Unternehmens entfalten.

Sammeln, Heben oder Beschaffen

Denn: Die Welt der für Sie relevanten Daten endet nicht an Ihren Unternehmensgrenzen. Es gibt Mittel und Wege fehlende oder neue Datensätze zu beschaffen. Sie können externe Datensätze kaufen (der EU Data Act eröffnet da völlig neue Möglichkeiten) oder sie synthetisch generieren. Durch Datenanalyse können sie vorhandene Datenschätze heben. Und durch neue Produkte neue Daten sammeln. Manche Daten haben sie längst, ohne es zu wissen, andere werden Ihnen in Zukunft zugänglich sein. Wieder andere sind einfach nicht belast- oder beschaffbar. Auch darüber sollten Sie Klarheit haben. 

Der springende Punkt: Spätestens wenn Sie sich mit KI befassen, sollten Sie wissen, dass Daten Ihre wichtigste Ressource sind. Und sich entsprechend mit der Verfügbarkeit, Beschaffenheit und Beschaffbarkeit Ihrer Daten auseinandersetzen. Denken Sie an Niki Lauda.

Manche sagen, Daten wären das neue Gold oder das neue Öl – ich halte nichts von diesen Vergleichen. Gold und Öl sind natürliche, begrenzte Rohstoffe und (soweit ich weiß) nicht reproduzierbar. Wer Öl nutzt, verbrennt und verbraucht es. Wer Gold besitzt, nutzt es nicht, es lagert vor sich hin. Beider Wert bemisst sich an der jeweiligen Knappheit. Je weniger es gibt, desto mehr steigt ihr nomineller Wert, desto besser für Ihre Besitzer:innen.
Mit Daten verhält es sich grundlegend anders. Je mehr Daten ein Unternehmen besitzt, desto wertvoller sind sie. Und es werden immer mehr. 

Deshalb sind Daten für Unternehmen langfristig auch wertvoller als die KI-Algorithmen, die sie interpretieren. Ein KI-Modell kann unzeitgemäß von neuen Ansätzen und Technologien überholt werden. Die einmal gesammelten Daten aber bleiben – ein immer kraftvollerer Rohstoff für immer komplexere Modelle.

Die Asse im Ärmel des Mittelstands

Und darin besteht auch das ungeheure Potenzial für den Mittelstand. Mit der jahrzehntelangen Erfahrung am Markt haben mittelständische Unternehmen einen entscheidenden Wettbewerbsvorteil gegenüber den Start-ups, die sie herausfordern: ihren Datenschatz. Es ist diese „Erfahrung“ – übersetzt in Datensätze – die jedem Start-up per definitionem fehlt; die sie aber auf Teufel komm raus brauchen, um ihre Modelle zu trainieren und ihre Cases zu validieren. Dieses Fachwissen „erfahrener“ Branchen-Oldies kann keine KI abbilden, die nur auf Basis eines begrenzten Auszugs des Internets trainiert wurde. Unternehmen haben damit eine ungeheuer wertvolle Ressource, mit der sie eigene KI-Modelle trainieren und entscheidende Wettbewerbsvorsprünge sichern können.

Ich bin überzeugt, der Mittelstand hat derzeit die besten Karten auf der Hand. Nun kommt es darauf an, sie richtig zu spielen. Das Momentum ist auf Ihrer Seite. Innerhalb einer Branche können oft nur die Ersten Ihr Datenblatt richtig ausreizen und ihren Vorsprung strategisch nutzen – etwa indem Sie die aus eigenen Daten entwickelten KI-Modelle als lizenzierte Software auch anderen Unternehmen verschiedenster Branchen verkaufen. Momentum … Niki … Sie wissen, was ich meine …

Personal-Ressourcen

Sie sehen: Welche Tür Sie mit Ihrem Unternehmen auch öffnen wollen – Daten sind der Schlüssel dazu. Aber auch wenn wir allseits von ihnen umgeben sind, fallen Daten nicht vom Himmel. Daten müssen gespeichert, analysiert, aufbereitet, gepflegt und verarbeitet werden. Dazu brauchen Sie Know-how und entsprechende personelle Ressourcen.

Niki Lauda hatte es da vergleichsweise leicht: Er setzte verstärkt auf Konstrukteure, Ingenieure und Mechaniker – eben alle, die ihm ein schnelles Auto bauen konnten. Für die Aufstellung Ihres Datenteams kommt es darauf an, je nach KI-Anforderung und Projektphase die richtigen Spezialist:innen und Disziplinen an Bord zu haben – Data Scientists, Data Analysts, Data Engineers, Entwickler:innen, Consultants oder Projektmanager. Wie auch immer Ihre Strategie aussieht, stellen Sie in jedem Fall sicher, dass Sie Ihre wertvollen Asse in gute Hände geben.

Was steckt in Ihren Daten?

Zum Schluss nochmal die guten Nachrichten: Ja, auch Sie besitzen massenhaft Daten! Aber kennen Sie auch deren Wert? Hätten Sie Gold im Keller, jede Wette, Sie hätten es längst analysiert, gezählt, katalogisiert und gesichert. Datenschätze aber liegen bis heute unvermessen und ungenutzt in den angestaubten Datenbanken vieler Unternehmen brach. Das kann und wird nicht lange gutgehen. 

Spätestens wenn der erste Niki Lauda ihrer Branche auftaucht, werden diese Unternehmen auf die hinteren Ränge verwiesen. Warten Sie nicht, bis es soweit ist. Nutzen Sie Ihr gewaltiges Datenpotenzial und bringen Sie Ihr Unternehmen an die Pole Position. Sonst fahren andere voran.

Unser Team im Daten Analyse Sprint

Damit Sie wissen, auf welchem Datenschatz Sie sitzen, bieten wir bei PLAN D eine praktische Lösung an: Innerhalb von zehn Tagen nehmen unsere Data Scientists eine gezielte Analyse und Auswertung Ihrer Datensätze vor. Ob es dabei um Prozessoptimierung, Einhaltung von Datenschutzrichtlinien (etwa Anonymisierung sensibler Daten) oder die maximale Ausschöpfung bestehender Datenwerte geht – wir bereiten Ihre Daten so auf, dass Sie damit arbeiten können. Schnell, sicher und gründlich.

Sie wollen mehr erfahren?