Data Intelligence. Manfred Kulmitzer
hat sich der Mensch und die gesamte Gesellschaft strukturell und kulturell jeweils neu anpassen müssen.»
Somit bestimmen heute die elektronischen Daten im Rahmen von Data Science auch die Arbeitsweise jener (automatisierten) Werkzeuge, mit denen sie verarbeitet und analysiert wurden. Die schiere Fülle an verfügbaren elektronischen Daten in Form von Big Data führt daher zu neuen gesellschaftlichen Kommunikationsformen, einer rasanten Verbreitung von Wissen sowie datengetriebenen Prozessen und der Entwicklung völlig neue, datenzentrischer Geschäftsmodelle.
Seit der Erfindung des ersten iPhone durch Apple im Jahr 2007 treiben verschiedene technologische Megatrends - wie Big Data, Cloud [31], Plattformen für soziale Medien, Künstliche Intelligenz und Data Science - die Digitalisierung und sowie die Erzeugung und Verarbeitung von elektronischen Daten massiv und immer rascher werdend voran.
Der digitale Wandel bedeutet, dass nicht nur neue, innovative Lösungen für komplett neue Problemstellungen gefunden werden müssen, sondern ebenfalls neue oder verbesserte Lösungen für bestehende Aufgaben, die vorherige Gesellschaften bereits erfolgreich gelöst haben.
Ein gutes Beispiel dafür stellt den technischen Übergang von Schallplatten zu Audio-CDs und dann von Audio-CDs zu Musik-Streaming-Diensten dar. Zu all diesen Zeitpunkten mussten innovative Menschen bereits vorhandene und funktionierende, technische Lösungen für eine bestehende Aufgabe - in diesem Fall „Musik hören“ - adaptieren oder neu entwickeln.
Es handelt sich beim digitalen Wandel - und bei der Digitalisierung - nicht nur um eine rein technologische Adaption, sondern um einen Paradigmenwechsel für die Menschen und damit die Gesellschaft. Ich sehe den digitalen Wandel nicht als rein technologisches Phänomen, sondern will diesen als gesellschaftliche Chance begreifen und beschreibe daher in diesem Buch die dafür notwendigen intellektuellen, kulturellen und emotionalen Transformationen.
3.1 Ein feiner, aber wichtiger Unterschied
Umgangssprachlich wird leider oft zwischen „Daten“ und „Informationen“ keinerlei Unterschied gemacht und die Begriffe Fakten oder Daten sowie Daten oder Informationen oder Wissen werden beliebig miteinander vermischt. Im alltäglichen Gebrauch, beispielsweise in Tageszeitungen oder sozialen Medien, wird der Begriff „Information“ gerne für die Darstellung von Meinungen oder „Wissen“ genutzt.
Das Wort „Fakten“ wird in diesem Zusammenhang ebenfalls gerne genutzt, jedoch hat dieser Begriff in der Informationstechnologie eine klare, festgelegte Bedeutung für die Repräsentation von einfachen, digitalen Inhalten als die kleinste, sinnvoll speicherbare Einheit auf Computersystemen. Im Daten- und Informationsmanagement muss es aber für diese Begriffe eine klare Unterscheidung und Definition geben, was vor allem im Rahmen der später beschriebenen Datenbereitstellung eine wichtige Rolle spielt. Für mich ist es in diesem Buch daher essenziell, die Abhängigkeiten zwischen Fakten, Daten und Informationen darzustellen und die Grundbegriffe konkret zu beschreiben:
Zusammenhänge von Fakten, Daten, Informationen und Wissen
Um Daten überhaupt elektronisch nutzen zu können, müssen zuerst die dazugehörigen Fakten auf einem Speichermedium abgelegt, das heisst elektronisch gespeichert werden. In der Regel ist dies eine Tabelle mit einer oder mehreren Spalten, die meistens in einer Datenbank definiert und gespeichert werden. Jede Zelle in einer Spalte steht dabei für einen bestimmten Fakt und die ganze Spalte für ein Set dieser Fakten.
Durch die dazugehörigen Spaltenüberschriften (den Labels) wird den Fakten (also den Spalten) eine Bedeutung zugeordnet, was diese zu Daten macht. Beispielsweise würde man einen vollständigen Namen mit drei Spalten in einer Tabelle namens „Vollständige Namen“ definieren: Die erste Spalte mit dem Label „Anrede“, eine zweite Spalte mit dem Label „Vorname“ und die dritte Spalte mit dem Label „Nachname“.
Dann können die dazugehörigen Zellen der Spalten jeweils zeilenweise gefüllt werden, beispielsweise mit „Herr“ und „Manfred“ und „Kulmitzer“. Man hätte in der ersten Zeile dieser Tabelle meinen vollständigen Namen in drei Spalten als ein Datum abgelegt und dieses Datum nennt man „Datensatz“ in der Informationstechnologie.
Hingegen dienen Informationen als Grundlage für eine Entscheidung und stellen jene Erkenntnisse dar, die sich aus der Interpretation von Daten oder aus der Kombination von unterschiedlichen Daten ergeben. Die Abfragen dafür erfolgen meist in einer leicht verständlichen Abfrage-Sprache - oft kommt hier eine Structured Query Language aka SQL zur Anwendung - und können natürlich sehr kompliziert sein, was im Alltag mit umfangreichen Datensammlungen öfter der Fall ist.
Im oben beschriebenen Beispiel könnte man die Tabelle „Vollständige Namen“ auf eine bestimmte Eigenschaft durchsuchen, beispielsweise nach „Vorname = Manfred“. Als Information würde man dann i) entweder alle Zeilen angezeigt bekommen oder ii) die Anzahl von Zeilen erhalten, welche in der Spalte „Vorname“ den Eintrag „Manfred“ haben.
Als Resultat ergeben sich aus dieser simplen Anfrage zumindest zwei Informationen, die man entsprechend auswerten kann. Um Informationen nutzen zu können, sind die folgenden zwei Fragen zu beantworten: „Welche Daten liegen heute wo in welcher Form?“ und „Wie sollen diese Daten von wem genutzt werden?“
«Menschen lernen bis auf wenige Ausnahmen nicht durch Belehrung, sondern - wenn überhaupt - aus eigenen Erfahrungen.»
Als Wissen wird üblicherweise ein für Personen oder Unternehmen verfügbarer Bestand von Fakten, Theorien und Regeln verstanden, die sich durch den höchstmöglichen Grad an Gewissheit auszeichnen, so dass von ihrer Gültigkeit bzw. Wahrheit ausgegangen wird. Unternehmenswissen beziehungsweise dessen Speicherung gilt als Unternehmensgut, analog dazu gilt das Wissen einer Gesellschaft als Kulturgut [27].
In meinem Buch beziehe ich mich meist auf Unternehmen, deshalb vereinfache ich hier das speziellere „Unternehmenswissen“ zum allgemeinen Grundbegriff „Wissen“. Nachstehend zeige ich die Definitionen und Beschreibungen dieser wichtigen Grundbegriffe im Kontext vom Daten- und Informationsmanagement auf, welche ebenfalls im Glossar nachzulesen sind.
Meine Definition von Fakten
Im Daten- und Informationsmanagement repräsentieren Fakten einfache, digitale Inhalte ohne Zuordnung einer Bedeutung. Der Inhalt wird dazu meist als Ziffern, Zeichen, Zeichenketten oder ähnliches kodiert und deren Aufbau folgt definierten Regeln, das heisst einer festgelegten Syntax. Fakten können in verschiedenen Erscheinungsformen bzw. Medien vorliegen und lassen sich zum Zweck der elektronischen Datenverarbeitung als Zeichensätze kodieren und speichern.
1. Beispiel: In einer Tabelle stellt ein Fakt genau eine Zelle dar und eine Anzahl von gleichen Fakten genau eine Spalte.
2. Beispiel: Ein Fakt kann die Zahl „1967“ (wobei hier nicht klar ist, ob diese Zahl beispielsweise ein Geburtsdatum oder eine Postleitzahl darstellen soll) sowie die Zeichenfolge „Grad Celsius“ oder „Stefan“ repräsentieren.
Meine Definition von Daten
Im Daten- und Informationsmanagement bestehen Daten aus einer, für Computer bearbeitbaren und lesbaren Kombination von Fakten mit einer spezifischen Bedeutung (auch „Label“ genannt), in der Regel aus der Kombination von zwei Fakten mit deren Bedeutung. Daten können in strukturierte, semi-strukturierte und unstrukturierte Datenarten unterteilt und entsprechend ihrer Ausprägung unterschiedlich kodiert und gespeichert werden.
Daten entstehen im Verlauf der Geschäftstätigkeit (beispielsweise die Erfassung von Kundendaten und Aufträgen, die Abwicklung von Aufträgen, die Produktion und Lieferung von Produkten) eines Unternehmens und dienen dem Nachweis derselben.
Überdies entstehen Daten ebenfalls durch die Digitalisierung von bestimmten analogen Inhalten, beispielsweise entsteht durch den Scan eines Fotos eine entsprechende elektronische Datei des Fotos