Data Intelligence. Manfred Kulmitzer
fünf definierten Datensegmente der obersten Ebene im HDD
Ein Datensegment beschreibt im «Haus der Daten & Dokumente» einen abgegrenzten Bereich von elektronischen Daten und Dokumenten mit ähnlichem Inhalt oder ähnlicher Struktur. Datensegmente können über verschiedenen Ebenen beliebig tief detailliert werden, wobei die Ebene (0) dabei immer die oberste Ebene der Datensegmente bezeichnet. Also können die folgenden fünf Datensegmente auf der obersten Ebene im HDD vollständig zugeordnet werden.
Das Datensegment Geschäftsintelligenz umfasst alle, intern oder extern verfügbaren, teilweise auch gestreamten dispositiven Daten und Dokumente über alle Datenarten hinweg, welche unter Einsatz von Data Analysis und oft unter Zuhilfenahme von Künstlicher Intelligenz, für die Gewinnung von neuen oder „versteckten“ Erkenntnissen sowie neuem Wissen und der Erzeugung dazugehöriger, neuer Daten nutzbar sind.
Die datengetriebene Entscheidungsfindung, unter anderem mit dem Einsatz von Prescriptive Analytics für automatisierte Entscheide, ist ein wesentlicher Anwendungsfall.
Das Datensegment Geschäftsinformationen umfasst alle, intern oder extern verfügbaren dispositiven Daten und teilweise Dokumente über alle Datenarten hinweg, welche unter Einsatz von Data Analytics und Data Mining, teilweise unter Zuhilfenahme von Machine Learning, für die Gewinnung von neuen oder bisher nicht bekannten Erkenntnissen sowie Wissen dienen.
Einen Schwerpunkt bildet dabei die datengestützte Entscheidungsfindung, primär im Rahmen von Business Intelligence. Mögliche Beispiele sind Auswertungen, Kennzahlen sowie aufbereitete oder berechnete Daten.
Das Datensegment Metainformationen umfasst alle zusätzlichen, strukturierten Metadaten über die eigentlichen elektronischen Daten und digitalen Dokumente in den Geschäftsprozessen. Diese Metadaten reichern alle anderen, in dieser Aufstellung angeführten Datensegmente in Form von fachlichen und technischen Metadaten mit zusätzlichen Eigenschaften an, um die gewünschten Datenanalysen bei fachlichen Fragestellungen oder technischen Aufgaben zu erweitern.
Das Datensegment Geschäftsdaten umfasst all jene operativen Daten, welche die Geschäftsprozesse eines Unternehmens abbilden. Dies sind also die Daten (beispielsweise Transaktionsdaten, Produktdaten oder Vertriebsdaten), welche während der Durchführung eines Geschäftsprozesses erzeugt, modifiziert, geschrieben und gelesen werden. Die dabei beteiligten IT-Applikationen benötigen meist zusätzliche Daten aus dem Datensegment „Basisdaten“, um eine möglichst effiziente Durchführung der Geschäftsprozesse zu ermöglichen.
Das Datensegment Basisdaten umfasst jene grundlegenden operativen Daten, welche als Basis für die Abbildung von Geschäftsprozessen benötigt werden - beispielsweise Kundendaten, Adressdaten, Referenzdaten und fachliche Schlüssel wie beispielsweise Artikelnummern. Dabei kennzeichnen sich Basisdaten dadurch aus, dass diese meist für das gesamte Unternehmen gelten und bereichsübergreifend in mehreren Geschäftsprozessen verwendet werden.
Alles klar? Dann gehen wir mal ins Detail…
Die verfeinerten Datensegmente der Ebene 1 im HDD
Die Erweiterung kann als neue Ebene 1 von den zuvor definierten, fünf (Haupt-)Datensegmenten aus der Ebene 0 im HDD beschrieben werden:
Die verfeinerten Datensegmente im HDD
Das Datensegment Auswertungen umfasst alle Daten aus den Auswertungen der neu gewonnenen Erkenntnisse von Geschäftsinformationen, beispielsweise Analysen, Trends, Vorhersagen oder sogar Handlungsanweisungen. Diese Daten kann ein Fachanwender ohne spezielle fachliche Kenntnisse abrufen.
Das Datensegment Analysen umfasst all jene Daten, welche benötigt werden, um neue Erkenntnisse, die mit zusätzlichen Analysen aus den Geschäftsinformationen im Rahmen von Data Science und oft mit Hilfe von Künstlicher Intelligenz gewonnen werden, zu erstellen. Für die Nutzung dieser Daten und die Erstellung von Analysen erfordert es spezielle fachliche Kenntnisse.
Das Datensegment Aufbereitete Daten umfasst all jene Daten, welche benötigt werden, um Erkenntnisse (also Informationen) für alle Geschäftseinheiten eines Unternehmens zu gewinnen. Diese werden meistens im Rahmen von Business Intelligence erzeugt, unter anderem sind dies:
• zusammengeführte Daten (also Daten, die aus unterschiedlichen Datenquellen generiert werden)
• aggregierte und gefilterte Daten (Aggregationen zur Detailreduktion oder Filterungen, beispielsweise die Eingrenzung auf Vertriebswege oder Kundengruppen)
• aufbereitete (beispielsweise anonymisierte oder speziell formatierte Daten)
• berechnete Daten von internen Stellen (beispielsweise Transformationen oder Zwischenergebnisse aus ETL-Strecke und Rechenkernen)
• berechnete Daten von externen Stellen (also Daten, die von externen Parteien berechnet, aggregiert oder gefiltert und somit bereits aufbereitet zur Verfügung gestellt werden) und umfasst auch extern erstellte Auswertungen und Analysen
Das Datensegment Kennzahlen umfasst alle im Rahmen einer dispositiven Sicht erzeugten Kennzahlen. Diese sollen für ein Unternehmen einheitlich definiert und bereichsübergreifend verwendet werden.
Das Datensegment Dispositive Basisdaten umfasst all jene Daten, welche für die Auswertungen und Analysen aus einer dispositiven Sicht benötigt werden:
• eine redundante Kopie der Rohdaten aus der operativen Datenwelt (meist aus Gründen der Performance und zur Entkopplung der IT-Systeme) und diese Kopie beinhaltet zumindest die Basisdaten, die Geschäftsdaten und externe, operative Rohdaten
• externe, dispositive Rohdaten (beispielsweise statistische Kennzahlen oder standortbezogene Daten)
• dispositive Struktur- und Dimensionsdaten (beispielsweise alternative Konzernstrukturen)
Das Datensegment KI Daten umfasst alle erforderlichen Trainings-, Input- und Ergebnisdaten für die KI-Modelle sowie die KI-Modelle selbst, welche im Rahmen der Geschäftstätigkeit entwickelt und bereitgestellt werden.
Das Datensegment Stammdaten umfasst die mitunter wichtigsten Daten eines Unternehmens, welche meistens über mehrere Geschäftsprozesse hinweg genutzt werden. Dazu gehören beispielsweise:
• Kundendaten, Personal & Organisation, Finanzmarktdaten
• interne Stammdaten (zum Beispiel Immobilien-Daten, Büroflächen, Telefonbuch, Zimmer-Nummern, IT-Hardware Inventar, IT System Inventar)
• externe Stammdaten (beispielsweise Geo-Daten, postalische Adressen, Bank- und Börsenfeiertage, UID für Unternehmen)
Das Datensegment Referenzdaten umfasst die Inventare von Schlüsseln und anderen Referenzwerten, welche über mehrere