vem.experten

Big Data und Big Data Analytics

M. Sc. Wirtschaftsingenieur Pascal Böhm

Big Data beschreibt sehr große Datenmengen, die zu komplex sind, um sie manuell oder mit herkömmlichen Methoden auszuwerten. Dabei enthält das “Big” die fünf Dimensionen, auch 5V genannt:


- Volume: Datenumfang
- Veloctiy: Geschwindigkeit der Datengenerierung
- Variety: Herkunft aus verschiedenen Datenquellen
- Veracity: Datenechtheit
- Value: unternehmerischer Mehrwert


Um diese großen Datenmengen zu analysieren, wird das weit verbreitete CRISP-DM (Cross-Industry Standard Process DataMining) Modell angewandt. Dieses besteht aus sechs iterativ aufeinander aufbauenden Phasen:

1. Geschäftsverständnis
In dieser ersten Phase erfolgt die Festlegung des Datenanalyseziels und die Definition der Erfolgskriterien.

2. Datenerhebung
Die Datenerhebung dient der Sammlung von relevanten Daten in einer hohen Qualität. Diese Phase ist essentiell, da bessere Daten validere Ergebnisse liefern, als ein besserer Algorithmus mit im Vergleich dazu schlechteren Daten.

3. Datenvorbereitung
In dieser Phase ist der größte Aufwand zu erwarten, da hier die gesammelten Daten aufbereitet und bei Bedarf bereinigt werden. Letzeres ist erforderlich, da sich ein oder mehrere Prozesse während der Datenerhebung geändert haben könnten und die späteren Ergebnisse verfälschen würden.

4. Datenmodellierung
Die Datensätze aus der Datenvorbereitung werden mit geeigneten statistischen Methoden (z.B. mit der Software Minitab) modelliert. Arbeitsinhalte sind hierbei die Optimierung der Parameter sowie die Erstellung mehrer Modelle.

5. Ergebnisauswertung
Die entstandenen Modelle werden analysiert und die Ergebnisse bewertet. Daneben schließt ein Testverfahren aus, dass neben den offensichtlichen Daten keine prägenden oder ergebnisbeeinflussenden Parameter vergessen wurden. Bestehen z.B. die offensichtlichen Daten aus Temperatur und Druck, könnte daneben auch die Luftfeuchtigkeit Einfluss auf die Modelle nehmen.

6. Einsatz
Die gewonnenen Ergebnisse werden aufbereitet und dem Auftraggeber zur Entscheidung vorgelegt. Bei positiver Entscheidung erfolgt eine Umsetzung des Modells im operativen Betrieb, wobei ein kontinuierliches Monitoring der Daten und der Ergebnisqualität, aufgrund sich laufend ändernder Prozesse, im Anschluss unerlässlich sind. Erfolgsfaktoren eines Big Data-Projekts sind direkt zu Beginn eine genaue Definition des Ziels, eine genaue Analyse, ob mit der Big Data-Lösung ein unternehmerischer Mehrwert geschaffen werden kann und eine produktive Nutzbarmachung der Analyse-Ergebnisse.

Für die Phasen 1 bis 5 eignen sich die in einem Six Sigma-Seminar vermittelten Inhalte und statistischen Methoden. Ein entsprechendes Angebot finden Sie bei unserer Akademie.
Sprechen Sie uns gerne an!