Big Data

 

 

„Gott würfelt nicht“, hat Einstein einmal zum Thema Zufall geschrieben. „Und selbst, wenn Gott würfeln sollte – wir sind ihm auf der Spur.“ Das meinen zumindest die Apostel der Big-Data-Bewegung, die Daten Analysten, die Statistiker und Computerspezialisten.

 

Wenn Öl der Rohstoff des 20. Jahrhunderts war, dann sind Daten der Rohstoff des 21. Jahrhunderts, das Schmiermittel der digitalen Welt. Mit zwei wesentlichen Unterschieden: Im Gegensatz zu Öl sind Daten kein begrenztes Gut, sondern ihre Menge nimmt Augenblick für Augenblick exponentiell zu. Und Daten haben kein Preisschild, sie werden von den Menschen – auch von dir! – einfach durch ihr Dasein, ihr Verhalten, ihre Leben gratis erzeugt und zur  Verfügung gestellt.

 

Daten sind das neue Gold. Der Wettbewerb wird in Zukunft ganz entscheidend davon geprägt sein, wie jemand damit umgeht. Wem es gelingt, aus der Datenflut wertvolle Informationen herauszufiltern, schafft damit genauso einen Wert wie mit Grund und Boden, Gebäuden, Waren oder Geräten.

 

Alle 60 Sekunden (Stand Ende 2017) erledigen 3,9 Milliarden Internet-Nutzer folgende Aktionen:

            150.000.000           versendete E-Mails

                 3.000.000           abgerufene YouTube-Videos

                 2.500.000           Google-Suchanfragen

               21.000.000          WhatsApp-Botschaften

                     700.000          Status-Updates auf Facebook

                     600.000          Fotos auf Snapchat

                     350.000          Tweets

                     200.000          ausgegeben US-$ bei Amazon

                       40.000           Stunden gehörte Musik auf Spotify

 

Was ist „Big Data“ ?

 

Dazu zuerst einmal, was verstehen wir unter Daten? Unter Daten versteht man im Allgemeinen Angaben, (Zahlen-)Werte oder formulierbare Befunde, die durch Messung, Beobachtung u. a. gewonnen wurden. In der Umgangssprache versteht man darunter Gegebenheiten, Tatsachen, Ereignisse.

 

Beispiele: Inhalte von Lexika und Büchern

                 Die an einem Thermometer angezeigte Temperatur

Die (gemessene) Geschwindigkeit eines fahrenden Fahrzeugs

Antworten bei Umfragen, Volkszählungen – in Fragebögen

Ergebnisse von Experimenten in den Naturwissenschaften

Pressearchive von Zeitungsverlagen

Der Inhalt von Schriftstücken (z. B. Briefe, Notizen, Protokolle)

 

Aufbewahrt werden diese Daten in Form von:

 

·         Bits und Bytes,

zum Beispiel: bei der Speicherung auf Datenträgern wie Festplatten, USB-Sticks oder DVDs

·         bei der Übertragung über das Internet oder an das Smartfon

·         als Zeichenketten bzw. Texte in Textdateien

·         als Binärdateien (z. B. Maschinencode, Datenbankinhalt, digitale  Fotos, Tonaufnahmen oder Videos usw.)

·         im Internet unter der Bezeichnung „in der Cloud“

 

Als Big Data  bezeichnet Datenmengen, welche beispielsweise zu groß, zu komplex, zu schnelllebig oder zu schwach gegliedert oder strukturiert sind, um sie mit manuellen und herkömmlichen Methoden der Datenverarbeitung auszuwerten. Im deutschsprachigen Raum ist der traditionellere Begriff  Massendaten gebräuchlich.

 

In der Definition von Big Data bezieht sich das „Big“ auf die drei Dimensionen volume  (Umfang, Datenvolumen, bereits gemessen in der größten Einheit Yottabyte (YB) = 1024, eine 1 mit 24 Nullen), velocity  (Geschwindigkeit, mit der die Datenmengen generiert und transferiert werden, geschieht fast in Echtzeit) sowie variety  (Daten sind nicht gleich Daten. Sie kommen in unterschiedlichen Formen und Formaten, von unterschiedlichen Geräten und haben oft mehrere Bedeutungen).

 

Diese Flut von Daten ist aber nur verwertbar, wenn sie zu sinnvollen Informationen verarbeitet werden, die verständliche Erkenntnisse und Vorhersagen möglich machen. Der Schlüssel, um aus Daten Gold zumachen, liegt also nicht in den Daten selbst, sondern müssen erst zum Leben erweckt werden.

 

Dazu kennen wir folgende Phasen:

·         Aufnehmen der Daten (Messen, Aufschreiben, Speichern) und einfügen in ein lesbares, wiederverwertbares Format.

·         Einordnen der Daten, ihre Analyse oder Berechnung eines Ergebnisses durch einen Algorithmus.

·         Entscheidung, was damit geschehen soll, und

·         Ausführung eines Handlungsmusters.

 

Ein kleiner Exkurs zum Begriff „Algorithmus“.

Ein Algorithmus bezeichnet eine systematische, logische Regel oder Vorgehensweise, die zur Lösung eines vorliegenden Problems führt. Es sind manchmal einfache Formeln, oft allerdings auch etwas komplizierter und das muss man auf jeden Fall eigenständig lernen. Rechenvorschriften sind eine Untergruppe der Algorithmen. Sie beschreiben Handlungsanweisungen in der Mathematik bezüglich Zahlen. Andere Algorithmen-Untergruppen sind z. B. (Koch-)Rezepte, Gesetze, Verordnungen, Regeln, Verträge.

 

Einer der meistverwendeten Algorithmen unserer Zeit ist jene Formel, die Sergey Brin und Lawrence Page, damals Computer Studenten an der Stanford Universität, patentieren ließen. Die Geburtsurkunde von Google: die Suchmaschine nutzt die Strukturen, die in Hypertexten (Links zu anderen Seiten) vorhanden sind, um eine qualifizierte Rangordnung von Webpages zu ermöglichen. Je mehr Links auf eine Seite verweisen, desto höher ist das Gewicht dieser Seite und desto besser ist der Effekt. Das wiederum produziert in kürzester Zeit Ergebnisse von Seiten, die am öftesten abgefragt worden sind und daher auch in deiner Suche wahrscheinlich zielführend sein werden.

 

Eine kleine Denkanleitung für dich einfach dazwischen gestreut: Das Problem ist nicht die schier unheimliche Datenmenge sondern liegt in der routinierten Auseinandersetzung mit diesen Daten und ihrer cleveren Ergänzung durch andere Daten, die derzeit noch nicht erhoben oder genutzt werden. Es fehlen die Ideen und Konzepte der richtigen Fragestellungen und deshalb werden auch keine Antworten gefunden. Erkenne irgendwo in deiner Umgebung ein Problem, dessen Lösung für die Menschen einen Vorteil, eine Verbesserung, eine Erleichterung bringt. Überlege dir, wie du mit Daten, die sicher irgendwo erhältlich sind (oft gratis), zu einer Lösung kommen kannst. Vermarkte, verkaufe diese Lösungsidee und du hast die Lizenz zum Gelddrucken.

 

Damit du dir aber ganz konkret vorstellen kannst, hier einige Beispiele, wo die Technologie der Big Data schon heute in deinem Leben eine gewaltige Rolle spielt:

            Überwachungskameras (öffentliche, private, bei Institutionen)

            Mautstellen (Autobahnen, Tunnel, Bergstrecken)

            Skiliftsysteme (ziemlich alle großen Skigebiete nicht nur in Europa)

            Navigationsgeräte (in Autos, per GPS am Handy)

            Fitnessgeräte (Pulsar, Fitbit, Runtastic, zeichnen deine Daten auf)

            WLAN-Waagen (Gewicht, Body Mass Index)

            Haushaltsgeräte (Internet der Dinge)

            Selbstfahrende Autos (Google Street View, Google Earth)

            Kaufvorgänge per Kreditkarte

            Flugbuchungen im Internet

            Krankenhausanmeldungen

            Amazon-, Ebay-, iTunes-Kaufdaten

            Kundenkartenprogramme (Tankkarten, Flugmeilensammler, Friend´s)

            Gewinnspiele

            Online-Umfragen

            Facebook

            Twitter

            Apps und Social-Media-Kanäle

            Bewegungs- und Ortungsdaten per Smartphone

            Applikationen und Sensoren im Smartphone

            Suchmaschinen (Google, Mozilla, Firefox)

            Instagram (Fotosammlung)

            Alexa, Siri (interaktive Kommunikationsprogramme)

 

Für ein praktisches Beispiel, bei dem Big Data über menschliche Intuition gesiegt hat, ist der Film „Moneyball – Die Kunst zu gewinnen“ mit Brad Pit (2011). Sieh ihn dir an !

 

Konkretes Beispiel: Die österreichische Bäckerei Ströck berechnet durch Algorithmen tägliche Absatzmenge für seine Bäckereien. Stückgenaue Vorhersagen für die zu erwartenden Verkäufe in den Filialen, unter anderem in Abhängigkeit vom Tageswetter, sind das Ziel des Prognosemodells. Mit diesem Wissen kann Ströck die richtige Anzahl an unterschiedlichen Gebäcksorten vorrätig haben, Retourlieferungen verringern und Kosten sparen.

 

Die Big Data Revolution hat bereits begonnen. Du kannst wenig dagegen unternehmen, weil die Dinge im Hintergrund laufen und du kaum aktiv beeinflussen kannst, was mit den vielen Daten und vor allem mit deinen eigenen Daten geschieht. Was du aber machen kannst, ist dir ein besseres Wissen über die Regeln, den Umgang mit den Chancen und Gefahren dieser Revolution anzueignen. Sonst würfelt nicht mehr Gott sondern nur mehr eine Handvoll Datenkonzerne wie Google, Amazon, Facebook, Twitter und andere.