Alles sind Daten!

Christian Luebbe @ EPFL Extension School · 12 Minuten

Daten finden sich überall, und mit allen können wir und KI lernen.

In unserem letzten Artikel (Daten in verschiedenen Formen) haben wir begonnen, verschiedene Datentypen und ihre Anwendungen näher zu betrachten. Insbesondere haben wir Ihnen die folgenden gängigen Datenformate vorgestellt:

    1. Tabellarische Daten
    2. Text
    3. Audiodaten
    4. Visuelle Daten – Bilder und Videos

Aber die Welt der Daten hat noch viel mehr zu bieten! Schliesslich erzeugt jede Information, die wir erfassen, Daten. In diesem Artikel stellen wir Ihnen fünf weitere Datentypen vor und diskutieren Bereiche, in denen sie zur Entwicklung von KI-Systemen verwendet werden:

    5. Zeitliche Sequenzen und Zeitreihen
    6. Netzwerke
    7. Geo- und Standortdaten
    8. Emotionen
    9. Das Internet der Dinge

Am Ende dieses Artikels werden Sie dann hoffentlich der Ankündigung des Titels dieses Artikels zustimmen: Alles sind Daten!

Jeder Gegenstand um uns herum enthält unzählige Informationen. Sofern man diese Informationen aufzeichnen und erfassen kann, kann man sie in Daten verwandeln.

Und weiter geht’s!

5. Zeitliche Daten und Zeitreihen

Wir sollten uns darüber im Klaren sein, dass Informationen selten statisch sind. Sie neigen dazu, sich im Laufe der Zeit zu verändern und weiterzuentwickeln. Wir können diese Veränderungen der uns zur Verfügung stehenden Informationen erfassen in dem wir auch die zeitlichen Aspekte von Daten registrieren. Die Audio- und Videodaten, die wir im letzten Artikel diskutiert haben sind ein exzellentes Beispiel dafür.

Aber es gibt noch viel mehr Anwendungen von zeitlichen Daten. Beispielsweise können wir die Uhrzeit und das Datum eines bestimmten Wettermusters oder die Dauer des Regens im Vergleich zur Dauer des Sonnenscheins aufzeichnen. Indem wir diese Aufzeichnungen in regelmässigen Abständen vornehmen, können wir Veränderungen wie Temperaturschwankungen über einen bestimmten Zeitraum wie beispielsweise eine Woche nachverfolgen.

Zeitliche Daten ermöglichen uns die Einordnung von Daten in chronologische Sequenzen. Diese Sequenzen werden Zeitreihen genannt und helfen uns, Einblicke in historische Ereignisse zu gewinnen. Wir können Zeitreihen zur sequenziellen Aufzeichnung all der Datentypen verwenden, die wir in diesem und dem letzten Artikel besprechen. Zum Beispiel, generieren unsere Social-Media-Posts eine Zeitreihe von kurzen Texten.

Wir können auch messen, wie viel Zeit zwischen einzelnen Ereignissen vergeht. Oder wiederkehrende Ereignisse, wie Geburten, aufzeichnen und ermitteln, zu welchen Zeiten sie häufiger vorkommen. So können wir quantitative Veränderungen beobachten und langfristige Trends und saisonale Muster entdecken, beziehungsweise entsprechend berücksichtigen. Für Geologinnen und Geologen ist es zum Beispiel nicht ungewöhnlich, eine Zeitreihe von Millionen von Jahren zu betrachten.

Die Erfassung solcher Daten hilft Unternehmen bei der Planung. Wann werden die meisten Flüge gebucht? Wann wird besonders viel Glacé gekauft? Aus der Vergangenheit zu lernen hilft uns, für die Zukunft zu planen und die Zeiten von erhöhter Nachfrage für bestimmte Güter und Dienstleistungen zu kennen, ermöglicht es uns, aus diesen Informationen Profit zu schlagen.

Detaillierte Analysen zeitlicher Daten können uns helfen, Zusammenhänge zwischen Ursache und Wirkung zu erkennen und die Genauigkeit unserer Prognosen weiter zu erhöhen. In vielen Situationen des realen Lebens finden wir jedoch eine Vielzahl unterschiedlicher Einflüsse und Faktoren vor, die auf höchst komplexe Weise miteinander interagieren.

Ein Flugzeug verwendet Millionen beweglicher Einzelkomponenten und eine Vielzahl elektronischer Systeme, die alle in Wechselwirkung zueinander stehen, um das Flugzeug in der Luft und auf Kurs zu halten. Es mag nahezu unmöglich erscheinen, Strukturen und Beziehungen innerhalb solch verworrener zeitlicher Daten zu erkennen, um damit mögliche Störfälle rechtzeitig vorhersagen zu können. Die enorme Rechenkapazität von KI-Technologien ermöglicht glücklicherweise die Beobachtung von Mustern in komplexen Systemen, die ein Mensch niemals erkennen könnte.

Wie Menschen lernen auch KI-Systeme aus vergangenen Ereignissen und extrahieren Muster und Erkenntnisse, um daraus Voraussagen über die Zukunft zu treffen. Zeitreihen spielen in vielen verschiedenen Bereichen eine wichtige Rolle, weshalb diese KI-Technologie über ein riesiges Potenzial verfügt. Unternehmen können mit Hilfe von ihnen Prognosen zu Budgets und Beständen sowie zu erwarteten Umsätzen und Kosten erstellen. Zeitreihen helfen ihnen auch, ihre treuesten Kunden zu identifizieren, genauso wie diejenigen, die möglicherweise bald abwandern.

Menschen erfassen nur einen sehr kleinen Teil von zeitlichen Daten. Der Grossteil wird automatisch von Sensoren und Maschinen erkannt und verarbeitet – und zwar aus dem einfachen Grund, dass sie viel besser dazu geeignet sind, eine Vielzahl von Signalen über längere Zeiträume hinweg zuverlässig aufzuzeichnen.

Ein gutes Beispiel hierfür sind Fitness-Tracker und Smartwatches. Sie verfügen über Beschleunigungsmesser, die Bewegungsänderungen messen. Mit der kleinen Hilfe von KI können sie zum Beispiel erkennen, ob Sie gerade gehen, laufen oder Rad fahren. Autoversicherungen verfolgen einen ähnlichen Ansatz, wenn sie den Fahrstil ihrer Kunden erfassen und kategorisieren, um damit ihre Prämien entsprechend anpassen zu können.

Zeitreihen können auch bei der Identifizierung von betrügerischen Aktivitäten helfen. Bereits heute setzen Banken und Kreditkartenunternehmen KI-Technologien ein, um verdächtige Muster zu erkennen. Aber auch bei Online-Gaming-Plattformen, bei denen die Nutzer oft mehrere Käufe innerhalb relativ kurzer Zeit tätigen können, besteht Betrugspotenzial. AI verwendet Zeitreihen, um festzustellen, welche dieser Transaktionen in den Rahmen des normalen Verhaltens fallen und welche verdächtig aussehen.

6. Netzwerke

Ein Netzwerk besteht aus einer Menge miteinander verbundener Punkte in der den Verbindungen zwischen diesen Punkten unterschiedliche Relevanz zugeordnet werden kann. Die Punkte in einem Netzwerk, auch Knoten genannt, können dabei für unzählige Dinge stehen. Von Menschen und Orten bis hin zu abstrakteren Dingen wie Wörtern, solange zwischen den Punkten eine Beziehung besteht, können sie in einem Netzwerk dargestellt werden.

Im Falle eines öffentlichen Verkehrsnetzes sind die verschiedenen Bus- und Tramhaltestellen die Knoten. Die Verbindung zwischen diesen Knotenpunkten sind die Bus- und Tramlinien. Die Relevanz der jeweiligen Verbindungen könnte daran gemessen werden, wie viele Busse oder Trams stündlich fahren oder wie weit es bis zur nächsten Haltestelle entlang der Linie ist.

Es ist einfach, solche Netzwerke in einem einzigen Diagramm darzustellen: