Daten in verschiedenen Formen

Christian Luebbe @ EPFL Extension School · 16 Minuten

Daten gibt es in vielen Formaten. Wie kann KI mit allen umgehen?

Dank unserer Sinne können wir beobachten, was um uns herum geschieht und Informationen über uns und unsere Umwelt sammeln. Wir verwenden auch Sensoren und Geräte, um solche und andere Informationen zu erfassen. Diese Informationen helfen uns, Wissen zu erlangen und neue Fähigkeiten zu erlernen. Wir sind in der Lage, Situationen zu bewerten und unsere angeborene Logik und Argumentationsfähigkeit hilft uns, Entscheidungen zu treffen. Sollte ich besser links oder rechts abbiegen? Schaffe ich es über die Pfütze zu springen? Wo sollte ich am besten die Geburtstagsgeschenke für die Kinder verstecken?

Wann immer wir Informationen erfassen, erstellen wir Daten. In unserem Artikel Die Grundbausteine der KI wurde die Bedeutung von Daten bei der Entwicklung von KI-Systemen bereits hervorgehoben. Wir Menschen benötigen Informationen um zu lernen und Entscheidungen treffen zu können. Und KI-Systeme benötigen dafür Daten. Der Gründer von Dell Technologies, Michael Dell, umschrieb es wie folgt: “Künstliche Intelligenz ist das Raumschiff und Daten sind der Treibstoff.

Aber was genau sind Daten? Und gibt es verschiedene Arten von Daten?

Nehmen wir diese Website als ein Beispiel – sie besteht aus Daten. Der Text, den Sie gerade lesen, vermittelt uns Informationen durch Sprache. Die Bilder übermitteln durch Farben und Formen visuelle Informationen. Der HTML-Code, der Ihrem Gerät mitteilt, wie diese Website angezeigt werden soll, besteht ebenfalls aus Daten. Es ist sehr wahrscheinlich, dass Ihr Datenanbieter gerade die Grösse der übermittelten Daten misst und Ihnen diese womöglich in Rechnung stellt.

Oder betrachten wir das unten stehende Bild. Es zeigt die Art von Daten, die wir von oder über Alltagsgegenstände sammeln können. Wir können Farben und Formen sehen oder Grösse, Gewicht und Temperatur messen. Wir können auch andere Aspekte wie Sprache, Modelltyp oder Ablaufdatum erfassen. Und heutzutage sammeln einige Gegenstände selbst Daten für oder über uns. Sie können unseren Surf- und Einkaufsverhalten erfassen, unsere Bilder und Lieblingslieder speichern und unsere Bewegungen und Aktivitäten verfolgen. Wie Sie sehen können, gibt es eine grosse Vielfalt an Informationen, die gesammelt werden können - und all das ergibt eine Menge Daten.

Daten gibt es in vielen verschiedenen Formaten: Text, Bilder, Audio usw. Jedes Format vermittelt auf seine eigene Weise Informationen, daher wählen wir unsere Formate abhängig von der Art der jeweiligen Aufgabe aus.

Wenn wir beispielsweise auf unseren Urlaubsfotos gerne die unterschiedlichen Schweizer Berge identifizieren wollen, ist die Verwendung von Bilddaten im Vergleich zu verbalen Beschreibungen der Berge die naheliegende Option. Ebenso ist die Erkennung eines klassischen Komponisten durch eine Audioaufnahme wahrscheinlich einfacher als anhand eines Notenblattes.

Was werden wir entdecken

Wir werden uns die verschiedenen Arten von Daten ansehen und fragen, was für Erkenntnisse Menschen und KI aus ihnen gewinnen können. Wir werden uns auch mit der Vielfalt und Komplexität von Daten auseinandersetzen. Das Ziel besteht darin, zu untersuchen, wie Menschen diese Arten von Daten verwenden. Dadurch hoffen wir besser zu verstehen, was KI aus derartigen Daten lernen kann und was wir von den KI-Systemen erwarten können. Darüber hinaus werden wir auch verschiedene KI-Anwendungen vorstellen und zeigen, was bereits heute möglich ist, und was in Zukunft alltäglich sein könnte. All dies wird noch deutlicher machen, warum Daten heutzutage zu einem so kostbaren Gut geworden sind.

Bevor wir näher auf all diese Aspekte eingehen, sollten wir uns ins Gedächtnis rufen, dass Menschen in allen möglichen Alltagssituationen regelmässig Schwierigkeiten haben und ständig Fehler machen. Uns dessen bewusst zu sein, kann uns helfen zu verstehen, warum auch KI manchmal versagt. Ebenso kann es uns helfen, einige der beeindruckenden Erfolge von KI besser zu schätzen zu wissen.

Aufgrund der Fülle von verschiedenen Datentypen, haben wir das Thema in zwei Hälften aufgeteilt. In diesem Artikel besprechen wir die wohl bekanntesten Datenformate:

    1. Tabellarische Daten
    2. Text
    3. Audiodaten
    4. Visuelle Daten – Bilder und Videos

Im nächsten Artikel (Alles sind Daten!) werden wir etwas weniger bekannte Datentypen ansprechen:

    5. Zeitliche Sequenzen und Zeitreihen
    6. Netzwerke
    7. Geo- und Standortdaten
    8. Emotionen
    9. Das Internet der Dinge

Sind Sie bereit? Dann lassen Sie uns loslegen!

1. Tabellarische Daten

Was kommt Ihnen in den Sinn, wenn Sie an Daten denken? Die meisten Menschen denken zunächst an Tabellen oder Listen mit Zahlen und Eigenschaften. Im Grunde genommen denken sie an Datentabellen.

In der Schule zählten Daten aus Tabellen zu Ihrem Alltag. Zum Beispiel in Form Ihres Stundenplans, in Form von Multiplikationstabellen oder als Vokabellisten.

Id Alter (Jahre) Grösse (cm) Gewicht (kg) Haarfarbe Sportlich Geschlecht
1 16 174.3 58.6 Braun Ja Weiblich
2 25 166 64.3 Blond Nein Männlich
3 2 88.8 11.9 Schwarz Nein Weiblich
4 61 175.8 72 Weiss Ja Männlich
5

Tabellen zählen zu den am weitesten verbreiteten Datenformaten, weshalb sie zu den ersten Dingen zählen, die uns einfallen, wenn wir über den Begriff «Daten» nachdenken. Der Hauptaspekt von tabellarischen Daten ist, dass sie sowohl visuell als auch konzeptionell strukturiert sind.

Wir erfassen für jedes in einer Tabelle aufgeführte Beispiel die gleichen Merkmale oder Informationen – z. B. Grösse, Gewicht, Augenfarbe usw. Jedes Merkmal verfügt über eine eigene vertikale Spalte; zusätzlich werden alle relevanten Informationen zu jeder einzelnen Person in einer horizontalen Zeile erfasst. Auf diese Weise sind die Daten leicht verständlich und analysierbar. Auch die maschinelle Verarbeitung von Informationen wird dadurch vereinfacht.

Der unten stehenden Zugfahrplan ist allgemein bekanntes Alltagsbeispiel für tabellarische Daten und wie wir sie nutzen. Die Informationen zu jedem Zug werden in jeweils einer Zeile angegeben und jeder Spalte ist jeweils eine andere Information zu entnehmen: Abfahrtszeit, Zugnummer, Zielort und Bahnsteig. Anhand der Spalten ist es leicht, seine Suche nach verschiedenen Kriterien einzugrenzen. Der nächste Zug nach Genf fährt beispielsweise um 8.08 Uhr von Gleis 6 und der nächste Zug auf Gleis 5 fährt zum Genfer Flughafen.

Train time table

Ein Fahrplan des Lausanner Hauptbahnhofs mit den Abfahrtszeiten der Züge (Quelle SBB).

Schon seit Tausenden von Jahren zeichnen die Menschen auf diese Weise Daten auf und wir tun es noch heute. Zugfahrpläne, Finanzkonten, Playlists, Fussball-Ligatabellen haben alle eins gemein: Sie stellen Daten auf strukturierte Weise in tabellarischer Form dar.

Der wichtigste Aspekt von tabellarischen Daten im Bezug auf KI ist ihre klare und konsistente Struktur, die eine einfache und systematische Verarbeitung ermöglicht. Aus diesem Grund wandeln die meisten KI-Systeme andere Datentypen vor der Verarbeitung in ein tabellarisches oder rasterförmiges Format um. Verkaufsprognosen, Kundendaten, Filmempfehlungen oder Daten zur Betrugserkennung können alle in Tabellenform gespeichert werden.

2. Text

Auch bei Text handelt es sich um eine sehr verbreitete Form von Daten. Seit vielen Jahrtausenden verwenden die Menschen verschiedenste Schriftsysteme zur Aufzeichnung von Informationen. Im alten Ägypten wurde auf Papyrus geschrieben. Einige Jahrtausende später, im Mittelalter, revolutioniert die Erfindung des Buchdruck die Verbreitung von Text. Heute speichern wir unsere Schriftstücke in digitalen Dateien wie Word-Dokumenten ab.

Marius Miribel

Aufzeichnungeen des Soldaten Marius Miribel, 1914.

Ob Papyrus oder PC, das Prinzip ist immer noch dasselbe. Im Laufe der Geschichte konnten wir durch das Schreiben detaillierte Aufzeichnungen über jeden Aspekt unseres Lebens und unserer Umgebung festhalten. Aufgrund ihrer Vielseitigkeit und ihrer Vielfalt ist die Sprache ein hervorragendes Mittel zur Erfassung von Informationen. Dafür reicht es schon, sich all die verschiedenen Möglichkeiten vor Augen zu führen, in denen wir mit Sprache völlig alltägliche Vorkommnisse beschreiben.

Die Komplexität der Sprache

Aber im Gegensatz zu Tabellen ist Text eine unstrukturierte Form, um Informationen zu erfassen. Ja, uns stehen Wörter, Sätze, Paragraphen und Kapitel zur Verfügung. Aber es gibt kein einheitliches Muster oder Regelwerk, das uns sagt, wie Informationen in der Sprache kodiert sind und wo sie in einem bestimmten Text zu finden sind. Manchmal stehen uns zusätzliche Strukturen zur Verfügung, etwa in Form eines Inhaltsverzeichnisses oder eines Index. Zeitungen erleichtern unsere Suche, indem sie Texte nach Themen sortieren – z. B. wichtige Nachrichten auf der Vorderseite und Sport auf der Rückseite. Beim Lesen der einzelnen Artikel werden wir aber immer noch mit einem mehr oder weniger unstrukturierten Text konfrontiert.

Sprache ist ein komplexes menschliches Konstrukt. Als Kinder lernen wir, Kombinationen aus gesprochenen Wörtern mit Bedeutungen und Konzepten zu verbinden. Dabei lernen wir auch ganz automatisch die Abstufungen und Feinheiten in der Art und Weise, wie wir Sprache verwenden. Wenn unsere Eltern uns zum Beispiel bitten, die Milch auf den Tisch zu stellen, lernen wir, dass damit eigentlich der Behälter gemeint ist, in dem die Milch sich befindet.

Sprache kann sehr präzise sein, aber allzu oft ist sie mehrdeutig und lässt Raum für Interpretationen. Manchmal müssen wir «zwischen den Zeilen lesen». Und Sprache drückt Meinungen, Zweifel, Gefühle und Emotionen aus, die alle ganz subjektiv interpretierbar sind. Einem Text alle Informationen mit absoluter Genauigkeit zu entnehmen stellt selbst für Menschen eine Herausforderung dar.

Wie KI Text verarbeitet

Text ist die gebräuchlichste Art der Informationsvermittlung. Der Umfang und die Komplexität der im Text enthaltenen Informationen, der Mangel an einer einheitlichen Struktur, die Kontextabhängigkeit sowie die mögliche Mehrdeutigkeit von Aussagen erschweren die Interpretation von Textdaten für KI erheblich.

Geschäftsdaten, medizinische Diagnosen, E-Mails, Social-Media-Posts – sie alle werden in Form von Text übermittelt. Die Vorherrschaft von Text hat zur Folge, dass Textanalyse und natürliche Sprachverarbeitung (auf Englisch “Natural Language Processing” oder kurz NLP) heute zu den wichtigsten Forschungsfeldern der modernen KI zählen.

Wenn wir schreiben, erleichtern uns diese Technologien bereits heute das Leben durch das automatische Überprüfen unserer Texte auf Rechtschreibung und Grammatik, sowie durch die Vorhersage der nächsten Wörter in unserem Satz. KI ist auch dazu in der Lage, von uns geschriebene Texte automatisch in eine andere Sprache zu übersetzen, die wir womöglich nicht einmal sprechen. In letzter Zeit sind von KI-Systemen übersetzte Texte immer besser und fehlerfreier geworden.

Schon jetzt werden KI-Systeme im Kundenservice eingesetzt. Dank natürlicher Sprachverarbeitung werden Themen, Namen und Orte automatisch identifiziert, bevor schriftlichen Anfragen an die zuständigen Abteilungen weitergeleitet werden. Andere Anfragen werden von Chatbots bearbeitet, die in der Lage sind, mit den Benutzern zu kommunizieren und einige Anfragen sogar ohne menschliches Zutun zu lösen.

Unternehmen nutzen KI auch zur Stimmungsanalyse von Kundenbewertungen, um dadurch besser zu verstehen, wie die Menschen über ihre Produkte und Dienstleistungen denken. Dank KI-Technologien können all diese Aufgaben automatisiert, in grossem Massstab und in Echtzeit durchgeführt werden.

3. Audio Daten

Audio data

Visualisierung der Audioaufnahme von jemandem, der sagt: "Willkommen bei That's AI" - Die Visualisierung wird als Audio-Spektrogramm bezeichnet und zeigt die Zeit auf der horizontalen Achse und die Tonfrequenz auf der vertikalen Achse an.

Alle Probleme, mit denen wir uns bei Texten konfrontiert sehen, treten bei Audiodaten in verschärfter Form auf. Auch bei Audiodaten müssen wir mit der Komplexität und Mehrdeutigkeit von Sprache zurechtkommen; nun kommen aber auch noch erschwerende Elemente wie unterschiedliche Akzente, Tonlagen und Emotionen sowie die Lautstärke und Geschwindigkeit, mit der gesprochen wird, hinzu. Wir Menschen sind in der Lage damit umzugehen. Wir haben sogar gelernt, andere Menschen an ihrer Stimme zu erkennen und zu unterscheiden und können an der Art und Weise, wie eine Person spricht, Rückschlüsse auf ihre Gefühle ziehen.

Wenn wir uns hingegen in einer lauten Umgebung befinden oder uns mit jemandem unterhalten, der einen starken Akzent oder einen anderen Dialekt hat, wird die mündliche Kommunikation schnell schwierig. Noch schwieriger wird es, wenn wir versuchen, in einer Fremdsprache zu kommunizieren. Damit KI verbale Befehle oder Sprache verstehen oder eine Person anhand des Klangs ihrer Stimme identifizieren kann, muss sie genau dieselben Herausforderungen bewältigen.

Wie AI mit Audiodaten arbeitet

Ein Bereich, in dem KI-Technologien für Audiodaten genutzt werden, ist die automatische Spracherkennung, auch bekannt als Sprachtranskription oder Speech-to-Text. Diese Technologie, ermöglicht es Ihnen Ihrem Smartphone freihändig Befehle zu geben. Aber sie gibt Menschen wie Ärzten auch die Möglichkeit, wertvolle Zeit zu sparen, indem sie Notizen einfach diktieren, anstatt sie aufschreiben zu müssen. Ein weiteres Anwendungsgebiet sind automatisch generierte Untertitel für Videos und Fernsehsendungen, auch wenn diese gelegentlich noch Fehler enthalten können. Die Technologie ist vielleicht noch nicht immer perfekt, sie verbessert sich aber ständig.

Spracherkennung mittels KI ist auch für intelligente, digitale Assistenten wie Alexa und Siri erforderlich. Sie ermöglichen es uns, unsere Geräte ohne physische Interaktion zu steuern, und im Laufe der Zeit lernen sie, wie sie unsere Stimme am besten verstehen, unsere Fragen beantworten und auf unsere Befehle reagieren können.

KI kann auch in die entgegengesetzte Richtung verwendet werden, indem Text in Sprache umgewandelt wird. Diese Technologie verleiht Ihren digitalen Assistenten eine Stimme, wenn sie auf Ihre Anfragen antworten. Ausserdem kann Ihr Webbrowser Ihnen Artikel laut vorlesen. Seit 2019 ist es möglich, eine automatisierte Sprachübersetzung direkt von einer Sprache in eine andere durchzuführen, ohne dabei erst den Text generieren zu müssen. Bald schon könnte es möglich sein, dass sich die Übersetzung Ihre Stimme hat, inklusive Ihres Akzents.

Es ist wichtig zu erwähnen, dass Audiodaten nicht bloss auf Sprache beschränkt sind. Audiodaten umfassen auch Klänge wie Musik oder Geräusche von Tieren Düsentriebwerken und tickenden Uhren. Denken Sie einen Moment über Musik nach. Menschen können Genres unterscheiden, wenn sie Musik hören. Wir können den Unterschied zwischen Klassik und Heavy Metal erkennen. Wir können auch problemlos zwischen Blasinstrumenten, Klavier- und Gitarrenklängen unterscheiden. KI ist in der Lage, das Genre und die Stimmung von Songs zuerkennen und somit Kennzeichnung und Empfehlung von Liedern zu automatisieren. Die gesamte Musik auf Plattformen wie Spotify wird auf diese Weise gefiltert und in Kategorien eingeordnet.

Es gibt auch andere Dinge, die wir allein durch Zuhören und die Anwendung unseres Fachwissens herausfinden können. Ein erfahrener Automechaniker kann beispielsweise an Motorgeräuschen erkennen, ob etwas mit dem Motor nicht in Ordnung ist, auch wenn es keine äusseren Anzeichen für einen möglichen Schaden geben mag. Die KI lernt, dasselbe zu tun, indem sie die Klangprofile mechanischer Komponenten analysiert und so Fehlfunktionen innerhalb einer Maschine erkennen kann, ohne dass diese dafür geöffnet werden muss.

4. Visuelle Daten – Bilder und Videos

Das Sehen ist unser am stärksten entwickelter Sinn, und wir verlassen uns fast vollständig darauf, wenn wir uns in unserer Umgebung orientieren. Das menschliche Gehirn ist in der Lage, visuelle Informationen mit unglaublicher Geschwindigkeit und in immenser Menge zu verarbeiten. Mit einem einzigen Blick können wir Formen, Farben, Schattierungen und Texturen erkennen und diese dann kombinieren, um Gegenstände und Personen zu identifizieren, ohne auch nur einen Augenblick zu zögern. Wir sind auch in der Lage aus kleinsten Details von Gesichtsausdrücken, eine Menge Informationen über den zugrunde liegenden emotionalen Zustand einer Person herauszulesen. Visuelle Daten erfassen eine grosse Menge und Vielfalt von Informationen. Ganz gemäss dem bekannten Sprichwort: “Ein Bild sagt mehr als tausend Worte.”

Image

Wenn wir etwas länger hinsehen, sind wir in der Lage, die Bewegung von Gegenständen und Personen zu erkennen, Mimik und Handgesten zu deuten und Veränderungen wahrzunehmen. Unser Gehirn kann alle diese Informationen zu einem logischen Zusammenhang der Ereignisse, die sich vor uns abspielen, verknüpfen.

Wir können auch Vorhersagen darüber treffen, was als nächstes passieren könnte, und entsprechend handeln. Das ist etwas, das wir ständig tun, wenn wir mit dem Auto oder Fahrrad unterwegs sind. Wir nehmen die Geschwindigkeit und Richtung der Fahrzeuge um uns herum wahr und ziehen sie in Betracht, um vorherzusehen, was diese als nächstes tun könnten. Wenn Sie zum Beispiel denken, dass das Auto zu Ihrer Linken könnte jeden Moment auf Ihre Spur wechseln, bremsen Sie ab, um einen möglichen Unfall zu vermeiden. Erkennung, Analyse, Bewertung und Prognose erfolgen im menschlichen Gehirn innerhalb von Sekundenbruchteilen.

Wie AI mit visuellen Daten arbeitet

Für viele KI-Technologien spielt die visuelle Erkennung eine wichtige Rolle und es besteht eine Vielzahl von Anwendungsmöglichkeiten in verschiedenen Branchen. Lassen Sie uns noch einmal kurz auf die Digitalisierung von Texten zu sprechen kommen. Daten, die auf physische Weise aufgezeichnet werden, werden als «analog» bezeichnet und eine grosse Menge an Textdaten existiert ausschliesslich in gedruckter oder handschriftlicher Form. Um diese Daten durchsuchbar zu machen, müssen sie digitalisiert werden.

Überlegen Sie, wie lange es dauern würde, alle analogen Texte der Welt von Menschen manuell in eine Maschine eingeben zu lassen. Glücklicherweise lässt sich dieser Prozess mit einer KI-Technologie namens Optische Zeichenerkennung (auf Englisch “Optical Character Recognition” oder kurz OCR) oder maschinelles Lesen automatisieren. Insbesondere ist diese Technologie inzwischen viel schneller und deutlich weniger fehleranfällig als es bei der menschlichen Transkription der Fall ist.

Diese Art der KI wird verwendet, wenn Sie Quittungen oder Rechnungen am Bankomaten oder mit einer App scannen, wenn Sie nach Wörtern in gescannten Dokumenten suchen und um Informationen aus Formularen automatisch in Datenbanken einzugeben. Sie spielt auch eine wichtige Rolle für Lieferketten und Logistik, indem sie die Versand- und Zolldokumente liest, Fracht identifiziert und Waren verfolgt. Und dieselbe Technik wird auch zum Vorlesen von Texten für blinde oder sehbehinderte Menschen verwendet.

Diese Errungenschaften an sich sind schon beeindruckend genug, aber das computerbasierte Sehen (auf Englisch “Computer Vision”) ist bereits weiter als einfaches maschinelles Lesen. Ihr Smartphone kann inzwischen Ihr Gesicht oder Ihren Fingerabdruck erkennen und so Ihr Telefon vor dem Zugriff anderer schützen. Ihre App zur Archivierung von Fotos kann automatisch alle Ihre Aufnahmen entsprechend der auf ihnen abgebildeten Personen gruppieren.

Und auf die selbe Weise kann ein Computer Objekte auf Bildern erkennen, und sie dann kategorisieren und beschriften. Roboter verwenden dieselbe Technologie, um Objekte und ihren genauen Standort zu identifizieren, sodass sie diese ergreifen und bedienen können. Und selbstfahrende Autos erkennen so Verkehrsschilder, überwachen andere Fahrzeuge und identifizieren potenzielle Hindernisse und Fussgänger, um anhand dieser Informationen dann Entscheidungen zu treffen.

Anwendungen von Computer Vision

Die bereits existierenden und potenziellen Anwendungsbereiche von Computer Vision sind enorm vielfältig. Fabriken verwenden die Technologie, um fehlerhafte oder beschädigte Waren automatisch zu erkennen und sie aus der Produktionskette zu entfernen. Organisationen wie Versicherungsunternehmen und Regierungsbehörden wenden Computer Vision auf Luft- und Satellitendaten an, um das Ausmass von Naturkatastrophen zu bewerten oder verdächtige militärische Aktivitäten nachzuvollziehen. Sicherheitsfirmen können computerbasiertes Sehen nutzen, um Vorfällen an weit entfernten Lagerorten und Eindringlinge in gesperrten Bereichen zu identifizieren.

Auch für grossflächige Überwachungssysteme gibt es vorstellbare Einsatzgebiete von Computer Vision. Landwirte rüsten Drohnen mit Computer-Vision-Technologie aus, die dann den Zustand ihrer Felder und Nutzpflanzen beurteilen kann. Infolgedessen können die Landwirte sehen, welche Pflanzen zur Ernte bereit sind und welche mehr Wasser benötigen, ohne dafür ihre Felder betreten zu müssen. In der Medizin kann die Haut mit computerbasiertem Sehen auf Ekzeme und Melanome untersucht werden und Röntgenbilder können mit grösserer Genauigkeit gelesen werden.

Bei all diesen Anwendungsfällen geht es um das Erkennen, also um den Prozess, Dinge sehen und identifizieren zu können. Wir müssen aber auch das Feld der visuellen Erweiterung (Visual Augmentation) berücksichtigen, das die Manipulation von Videos beinhaltet. Vielleicht kennen Sie es schon von Videokonferenz-Tools und Messaging-Apps, dass man seinen tristen Hintergrund in einen exotischen Ort verwandeln oder sich mittels Filtern falsche Wimpern und Bärte ins Gesicht zaubern kann.

Es ist sogar möglich, seinen Körper vollständig durch einen sogenannten Avatar1 zu ersetzen. KI verwendet dafür Methoden zur Bewegungsverfolgung, um die Position und Ausrichtung des Körpers zu bestimmen, bevor sie berechnet, wie sie die Grafiken möglichst realistisch darstellen kann.

Mittels erweiterter Realität (Augmented Reality) ist es auch möglich künstliche Objekte in die reale Umgebung einzufügen. Einige Brettspiele verfügen bereits über Funktionen, die Informationen und Objekte direkt auf dem Spielbrett eingeblenden, um ein interaktives Spielerlebnis zu ermöglichen. In der Medizin verwenden Hirnchirurgen Augmented Reality, um Scans des Gehirns vor der Operation bildlich darzustellen, sensible Bereiche zu untersuchen und so eine minimal-invasive Operation zu planen. Im OP können sie den Scan und zusätzliche Informationen dann auf den Körper des Patienten projizieren, die ihnen bei der Führung ihrer Instrumente helfen und die Genauigkeit erhöhen.

Die automatische Bewegungsverfolgung (Automatic Motion Tracking) bietet auch Anwendungsmöglichkeiten, die über Visual Augmentation hinausgehen. Selbstfahrende Autos müssen in der Lage sein, zu unterscheiden, ob ein Fussgänger den Bürgersteig entlang läuft, oder beabsichtigt, gleich die Fahrbahn zu überqueren. In diesem Fall beobachtet die AI die Bewegungsgeschwindigkeit und -richtung, um vorherzusagen, ob es möglicherweise zu einem Unfall kommen könnte.

Bewegungsverfolgung ermöglicht auch das berührungslose Bedienen von Maschinen und Schnittstellen mittels Gesten und wird bereits im Sport2 eingesetzt, wo sie die Spieler oder den Ball verfolgt.

Ampeln sind dank der Überwachung des Verkehrsflusses durch Motion Tracking effektiver geworden. Und sogar Supermärkte nutzen Bewegungsverfolgung zur Analyse der Routen, die die Einkaufenden auf ihrem Weg durch den Laden nehmen. Anschliessend fliessen diese Daten in Planungs- und Gestaltungsfragen ein, um den Kundenstrom in bestimmte Richtungen zu lenken. Tatsächlich könnte es schon bald Realität sein, dass die Produkte, die Sie beim Einkaufen im Supermarkt aus dem Regal genommen und in Ihren Einkaufswagen gelegt haben, mittels Motion Tracking erfasst werden und die Kosten Ihres Einkaufs so auf der Stelle berechnet werden.

Zwischenbilanz

Wir haben bereits einige der gängigsten Datentypen angesprochen, die uns im täglichen Leben regelmässig begegnen: Tabellen, Text, Ton, Bilder und Videos. Wie wir gesehen haben, kann jeder von ihnen genutzt werden, um uns einzigartige Einblicke zu verschaffen und uns zu helfen, leistungsstarke KI-Systeme zu bauen. Im nächsten Artikel werden wir auf Datentypen stossen, die Sie vielleicht nicht sofort als Daten betrachten - und doch sind sie es. Denn wie Sie sehen werden: Alles sind Daten!

  1. Dabei handelt es sich um eine grafische Verkörperung der Anwenderin im virtuellen Raum. 

  2. Mehr Details können Sie in unserem Artikel KI im Sport entdecken. 

Nächster

Alles sind Daten!