Ein Blick hinter die Kulissen

Michael Notter @ EPFL Extension School · 14 Minuten

Einblicke in die Geheimnisse hinter der Funktionsweise von KI

Wir wissen jetzt, dass es überall um uns herum künstliche Intelligenz gibt, aber trotzdem ist es immer noch schwierig zu verstehen, wie diese Technologie eigentlich funktioniert. Wie können wir KI in Aktion “sehen”?

Wir sehen es inzwischen als selbstverständlich an, dass fortschrittliche KI-Systeme den Spam in unserem Posteingang aussortieren oder zum Entsperren unseres Telefons unser Gesicht erkennen können. Aber für die meisten von uns bleibt es ein Rätsel, wie KI diese Dinge tatsächlich bewerkstelligt.

Wir sprechen davon, dass KI Daten benötigt, um aus ihnen zu “lernen”. Doch was heisst das? Wer ist in diesem Szenario der “Lehrer”? Wer kümmert sich um das Unterrichten und die Bewertung? Woher stammen die Daten? Besteht KI im Grunde nur aus jeder Menge hochentwickeltem Code, der von cleveren Programmierern geschrieben wurde, oder wurde sie irgendwie zum Leben erweckt und ist in der Lage, selbständig zu lernen?


In diesem Artikel gehen wir dieser Frage auf den Grund und werfen einen Blick hinter die Kulissen, um besser zu verstehen, wie KI-Technologien funktionieren und wie sie aus Daten lernen. Wir wollen mit einigen Mythen im Zusammenhang mit KI aufräumen, indem wir ihre innere Funktionsweise veranschaulichen. KI ist keine Zauberei, sondern ein Prozess, der mit etwas Nachdenken verstanden werden kann.

Am Ende dieses Artikels werden Sie verstehen, warum diese Technologie faszinierend und spannend ist, ohne beängstigend zu sein, und dass ihre grundlegenden Bausteine nicht schwer zu verstehen sind. KI wirkt auf viele so geheimnisvoll, weil wir Menschen uns schwer tun, die Fähigkeit von KI, schnell grosse Datenmengen zu verarbeiten und Muster darin zu erkennen, richtig zu beurteilen.

Wie eine KI Ihr Gewicht vorhersagen kann

Wenn die KI eines ihrer “Wunder” vollbringt, dann unterscheidet sich das kaum von dem, was ein Mensch in der gleichen Situation tun würde. Betrachten wir zunächst ein sehr einfaches Beispiel dafür.

Nehmen wir an, wir wollen einen Datensatz über Menschen erstellen.1 Dafür können wir Dinge wie Alter, Grösse, Gewicht, Haarfarbe usw. erfassen. Und in tabellarischer Form könnten die Daten in etwa wie folgt aussehen:

Id Alter (Jahre) Grösse (cm) Gewicht (kg) Haarfarbe Sportlich Geschlecht
1 16 174.3 58.6 Braun Ja Weiblich
2 25 166 64.3 Blond Nein Männlich
3 2 88.8 11.9 Schwarz Nein Weiblich
4 61 175.8 72 Weiss Ja Männlich
5

Nehmen wir nun an, wir möchten ein KI-System erstellen, das in der Lage ist, das Gewicht einer Person basierend auf ihren persönlichen Merkmalen vorherzusagen. Betrachten wir zum Beispiel Kinder im Alter von 2–8 Jahren.

Merkmale

Im Kontext der KI ist ein Merkmal eine individuelle, messbare Eigenschaft eines beobachteten Phänomens.2

Die Merkmale einer Person könnten z. B. ihre Haarfarbe, ihr Alter, ihre Grösse usw. sein. In einem tabellarischen Datensatz werden diese verschiedenen Merkmalen in einzelnen Spalten gespeichert, wie in der Tabelle oben dargestellt. Da diese Merkmale von einer Beobachtung (hier einzelne Personen) zur nächsten variieren können werden sie häufig auch als Variablen bezeichnet.

Wir wissen aus unserer eigenen Erfahrung, dass Kleinkinder nicht viel wiegen, aber mit jedem Jahr das sie wachsen, grösser und schwerer werden. Wir können überprüfen, ob unsere Intuition korrekt ist, indem wir das Gewicht und die Grösse wie folgt darstellen:

Plot 1

Jeder blaue Punkt stellt ein einzelnes Kind dar. Die Körpergrösse eines jeden Kindes wird auf der horizontalen x-Achse und das Gewicht auf der vertikalen y-Achse dargestellt. Wenn man sich das Diagramm ansieht, kann man leicht eine Beziehung zwischen Grösse und Gewicht erkennen. Wir können sehen, dass die Kinder mit zunehmender Grösse auch schwerer werden. Es gibt ein eindeutiges Muster, das unsere anfängliche Intuition bestätigt.

Können wir ein einfaches Modell erstellen, das diese Beziehung zwischen Grösse und Gewicht beschreibt? Anders ausgedrückt: Können wir, wenn wir die Grösse eines Kindes kennen, eine zuverlässige Schätzung seines Gewichts abgeben?

Model

In der Welt der KI (und der Mathematik im Allgemeinen) wird ein Modell verwendet, um die Beziehung zwischen mehreren Variablen oder Merkmalen zu beschreiben. Typischerweise versuchen wir, ein Merkmal (die Ausgabe) anhand von einigen anderen (den Eingaben) zu beschreiben.

Zum Beispiel sind der Radius, die Fläche und der Umfang alles beobachtbare Merkmale eines Kreises. Ein Modell der Beziehung zwischen dem Radius r und dem Umfang C ist durch die Gleichung C=2πr gegeben, d. h. für jeden Kreis ist der Umfang 2π (etwa 6,3) mal so lang wie der Radius.

Kehren wir für einen Moment zum Diagramm zurück und betrachten die schwarze Linie, die den allgemeinen Trend beschreibt. Wofür steht diese Linie und kann sie uns helfen, das Gewicht eines Kindes zu schätzen, wenn wir seine Grösse bereits kennen?

Die Punkte der schwarzen Linie stellen die Grösse und das Gewicht von durchschnittlichen Kindern dar. Ein durchschnittliches Kind mit einer Körpergrösse von 80 cm wiegt etwa 9,5 kg. Das Körpergewicht steigt auf 27 kg, wenn das Kind 130 cm gross ist. Wir können auch berechnen, dass ein durchschnittliches Kind für jeden zusätzlichen Zentimeter an Körpergrösse etwa 0,35 kg zunimmt.

Bei der schwarzen Linie handelt es sich um genau die Art von Modell, die wir wollen. Wir beginnen mit 9,5 kg bei 80 cm und fügen für jeden zusätzlichen Zentimeter 0,35 kg hinzu. Wie wir an den vielen blauen Punkten oberhalb und unterhalb der Linie sehen können, ist dieses Modell nicht perfekt, aber es ist definitiv besser als eine zufällige Schätzung und es liefert uns zuverlässige Daten zum Gewicht.

Die wichtigste Information, damit das Modell funktioniert, ist das Verhältnis von 0,35 kg/cm, das uns sagt, wie viel Kilogramm an Gewicht wir für jeden zusätzlichen Zentimeter an Körpergrösse hinzufügen müssen. Wenn wir auf dem Gebiet der KI über Modelle sprechen, bezeichnet man eine Zahl wie diese als Parameter. Beim Erstellen von Modellen können wir die Parameter nach unserem eigenen Ermessen anpassen. Die richtige Wahl der Parameter und deren Einstellung ist für die Entwickelung eines sinnvollen und nützlichen Modells sehr wichtig.

Parameter

In einem KI-Modell ist ein Parameter ein modellspezifischer numerischer Wert, der, anders als die Werte der Merkmale oder Variablen, konstant und unabhängig von den gemachten Beobachtungen ist. Verschiedene Kreise haben unterschiedliche Radien und Umfänge. Die Zahl, mit der wir den Radius multiplizieren, also 2π, ist jedoch für alle Kreise gleich. Wenn ein KI-Modell “aus Daten lernt”, versucht es, geeignete Werte für seine Parameter zu finden. Parameter können einem bestimmten Merkmal eine Gewichtung geben, oder sie können einen Schwellenwert erfassen, ab dem sich das Gesamtverhalten ändert, z. B. das Alter der Pubertät.

Plot 2

Wenn wir unseren Parameter zum Beispiel auf 0,1 kg/cm reduzieren, entsteht die orangefarbene Linie im obigen Diagramm. Es ist deutlich zu erkennen, dass diese Linie das Körpergewicht fast aller Kinder viel zu niedrig einschätzt. Gemäss diesem Parameter würde ein durchschnittliches 130 cm grosses Kind nur 14,5 kg wiegen.

Als anderes Extrem zeigt die rote Linie, was passiert, wenn wir den Parameter als 1,0 kg/cm festlegen. Demnach würde ein durchschnittliches 130 cm grosses Kind 59,5 kg wiegen, was, wie wir wissen, weit über dem Durchschnitt für ein Kind dieser Grösse liegt. Keiner dieser neuen Parameter liefert also ein so gutes Modell wie der ursprüngliche Wert von 0,35-kg/cm für die schwarze Linie.

Es stellt sich die Frage: Wie sind wir eigentlich zu unserem Parameter von 0,35 kg/cm gekommen?

Wir haben die Daten analysiert und das Gewicht eines durchschnittlichen Kindes bei einer bestimmten Grösse ermittelt. Dies ist ein wirklich wichtiger Punkt, deshalb unterstreichen wir seine Bedeutung noch einmal: Wir haben die Daten verwendet, um den Parameter für unser Modell zu finden.

Ohne Daten hätten wir das 0,35-kg/cm-Modell nicht erstellen können und hätten uns stattdessen auf Vermutungen verlassen müssen. Aber durch die Analyse der Daten haben wir “gelernt”, dass 0,35 in unserer ausgewählten Altersgruppe ein guter Parameter für die Körpergrösse ist. Mit anderen Worten: Das Modell hat aus den Daten gelernt.

In Gesprächen über das Thema KI werden Sie immer wieder Aussagen wie diese hören. Der wichtigste Punkt hierbei ist, dass die Auswertung von Daten uns die Möglichkeit gibt, geeignete Parameter für unsere Modelle zu bestimmen.

Mehr Daten, mehr Einblicke

Fügen wir nun einige weitere Merkmale hinzu und beobachten wir, was mit unserem Modell passiert. Vielleicht können wir es noch effektiver machen, indem wir zusätzliche Daten erfassen, um ein detaillierteres und effektiveres Muster zu erkennen.

Was passiert zum Beispiel, wenn wir versuchen, das Gewicht anhand des Geschlechts und der Grösse zu schätzen?

Plot 3

Dieses Mal hat unser Modell zwei Parameter. Wir behalten den Parameter für die Grösse (0,35) bei, fügen aber auch einen zweiten Parameter für das Geschlecht (-0,18) hinzu. Das bedeutet, dass wir für jeden zusätzlichen Zentimeter Körpergrösse 0,35 kg addieren müssen und, wenn die Schätzung sich auf ein Mädchen und nicht auf einen Jungen bezieht, dann müssen wir noch 0,18 kg abziehen.

Denken wir kurz darüber nach, was genau das für das Modell bedeutet.

Vergleichen wir ein Mädchen, das nur 0,5 cm grösser als ein Junge ist – ein so kleiner Unterschied, dass wir ihn mit dem blossen Auge nur schwer erkennen könnten. Unser Modell würde in diesem Fall für beide das gleiche Gewicht vorhersagen. Warum ist das so? Das Modell hat aus unserem Datensatz gelernt, dass das Geschlecht nicht wirklich ausschlaggebend ist, um innerhalb unserer ausgewählten Altersgruppe Vorhersagen über das Gewicht zu treffen. Cool, nicht wahr?

Unser erster Datensatz war auf Kinder bis zum Alter von 8 Jahren beschränkt; wie verhält es sich aber, wenn wir ältere Kinder oder Erwachsene mit einbeziehen?

Auch hier Wissen wir einige Dinge aus Erfahrung. Zum einen wissen wir, dass wir irgendwann aufhören zu wachsen, wenn wir das Erwachsenenalter erreichen. Zum anderen wissen wir, dass Menschen im Laufe ihres Lebens zu- und auch wieder abnehmen können.

Wenn wir diesen viel umfangreicheren Datensatz betrachten, wird schnell deutlich, dass Vorhersagen unseres vorherigen Modells nicht mehr zuverlässig sind, wenn die beschriebenen Personen älter sind. Auf der nächsten Abbildung ist zu sehen, dass das mögliche Körpergewicht einer Person mit zunehmender Körpergrösse in ein breiteres Spektrum fällt.

Plot 4

Gesundheit und Lebensstil wirken sich in einer Weise auf unser Gewicht aus, die scheinbar unvorhersehbar ist. Die Merkmale Körpergrösse und Geschlecht reichen bei Erwachsenen nicht mehr aus, um Vorhersagen über das Gewicht zu treffen, und die Annahme, dass jeder zusätzliche Zentimeter Körpergrösse die gleiche Gewichtsveränderung mit sich bringt, ist wenig sinnvoll.

Um kompliziertere und komplexere Modelle (wie das auf der nachfolgenden Grafik durch die rote Linie dargestellte) zu erstellen, müssen wir Möglichkeiten finden, immer mehr Merkmale in unsere Modelle aufzunehmen. Je komplexer die Modelle aber werden, desto grösser wird die Anzahl der Parameter, die sie erlernen müssen, und desto grösser wird die Menge der Daten, die sie zum Lernen brauchen.

Glücklicherweise können Computer problemlos Hunderte von Parametern auf einmal verarbeiten.

Plot 5

Mit mehr Informationen baut KI bessere Modelle

Und das ist so faszinierend an KI-Systemen. Wenn man sie mit genügend Daten versorgt und diese Daten ausreichend viele unterschiedliche menschliche Merkmale abdecken, kann ein KI-System verschiedene relevante Muster entdecken und daraus Parameter ableiten. Durch das Hinzufügen weiterer Merkmale kann ein differenzierteres Abbild der menschlichen Natur abgebildet werden.

Mit genügend Merkmalen lässt sich ab einem gewissen Punkt mit hoher Zuverlässigkeit das Gewicht von nahezu jeder Person vorhersagen: “Eine Person dieser Grösse, dieses Geschlechts, dieses Alters, mit dieser Anzahl von Kindern, diesem Haustier, die an diesem Ort lebt, mit diesem Bildungshintergrund, Familienstand und genetischen Voraussetzungen wiegt ungefähr 78,3 kg.

Wir versuchen immer noch ausschliesslich, das Gewicht einer Person vorherzusagen, so wie es auch bei der ersten Abbildung in diesem Artikel der Fall war. Unser Datensatz enthält jetzt aber viel mehr Informationen und wir ziehen wesentlich mehr Parameter heran.

Wenn eine engagierte Datenwissenschaftlerin versuchen würde, unser erstes Modell mit nur einem Merkmal zu erstellen, indem sie die Körpergrössen von 10 000 Kindern manuell in einen Taschenrechner eingibt, würde das etwa 3 Stunden dauern. Verständlicherweise würden wir nicht empfehlen, dies zu Hause zu versuchen!

Ein KI-System kann zahlreiche menschliche Merkmale gleichzeitig analysieren und dabei schnell relative Muster und Informationen erkennen, um daraus jene Parameter zu erstellen, die für die Erfüllung unserer gewünschten Aufgabe erforderlich sind (z. B. die Vorhersage des Gewichts einer Person).

Schon seit dem 19. Jahrhundert befassen sich Mathematiker, Statistiker und Wissenschaftler mit der Betrachtung von Daten und der Berechnung von Parametern. Es wäre jedoch sehr schwierig, die effektivsten Parameter für alle Merkmale in diesem Datensatz manuell zu bestimmen; und praktisch unmöglich, alle dem menschliche Körpergewicht zugrunde liegenden Ursachen abzudecken. KI-Systeme sind dieser Aufgabe hingegen gewachsen, weil sie in sehr kurzer Zeit riesige Datenmengen analysieren können.

Neu entwickelte Ansätze verhelfen KI-Systemen zu noch mehr Flexibilität und der Fähigkeit, die optimale Kombination von Parametern für eine bestimmte Aufgabe zu finden. Sie tun dies, indem sie verschiedene Parameterkombinationen ausprobieren, prüfen, wie gut diese funktionieren, und sie dann entsprechend anpassen. Dieser Vorgang wird so lange wiederholt, bis die getroffenen Vorhersagen präzise genug sind.

Anmerkung: Ein KI-System, das in der Lage ist, diese Daten zu betrachten, um das Gewicht einer Person vorherzusagen, könnte sie genauso gut verwenden, um zu lernen, wie man das Alter oder die Körpergrösse vorhersagt. Alles, was das KI-System dafür braucht, ist der Datensatz, die zur Verfügung stehenden Merkmale und eine neue Zielvorgabe. Sobald passende Parameter ausgearbeitet wurden und das Modell trainiert wurde (was einige Zeit in Anspruch nehmen kann), kann es zur sofortigen Vorhersage des Alters oder der Körpergewichts jeder beliebigen Person verwendet werden.

Auswirkungen des Lernens aus Daten

Doch die Fähigkeit, aus Daten lernen zu können, bringt Einschränkungen mit sich. Ein KI-System kann das Gewicht einer Person nur dann mit guter Genauigkeit vorhersagen, wenn es aus einem Datensatz gelernt hat, in dem es vergleichbare Personen gibt,.

Würde ein KI-System einen Datensatz der aktuellen Schweizer Bevölkerung analysieren, wäre es gut dazu in der Lage, das Gewicht eines durchschnittlichen Schweizers vorherzusagen. In den seltenen Fällen, in denen jemand entweder besonders leicht oder schwer ist, wäre eine genaue Vorhersage jedoch wahrscheinlich schwierig.

Wenn noch nie eine Person mit einem Körpergewicht von 300 kg im Datensatz eines KI-Systems enthalten war, dann könnte es dieses Gewicht nur schwerlich vorhersagen. Ähnlich verhält es sich, wenn man das Gewicht einer Person mit sehr ungewöhnlichen Körpermassen vorhersagen möchte. Ein KI-System käme an seine Grenzen,korrekte Vorhersagen für jemanden wie Robert Wadlow 3 zu berechnen, der mit 272 cm der grösste Mensch war, der jemals gelebt hat. Denn das KI-System versteht nicht, dass es sich hierbei um einen sehr ungewöhnlichen Fall (einen statistischen Ausreisser) handelt. Stattdessen würde es die ungewöhnliche Körpergrösse von Wadlow blind und ohne zu hinterfragen mit jenem Parameter multiplizieren, der aus der Körpergrösse durchschnittlicher Personen erlernt wurde.

Anders ausgedrückt: Ein KI-System kann aus jedem Datensatz unglaublich komplexe Informationsmuster lernen, aber es kann keine Vorhersagen treffen, die über das hinausgehen, wofür es ursprünglich trainiert wurde. Das liegt daran, dass es durch die in den Daten vorhandenen Merkmale begrenzt wird und nicht durch seine Fähigkeit, diese zu analysieren.

Wie unterscheidet man KI und intelligenten Anwendungen?

KI gilt als die Zukunftstechnologie. Sie ist aufregend, voller Möglichkeiten und in den Medien wird viel über sie berichtet. Der Hype um KI bringt es mit sich, dass viele Unternehmen und Marketingfirmen, wo immer es geht, Produkte und Dienstleistungen als “smart” oder mit einer Art von KI-Technologie ausgestattet vermarkten. Viele Programme und Gadgets mit “intelligenten” Funktionen verwenden jedoch überhaupt keine KI.

Inzwischen verstehen wir KI-Technologie ein bisschen besser. Deshalb können wir KI-Systeme leichter identifizieren und sie von ausgeklügelten Computerprogrammen unterscheiden, die nur den Anschein von KI erwecken, es aber in Wirklichkeit nicht sind.

Ein Standard-Fitness-Tracker (links dargestellt), kann Ihre Aktivität aufzeichnen und daraus nach fixen Mustern viele nützliche Informationen erarbeiten. Im Gegensatz dazu, hat ein KI-gestützter Fitness-Tracker (rechts dargestellt) diese Informationen analysiert und neue Muster erarbeitet.

Fassen wir die wichtigsten Merkmale von KI so kurz wie möglich zusammen.

  • Sie kann grosse Datenmengen analysieren.
  • Sie findet automatisch versteckte Informationsmuster in diesen Daten.
  • Sie verwendet diese Muster, um die Modellparameter zu wählen, die die jeweilige Aufgabe am effektivsten erfüllen.

Je nach Modell ist Ihre “intelligente” Uhr möglicherweise nicht so intelligent, wie Sie denken. Zur Anzeige Ihres Herzschlags und zum Zählen Ihrer täglich zurückgelegten Schritte reichen auch ein paar gut platzierte Sensoren aus. Es bedarf keiner KI.

Wenn ihr Gerät diese Zahlen nur übermittelt, aber die gesammelten Informationen nicht analysiert, benötigt es keine KI. Selbst wenn Ihre Uhr Sie darüber informiert, dass es Zeit für etwas Bewegung ist, ist dafür keine KI erforderlich. Es reicht aus, wenn sie über Sensoren misst, wie lange Sie inaktiv waren, und Ihnen zum Beispiel nach 30 Minuten Inaktivität eine Aufforderung schickt.

Wenn Ihre Uhr jedoch tatsächlich Ihre Aktivitätsmuster analysiert und daraus die optimale Zeit ermittelt, um Sie zu motivieren, oder wenn sie Ihren Herzschlag analysiert und unregelmässige oder abnormale Herzrhythmen identifiziert, dann verwendet sie ein KI-System.

Um diese Aktionen auszuführen, muss Ihr Gerät Ihre Daten analysieren, individuelle Muster erkennen und daraus Parameter ableiten, ähnlich wie unser KI-System es für die Vorhersage des Gewichts einer Person getan hat.

Zusammenfassung

In diesem Artikel haben wir einen Blick hinter die Kulissen geworfen, um besser zu verstehen, wie KI funktioniert. Wir haben gesehen, dass dies auf der Grundlage von Datensätzen und der Fähigkeit von KI-Systemen beruht, diese zu analysieren, Muster zu finden und Parameter auszuwählen, um Aufgaben effektiv auszuführen. Im nächsten Artikel (Verstehen, wie KI lernt) untersuchen wir, wie KI lesen, beobachten und Entscheidungen treffen kann.

  1. Dieses Beispiel basiert auf dem Datensatz des National Health and Nutrition Examination Survey und deckt 60 000 Personen ab. 

  2. Diese Definition für Merkmale basiert auf dem berühmten Buch von Christopher Bishop mit dem englischen Titel “Pattern recognition and machine learning” 

  3. Etwas mehr Information über Robert Wadlow, den grössten je registrierten Mensch, finden Sie in diesem Wikipedia Artikel

Nächster

Verstehen, wie KI lernt