MASCHINELLES LERNEN VISUALISIERT

Der kNN-Algorithmus

Die Grundlagen

Kurz erklärt

 

Der K-Nearest-Neighbours-Algorithmus ist ein einfacher und intuitiver Machine-Learning-Algorithmus, der auf Basis vorhandener Trainingsdaten (hier: blaue und rote Punkte) Prognosen über die Klassifizierung neuer Daten (blau oder rot?) trifft. Dies tut er, indem er im Umfeld eines neuen Datenpunktes eine bestimmte Anzahl (k) der nächsten Nachbarpunkte betrachtet, deren überwiegende Kategorie ermittelt und diese dem neuen Datenpunkt zuweist. Dadurch teilt sich der „Datenraum“ auf in blaue und rote Gebiete (alle neuen Datenpunkte, die in ein blaues Gebiet fallen, erhalten die Kategorie „blau“ usw.).

Was kann ich tun?

Anleitung

 

Sie können Datenpunkte mit der Maus verschieben, löschen (nach unten links aus dem Bild ziehen) oder neu hinzufügen (Buttons oben rechts). Beobachten Sie dabei, wie sich die Einfärbung der Fläche ändert: Punkten in blauen Bereichen weist der Algorithmus die Kategorie „blau“, Punkten in roten Gebieten die Kategorie „rot“ zu. Mit dem Schieberegler können Sie die Anzahl der berücksichtigen Nachbarn verändern – dies hat teils deutliche Auswirkungen auf die Gebietseinteilung.

Wenn Sie mit der Maus auf eine Stelle außerhalb der Punkte klicken, dann werden die k nächstgelegenen Datenpunkte („Nachbarn“) zu dieser Stelle angezeigt – samt der sich daraus ergebenden Farbe bzw. Kategorie.

ROC-Kurve und Gini-Koeffizient

ROC-Kurve und Gini-Koeffizient

Die Prognosekraft oder Trennschärfe eines maschinellen Lernverfahrens kann mit der ROC-Kurve und dem daraus abgeleiteten Gini-Koeffizienten gemessen werden.

mehr lesen
Handschrifterkennung mit Neuronalen Netzen

Handschrifterkennung mit Neuronalen Netzen

Die App visualisiert ein einfaches neuronales Netz – wie es lernt und wie es arbeitet – am Beispiel der Erkennung handgeschriebener Ziffern. Diese können mit der Maus live auf ein einfaches Zeichenfeld bestehend aus 5 x 3 Pixeln geschrieben werden. Die geschriebene Ziffer wird vom neuronalen Netz dabei unmittelbar in die erkannte Ziffer übersetzt. Wie gut das gelingt, hängt davon ab, wie gut das neuronale Netz trainiert ist.

mehr lesen
Stein, Schere, Papier mit kNN

Stein, Schere, Papier mit kNN

Der kNN-Algorithmus ist ein einfacher und wirkungsvoller Machine-Learning-Algorithmus für Klassifikations- und Regressionsaufgaben. Hier im Beispiel kann man ihn live erleben, wie er Handpositionen als Stein, Schere oder Papier klassifiziert, nachdem man ihn mit entsprechenden Schnappschüssen trainiert hat.

mehr lesen
Naive Bayes

Naive Bayes

Der Naive-Bayes-Algorithmus ist ein Machine-Learning-Algorithmus. Er wird zum Beispiel in Spam-Filtern von E-Mail-Programmen verwendet. Die VisuApp illustriert die dahinterstehende Logik an einem Beispiel:

mehr lesen
Entscheidungsbaum

Entscheidungsbaum

Entscheidungsbäume sind maschinelle Lernverfahren, die sich durch besonders gute Verständlichkeit auszeichnen, da der Weg vom Input zum Ergebnis Schritt für Schritt nachvollzogen werden kann. In der VisuApp wird ein Entscheidungsbaum auf Basis von Trainingsdaten trainiert und grafisch dargestellt.

mehr lesen
Random Forest

Random Forest

Random Forests sind maschinelle Lernverfahren, die auch als „Ensemble-Verfahren“ bezeichnet werden. Hierbei wird statt nur eines einzelnen Entscheidungsbaums eine ganze Gruppe solcher Bäume trainiert („Wald“). Zur Klassifikation einer Eingabe wird diese in jedem Baum ausgewertet. Diejenige Klasse, die am häufigsten gewählt wurde, ist die Ausgabe des Random Forest.

mehr lesen
Lineare Regression

Lineare Regression

Die klassische lineare Regression kann wahrscheinlich als das einfachste maschinelle Lernverfahren betrachtet werden. Jedoch ist das Verfahren auch sehr „starr“ in dem Sinne, dass es nur lineare (d. h. geradlinige) Entscheidungsgrenzen zulässt.

mehr lesen
Support Vector Machines

Support Vector Machines

Support Vector Machines stellen eine der leistungsfähigsten und am weitesten verbreiteten Kategorien von maschinellen Lernverfahren dar.

mehr lesen