Hauptunterschied - Überwachtes und unbeaufsichtigtes maschinelles Lernen
Betreutes Lernen und unbeaufsichtigtes Lernen sind zwei Kernkonzepte des maschinellen Lernens. Überwachtes Lernen ist eine maschinelle Lernaufgabe zum Lernen einer Funktion, die eine Eingabe auf der Grundlage der beispielhaften Eingabe-Ausgabe-Paare einer Ausgabe zuordnet. Unüberwachtes Lernen ist die Aufgabe des maschinellen Lernens, eine Funktion zur Beschreibung der verborgenen Struktur aus unbeschrifteten Daten abzuleiten. Der Hauptunterschied zwischen überwachtem und unbeaufsichtigtem maschinellem Lernen besteht darin, dass überwachtes Lernen beschriftete Daten verwendet, während unbeaufsichtigtes Lernen unbeschriftete Daten verwendet.
Maschinelles Lernen ist ein Bereich in der Informatik, in dem ein Computersystem aus Daten lernen kann, ohne explizit programmiert zu werden. Es ermöglicht die Analyse der Daten und die Vorhersage von Mustern darin. Es gibt viele Anwendungen des maschinellen Lernens. Einige von ihnen sind Gesichtserkennung, Gestenerkennung und Spracherkennung. Es gibt verschiedene Algorithmen für maschinelles Lernen. Einige davon sind Regression, Klassifizierung und Clustering. Die gebräuchlichsten Programmiersprachen für die Entwicklung von Anwendungen, die auf maschinellem Lernen basieren, sind R und Python. Andere Sprachen wie Java, C ++ und Matlab können ebenfalls verwendet werden.
INHALT
1. Überblick und Hauptunterschied
2. Was ist überwachtes Lernen
? 3. Was ist unbeaufsichtigtes Lernen?
4. Ähnlichkeiten zwischen überwachtem und unbeaufsichtigtem maschinellem Lernen.
5. Vergleich nebeneinander - Überwachtes und unbeaufsichtigtes maschinelles Lernen in tabellarischer Form.
6. Zusammenfassung
Was ist betreutes Lernen?
In Systemen, die auf maschinellem Lernen basieren, arbeitet das Modell nach einem Algorithmus. Beim überwachten Lernen wird das Modell überwacht. Zunächst muss das Modell trainiert werden. Mit dem gewonnenen Wissen kann es Antworten für zukünftige Instanzen vorhersagen. Das Modell wird anhand eines beschrifteten Datensatzes trainiert. Wenn dem System Daten außerhalb der Stichprobe übergeben werden, kann es das Ergebnis vorhersagen. Es folgt ein kleiner Auszug aus dem beliebten IRIS-Datensatz.
Gemäß der obigen Tabelle werden Sepallänge, Sepalbreite, Patellänge, Patelbreite und Spezies als Attribute bezeichnet. Die Spalten werden als Features bezeichnet. Eine Zeile enthält Daten für alle Attribute. Daher wird eine Zeile als Beobachtung bezeichnet. Die Daten können entweder numerisch oder kategorisch sein. Das Modell erhält die Beobachtungen mit dem entsprechenden Artennamen als Eingabe. Wenn eine neue Beobachtung gemacht wird, sollte das Modell die Art der Art vorhersagen, zu der es gehört.
Beim überwachten Lernen gibt es Algorithmen zur Klassifizierung und Regression. Bei der Klassifizierung werden die gekennzeichneten Daten klassifiziert. Das Modell erstellte Grenzen, die die Datenkategorien trennten. Wenn dem Modell neue Daten bereitgestellt werden, kann es anhand des vorhandenen Punkts kategorisiert werden. Die K-Nearest Neighbors (KNN) sind ein Klassifizierungsmodell. Abhängig vom k-Wert wird die Kategorie festgelegt. Wenn beispielsweise k 5 ist und ein bestimmter Datenpunkt in der Nähe von acht Datenpunkten in Kategorie A und sechs Datenpunkten in Kategorie B liegt, wird der Datenpunkt als A klassifiziert.
Bei der Regression wird der Trend der vorherigen Daten vorhergesagt, um das Ergebnis der neuen Daten vorherzusagen. Bei der Regression kann die Ausgabe aus einer oder mehreren kontinuierlichen Variablen bestehen. Die Vorhersage erfolgt mithilfe einer Linie, die die meisten Datenpunkte abdeckt. Das einfachste Regressionsmodell ist eine lineare Regression. Es ist schnell und erfordert keine Abstimmungsparameter wie in KNN. Wenn die Daten einen parabolischen Trend zeigen, ist das lineare Regressionsmodell nicht geeignet.
Dies sind einige Beispiele für überwachte Lernalgorithmen. Im Allgemeinen sind die mit überwachten Lernmethoden erzielten Ergebnisse genauer und zuverlässiger, da die Eingabedaten bekannt und gekennzeichnet sind. Daher muss die Maschine nur die verborgenen Muster analysieren.
Was ist unbeaufsichtigtes Lernen?
Beim unbeaufsichtigten Lernen wird das Modell nicht überwacht. Das Modell arbeitet alleine, um die Ergebnisse vorherzusagen. Es verwendet Algorithmen für maschinelles Lernen, um Schlussfolgerungen zu unbeschrifteten Daten zu ziehen. Im Allgemeinen sind die unbeaufsichtigten Lernalgorithmen schwieriger als überwachte Lernalgorithmen, da nur wenige Informationen vorhanden sind. Clustering ist eine Art unbeaufsichtigtes Lernen. Es kann verwendet werden, um unbekannte Daten mithilfe von Algorithmen zu gruppieren. Der k-Mittelwert und das dichtebasierte Clustering sind zwei Clustering-Algorithmen.
k-Mittelwert-Algorithmus, platziert k Schwerpunkt zufällig für jeden Cluster. Dann wird jeder Datenpunkt dem nächstgelegenen Schwerpunkt zugeordnet. Der euklidische Abstand wird verwendet, um den Abstand vom Datenpunkt zum Schwerpunkt zu berechnen. Die Datenpunkte werden in Gruppen eingeteilt. Die Positionen für k Zentroide werden erneut berechnet. Die neue Schwerpunktposition wird durch den Mittelwert aller Punkte in der Gruppe bestimmt. Wieder wird jeder Datenpunkt dem nächstgelegenen Schwerpunkt zugeordnet. Dieser Vorgang wiederholt sich, bis sich die Zentroide nicht mehr ändern. k-mean ist ein schneller Clustering-Algorithmus, es gibt jedoch keine spezifizierte Initialisierung von Clustering-Punkten. Es gibt auch eine große Variation von Clustering-Modellen, die auf der Initialisierung von Clusterpunkten basieren.
Ein weiterer Clustering-Algorithmus ist das dichtebasierte Clustering. Es ist auch als dichtebasierte räumliche Clustering-Anwendungen mit Rauschen bekannt. Dabei wird ein Cluster als maximaler Satz von Punkten definiert, die mit der Dichte verbunden sind. Dies sind zwei Parameter, die für dichtebasiertes Clustering verwendet werden. Sie sind Ɛ (Epsilon) und Mindestpunkte. Das Ɛ ist der maximale Radius der Nachbarschaft. Die Mindestpunkte sind die Mindestanzahl von Punkten in der Nachbarschaft Ɛ, um einen Cluster zu definieren. Dies sind einige Beispiele für Clustering, das in unbeaufsichtigtes Lernen fällt.
Im Allgemeinen sind die Ergebnisse unbeaufsichtigter Lernalgorithmen nicht sehr genau und zuverlässig, da die Maschine die Eingabedaten definieren und kennzeichnen muss, bevor die verborgenen Muster und Funktionen ermittelt werden.
Was ist die Ähnlichkeit zwischen überwachtem und unbeaufsichtigtem maschinellem Lernen?
Sowohl überwachtes als auch unbeaufsichtigtes Lernen sind Arten des maschinellen Lernens
Was ist der Unterschied zwischen überwachtem und unbeaufsichtigtem maschinellem Lernen?
Diff Artikel Mitte vor Tabelle
Überwachtes oder unbeaufsichtigtes maschinelles Lernen |
|
Überwachtes Lernen ist die Aufgabe des maschinellen Lernens, eine Funktion zu lernen, die eine Eingabe auf der Grundlage von Beispiel-Eingabe-Ausgabe-Paaren einer Ausgabe zuordnet. | Unüberwachtes Lernen ist die Aufgabe des maschinellen Lernens, eine Funktion zur Beschreibung der verborgenen Struktur aus unbeschrifteten Daten abzuleiten. |
Hauptfunktionalität | |
Beim überwachten Lernen sagt das Modell das Ergebnis basierend auf den gekennzeichneten Eingabedaten voraus. | Beim unbeaufsichtigten Lernen sagt das Modell das Ergebnis ohne gekennzeichnete Daten voraus, indem es die Muster selbst identifiziert. |
Genauigkeit der Ergebnisse | |
Die Ergebnisse der überwachten Lernmethoden sind genauer und zuverlässiger. | Die Ergebnisse unbeaufsichtigter Lernmethoden sind nicht sehr genau und zuverlässig. |
Hauptalgorithmen | |
Es gibt Algorithmen zur Regression und Klassifizierung beim überwachten Lernen. | Es gibt Algorithmen für das Clustering beim unbeaufsichtigten Lernen. |
Zusammenfassung - Überwachtes und unbeaufsichtigtes maschinelles Lernen
Betreutes Lernen und unbeaufsichtigtes Lernen sind zwei Arten des maschinellen Lernens. Überwachtes Lernen ist die Aufgabe des maschinellen Lernens, eine Funktion zu lernen, die eine Eingabe auf der Grundlage von Beispiel-Eingabe-Ausgabe-Paaren einer Ausgabe zuordnet. Unüberwachtes Lernen ist die Aufgabe des maschinellen Lernens, eine Funktion zur Beschreibung der verborgenen Struktur aus unbeschrifteten Daten abzuleiten. Der Unterschied zwischen überwachtem und unbeaufsichtigtem maschinellem Lernen besteht darin, dass beim überwachten Lernen gekennzeichnete Daten verwendet werden, während beim unbeaufsichtigten Lernen nicht gekennzeichnete Daten verwendet werden.