Arthur Samuel prägte 1959 den Begriff „Maschinelles Lernen“ und definierte ihn als ein „Studiengebiet, das Computern die Fähigkeit verleiht, zu lernen, ohne explizit programmiert zu werden“
Und das war der Beginn des Maschinellen Lernens! In der heutigen Zeit ist Machine Learning eine der beliebtesten (wenn nicht sogar die beliebteste!) Berufswahl. Laut Indeed ist Machine Learning Engineer der beste Job des Jahres 2019 mit einem Wachstum von 344% und einem durchschnittlichen Grundgehalt von $146.085 pro Jahr.
Aber es gibt immer noch viele Zweifel, was genau Machine Learning ist und wie man damit anfängt? Dieser Artikel befasst sich mit den Grundlagen des maschinellen Lernens und mit dem Weg, den Sie einschlagen können, um ein vollwertiger Machine Learning Engineer zu werden. Also los geht’s!!!
- Was ist maschinelles Lernen?
- Wie fängt man an, ML zu lernen?
- Schritt 1 – Verstehe die Voraussetzungen
- (a) Lernen Sie Lineare Algebra und Multivariate Kalkulation
- (b) Statistik lernen
- (c) Python lernen
- Schritt 2 – Verschiedene ML-Konzepte lernen
- (a) Terminologien des maschinellen Lernens
- (b) Arten des maschinellen Lernens
- (c) Wie übt man maschinelles Lernen?
- (d) Ressourcen für maschinelles Lernen:
- Schritt 3 – Nimm an Wettbewerben teil
Was ist maschinelles Lernen?
Maschinelles Lernen ist der Einsatz von künstlicher Intelligenz, um Maschinen in die Lage zu versetzen, eine Aufgabe aus Erfahrung zu erlernen, ohne sie speziell für diese Aufgabe zu programmieren. (Kurz gesagt, Maschinen lernen automatisch, ohne dass der Mensch ihnen dabei hilft!!!) Dieser Prozess beginnt damit, dass man sie mit qualitativ hochwertigen Daten füttert und dann die Maschinen trainiert, indem man verschiedene maschinelle Lernmodelle unter Verwendung der Daten und verschiedener Algorithmen erstellt. Die Wahl der Algorithmen hängt davon ab, welche Art von Daten wir haben und welche Art von Aufgabe wir zu automatisieren versuchen.
Wie fängt man an, ML zu lernen?
Dies ist ein grober Fahrplan, dem Sie auf Ihrem Weg zu einem wahnsinnig talentierten Machine Learning Engineer folgen können. Natürlich kannst du die Schritte immer nach deinen Bedürfnissen abändern, um dein gewünschtes Ziel zu erreichen!
Schritt 1 – Verstehe die Voraussetzungen
Wenn du ein Genie bist, könntest du direkt mit ML beginnen, aber normalerweise gibt es einige Voraussetzungen, die du kennen musst, darunter Lineare Algebra, Multivariate Berechnung, Statistik und Python. Und wenn Sie diese Kenntnisse nicht haben, keine Angst! Sie brauchen keinen Doktortitel in diesen Fächern, um loszulegen, aber Sie brauchen ein Grundverständnis.
(a) Lernen Sie Lineare Algebra und Multivariate Kalkulation
Beide, Lineare Algebra und Multivariate Kalkulation, sind wichtig für das Maschinelle Lernen. Das Ausmaß, in dem Sie sie benötigen, hängt jedoch von Ihrer Rolle als Datenwissenschaftler ab. Wenn Sie sich mehr auf anwendungsorientiertes maschinelles Lernen konzentrieren, werden Sie sich nicht so sehr auf Mathematik konzentrieren, da es viele gängige Bibliotheken gibt. Wenn Sie sich jedoch auf R&D im maschinellen Lernen konzentrieren wollen, dann ist die Beherrschung von Linearer Algebra und Multivariater Kalkulation sehr wichtig, da Sie viele ML-Algorithmen von Grund auf neu implementieren müssen.
(b) Statistik lernen
Daten spielen beim maschinellen Lernen eine große Rolle. In der Tat werden Sie als ML-Experte etwa 80 % Ihrer Zeit mit dem Sammeln und Bereinigen von Daten verbringen. Und Statistik ist ein Bereich, der sich mit der Sammlung, Analyse und Präsentation von Daten befasst. Es ist also keine Überraschung, dass Sie sie lernen müssen!!.
Einige der wichtigsten Konzepte in der Statistik, die wichtig sind, sind statistische Signifikanz, Wahrscheinlichkeitsverteilungen, Hypothesentests, Regression, usw. Auch Bayes’sches Denken ist ein sehr wichtiger Teil von ML, der sich mit verschiedenen Konzepten wie bedingter Wahrscheinlichkeit, Prioren und Posterioren, maximaler Wahrscheinlichkeit usw. befasst.
(c) Python lernen
Einige Leute ziehen es vor, Lineare Algebra, Multivariate Kalkulation und Statistik zu überspringen und lernen sie nach und nach durch Versuch und Irrtum. Was Sie aber auf keinen Fall auslassen dürfen, ist Python! Es gibt zwar auch andere Sprachen für maschinelles Lernen wie R, Scala usw. Python ist derzeit die beliebteste Sprache für ML. In der Tat gibt es viele Python-Bibliotheken, die speziell für künstliche Intelligenz und maschinelles Lernen nützlich sind, wie Keras, TensorFlow, Scikit-learn, usw.
Wenn Sie also ML lernen wollen, ist es am besten, wenn Sie Python lernen! Dazu kannst du verschiedene Online-Ressourcen und -Kurse nutzen, wie z.B. Fork Python, das kostenlos bei GeeksforGeeks erhältlich ist.
Schritt 2 – Verschiedene ML-Konzepte lernen
Nun, da du mit den Voraussetzungen fertig bist, kannst du zum eigentlichen Lernen von ML übergehen (das ist der spaßige Teil!!!) Am besten beginnst du mit den Grundlagen und gehst dann zu den komplizierteren Sachen über. Einige der grundlegenden Konzepte in ML sind:
(a) Terminologien des maschinellen Lernens
- Modell – Ein Modell ist eine spezifische Repräsentation, die aus Daten durch die Anwendung eines maschinellen Lernalgorithmus gelernt wird. Ein Modell wird auch als Hypothese bezeichnet.
- Merkmal – Ein Merkmal ist eine einzelne messbare Eigenschaft der Daten. Ein Satz numerischer Merkmale kann bequem durch einen Merkmalsvektor beschrieben werden. Merkmalsvektoren werden als Input in das Modell eingespeist. Um z.B. eine Frucht vorherzusagen, kann es Merkmale wie Farbe, Geruch, Geschmack usw. geben.
- Ziel (Etikett) – Eine Zielvariable oder ein Etikett ist der Wert, der von unserem Modell vorhergesagt werden soll. Für das im Abschnitt über die Merkmale besprochene Obst-Beispiel wäre das Label bei jedem Satz von Eingaben der Name der Frucht wie Apfel, Orange, Banane usw.
- Training – Die Idee ist, einen Satz von Eingaben (Merkmalen) und die erwarteten Ausgaben (Labels) zu geben, so dass wir nach dem Training ein Modell (Hypothese) haben, das dann neue Daten einer der trainierten Kategorien zuordnet.
- Vorhersage – Sobald unser Modell fertig ist, kann es mit einer Reihe von Eingaben gefüttert werden, für die es eine vorhergesagte Ausgabe (Kennzeichnung) liefert.
(b) Arten des maschinellen Lernens
- Überwachtes Lernen – Dies beinhaltet das Lernen aus einem Trainingsdatensatz mit gekennzeichneten Daten unter Verwendung von Klassifikations- und Regressionsmodellen. Dieser Lernprozess wird so lange fortgesetzt, bis das gewünschte Leistungsniveau erreicht ist.
- Unüberwachtes Lernen – Hierbei werden unmarkierte Daten verwendet und dann die zugrunde liegende Struktur in den Daten gefunden, um mit Hilfe von Faktor- und Clusteranalysemodellen immer mehr über die Daten selbst zu erfahren.
- Halbüberwachtes Lernen – Hierbei werden wie beim unüberwachten Lernen unmarkierte Daten mit einer kleinen Menge markierter Daten verwendet. Die Verwendung von gekennzeichneten Daten erhöht die Lerngenauigkeit erheblich und ist außerdem kostengünstiger als das überwachte Lernen.
- Verstärkungslernen – Dies beinhaltet das Erlernen optimaler Aktionen durch Versuch und Irrtum. Die nächste Aktion wird also durch das Erlernen von Verhaltensweisen entschieden, die auf dem aktuellen Zustand basieren und die Belohnung in der Zukunft maximieren.
(c) Wie übt man maschinelles Lernen?
- Der zeitaufwändigste Teil von ML ist die Sammlung, Integration, Reinigung und Vorverarbeitung von Daten. Üben Sie also unbedingt in diesem Bereich, denn Sie brauchen qualitativ hochwertige Daten, aber große Datenmengen sind oft schmutzig. Hier werden Sie also die meiste Zeit verbringen!!!
- Lernen Sie verschiedene Modelle und üben Sie an echten Datensätzen. Dies wird Ihnen helfen, ein Gespür dafür zu entwickeln, welche Arten von Modellen in verschiedenen Situationen geeignet sind.
- Neben diesen Schritten ist es ebenso wichtig zu verstehen, wie die durch die Verwendung verschiedener Modelle erzielten Ergebnisse zu interpretieren sind. Dies ist einfacher, wenn man die verschiedenen Tuning-Parameter und Regularisierungsmethoden versteht, die auf verschiedene Modelle angewandt werden.
(d) Ressourcen für maschinelles Lernen:
Es gibt verschiedene Online- und Offline-Ressourcen (sowohl kostenlos als auch kostenpflichtig!), die zum Erlernen des maschinellen Lernens verwendet werden können. Einige davon werden hier vorgestellt:
- Für eine umfassende Einführung in maschinelles Lernen ist der Stanford Machine Learning Course von Andrew Ng sehr beliebt. Er konzentriert sich auf maschinelles Lernen, Data Mining und statistische Mustererkennung mit Erklärungsvideos, die sehr hilfreich sind, um die Theorie und die Kernkonzepte hinter ML zu erklären.
- Wenn Sie einen Leitfaden für das Selbststudium von maschinellem Lernen suchen, dann ist der Machine Learning Crash Course von Google genau das Richtige für Sie, denn er bietet Ihnen eine Einführung in maschinelles Lernen mit Videovorlesungen, realen Fallstudien und praktischen Übungen.
- Wenn Sie einen Offline-Kurs bevorzugen, dann ist der Geeksforgeeks Machine Learning Foundation Kurs ideal für Sie. In diesem Kurs lernst du verschiedene Konzepte des maschinellen Lernens kennen und sammelst praktische Erfahrungen bei der Umsetzung in einer Unterrichtsumgebung.
Schritt 3 – Nimm an Wettbewerben teil
Nachdem du die Grundlagen des maschinellen Lernens verstanden hast, kannst du zum verrückten Teil übergehen!!! Wettbewerbe! Diese machen dich im Grunde genommen noch fähiger in ML, indem sie dein größtenteils theoretisches Wissen mit der praktischen Umsetzung kombinieren. Einige der grundlegenden Wettbewerbe, mit denen Sie auf Kaggle beginnen können und die Ihnen helfen werden, Vertrauen aufzubauen, finden Sie hier:
- Titanic: Machine Learning from Disaster: Die Titanic: Machine Learning from Disaster ist ein sehr beliebtes Einsteigerprojekt für ML, da es mehrere Tutorials gibt. Es ist also eine großartige Einführung in ML-Konzepte wie Datenexploration, Feature Engineering und Modellabstimmung.
- Digit Recognizer: Der Digit Recognizer ist ein Projekt, nachdem Sie einige Kenntnisse in Python und ML-Grundlagen haben. Es ist eine großartige Einführung in die aufregende Welt der neuronalen Netze unter Verwendung eines klassischen Datensatzes, der bereits extrahierte Merkmale enthält.
Nachdem Sie diese Wettbewerbe und andere solche einfachen Herausforderungen abgeschlossen haben …Herzlichen Glückwunsch!!! Du bist auf dem besten Weg, ein vollwertiger Machine Learning Engineer zu werden, und du kannst deine Fähigkeiten weiter ausbauen, indem du an immer mehr Herausforderungen arbeitest und schließlich immer kreativere und schwierigere Machine Learning-Projekte erstellst.