Jak rozpocząć naukę uczenia maszynowego?

Arthur Samuel ukuł termin „Machine Learning” w 1959 roku i zdefiniował go jako „Dziedzina nauki, która daje komputerom zdolność do uczenia się bez wyraźnego programowania”.

I to był początek Machine Learning! W dzisiejszych czasach, uczenie maszynowe jest jednym z najbardziej popularnych (jeśli nie najbardziej!) wyborów kariery. Według Indeed, Machine Learning Engineer Is The Best Job of 2019 z 344% wzrostem i średnim wynagrodzeniem bazowym w wysokości 146 085 USD rocznie.

Getting Started with Machine Learning

Ale nadal istnieje wiele wątpliwości co do tego, czym dokładnie jest Machine Learning i jak zacząć się go uczyć? Więc ten artykuł dotyczy podstaw uczenia maszynowego, a także ścieżki, którą możesz podążać, aby ostatecznie stać się pełnoprawnym inżynierem uczenia maszynowego. A więc zaczynajmy!!!

Co to jest uczenie maszynowe?
Jak zacząć naukę ML?
Krok 1 – Zrozumienie warunków wstępnych
(a) Learn Linear Algebra and Multivariate Calculus
(b) Learn Statistics
(c) Learn Python
Krok 2 – Naucz się różnych koncepcji ML
(a) Terminologie uczenia maszynowego
(b) Rodzaje uczenia maszynowego
(c) Jak ćwiczyć uczenie maszynowe?
(d) Zasoby do nauki uczenia maszynowego:
Krok 3 – Weź udział w Konkursach

Co to jest uczenie maszynowe?

Uczenie maszynowe polega na wykorzystaniu sztucznej inteligencji, aby umożliwić maszynom uczenie się zadań z doświadczenia bez programowania ich specjalnie w tym zadaniu. (W skrócie, maszyny uczą się automatycznie bez udziału człowieka!!!) Proces ten rozpoczyna się od dostarczenia im dobrej jakości danych, a następnie szkolenia maszyn poprzez budowanie różnych modeli uczenia maszynowego z wykorzystaniem danych i różnych algorytmów. Wybór algorytmów zależy od tego, jaki rodzaj danych posiadamy i jaki rodzaj zadania próbujemy zautomatyzować.

Jak zacząć naukę ML?

To jest przybliżona mapa drogowa, którą możesz podążać w drodze do zostania szalenie utalentowanym inżynierem uczenia maszynowego. Oczywiście, zawsze możesz zmodyfikować kroki zgodnie ze swoimi potrzebami, aby osiągnąć swój pożądany cel końcowy!

Krok 1 – Zrozumienie warunków wstępnych

W przypadku, gdy jesteś geniuszem, możesz rozpocząć ML bezpośrednio, ale zazwyczaj istnieją pewne warunki wstępne, które musisz znać, takie jak algebra liniowa, rachunek różniczkowy, statystyka i Python. A jeśli ich nie znasz, nie obawiaj się! Nie musisz mieć stopnia doktora w tych tematach, aby zacząć, ale musisz mieć podstawowe zrozumienie.

(a) Learn Linear Algebra and Multivariate Calculus

Zarówno Linear Algebra jak i Multivariate Calculus są ważne w Machine Learning. Jednak to, w jakim stopniu są one potrzebne, zależy od Twojej roli jako data scientist. Jeśli jesteś bardziej skoncentrowany na aplikacji ciężkiego uczenia maszynowego, wtedy nie będziesz tak mocno skoncentrowany na matematyce, ponieważ istnieje wiele wspólnych bibliotek dostępnych. Ale jeśli chcesz skupić się na R&D w Machine Learning, to opanowanie algebry liniowej i obliczeń wielorakich jest bardzo ważne, ponieważ będziesz musiał zaimplementować wiele algorytmów ML od zera.

(b) Learn Statistics

Dane odgrywają ogromną rolę w Machine Learning. W rzeczywistości, około 80% twojego czasu jako eksperta ML będzie spędzone na zbieraniu i czyszczeniu danych. A statystyka jest dziedziną, która zajmuje się zbieraniem, analizą i prezentacją danych. Więc nie jest zaskoczeniem, że trzeba się go nauczyć!!!
Niektóre z kluczowych pojęć w statystyce, które są ważne są znaczenie statystyczne, rozkłady prawdopodobieństwa, testowanie hipotez, regresji, itp. Również, Bayesian Thinking jest również bardzo ważną częścią ML, która zajmuje się różnymi koncepcjami, takimi jak prawdopodobieństwo warunkowe, priorytety, i posteriors, maksymalne prawdopodobieństwo, itp.

(c) Learn Python

Niektórzy ludzie wolą pominąć algebrę liniową, rachunek różniczkowy i statystykę i uczyć się ich jak idą wraz z próbą i błędem. Ale jedną rzeczą, której absolutnie nie możesz pominąć jest Python! Podczas gdy istnieją inne języki, których możesz użyć do uczenia maszynowego, takie jak R, Scala itp. Python jest obecnie najbardziej popularnym językiem dla ML. W rzeczywistości istnieje wiele bibliotek Pythona, które są szczególnie przydatne dla sztucznej inteligencji i uczenia maszynowego, takich jak Keras, TensorFlow, Scikit-learn itp.

Jeśli więc chcesz nauczyć się ML, najlepiej będzie, jeśli nauczysz się Pythona! Możesz to zrobić używając różnych zasobów online i kursów takich jak Fork Python dostępny za darmo na GeeksforGeeks.

Krok 2 – Naucz się różnych koncepcji ML

Teraz, gdy skończyłeś z wymaganiami wstępnymi, możesz przejść do nauki ML (co jest częścią zabawy!!!) Najlepiej zacząć od podstaw, a następnie przejść do bardziej skomplikowanych rzeczy. Niektóre z podstawowych pojęć w ML są następujące:

(a) Terminologie uczenia maszynowego

Model – Model jest specyficzną reprezentacją wyuczoną z danych poprzez zastosowanie algorytmu uczenia maszynowego. Model nazywany jest również hipotezą.
Cecha – cecha jest indywidualną, mierzalną właściwością danych. Zbiór cech liczbowych może być wygodnie opisany przez wektor cech. Wektory cech są podawane jako dane wejściowe do modelu. Na przykład, aby przewidzieć owoc, mogą istnieć cechy takie jak kolor, zapach, smak, itp.
Cel (Etykieta) – Zmienna docelowa lub etykieta jest wartością, która ma być przewidywana przez nasz model. Dla przykładu owoców omówionego w sekcji cech, etykietą dla każdego zestawu danych wejściowych będzie nazwa owocu, np. jabłko, pomarańcza, banan, itp.
Trening – Idea polega na podaniu zestawu danych wejściowych (cech) i oczekiwanych danych wyjściowych (etykiet), więc po treningu, będziemy mieli model (hipotezę), który będzie mapował nowe dane do jednej z kategorii trenowanych na nich.
Przewidywanie – Kiedy nasz model jest gotowy, może być podany zestaw danych wejściowych, do których dostarczy przewidywane wyjście (etykietę).

(b) Rodzaje uczenia maszynowego

Uczenie nadzorowane – Polega na uczeniu się z zestawu danych szkoleniowych z etykietowanymi danymi przy użyciu modeli klasyfikacji i regresji. Ten proces uczenia trwa do momentu osiągnięcia wymaganego poziomu wydajności.
Uczenie nienadzorowane – Polega na użyciu nieznakowanych danych, a następnie znalezieniu struktury w danych, aby dowiedzieć się więcej i więcej o samych danych za pomocą modeli analizy czynnikowej i klastrowej.
Uczenie półnadzorowane – Polega na użyciu nieznakowanych danych, jak w przypadku uczenia nienadzorowanego, z niewielką ilością oznakowanych danych. Użycie etykietowanych danych znacznie zwiększa dokładność uczenia i jest również bardziej opłacalne niż uczenie nadzorowane.
Reinforcement Learning – Polega na uczeniu się optymalnych działań metodą prób i błędów. Tak więc następne działanie jest podejmowane przez uczenie się zachowań, które są oparte na bieżącym stanie i które zmaksymalizują nagrodę w przyszłości.

(c) Jak ćwiczyć uczenie maszynowe?

Najbardziej czasochłonną częścią w ML jest zbieranie danych, integracja, czyszczenie i wstępne przetwarzanie. Więc upewnij się, że ćwiczysz z tym, ponieważ potrzebujesz wysokiej jakości danych, ale duże ilości danych są często brudne. Więc to jest to, gdzie większość twojego czasu pójdzie!!!
Naucz się różnych modeli i ćwicz na prawdziwych zestawach danych. To pomoże Ci w tworzeniu intuicji wokół tego, które typy modeli są odpowiednie w różnych sytuacjach.
Wraz z tymi krokami, równie ważne jest, aby zrozumieć, jak interpretować wyniki uzyskane przy użyciu różnych modeli. Jest to łatwiejsze do zrobienia, jeśli rozumiesz różne parametry dostrajania i metody regularności stosowane na różnych modelach.

(d) Zasoby do nauki uczenia maszynowego:

Istnieją różne zasoby online i offline (zarówno darmowe, jak i płatne!), które mogą być wykorzystane do nauki uczenia maszynowego. Niektóre z nich są podane tutaj:

Dla szerokiego wprowadzenia do uczenia maszynowego, Kurs uczenia maszynowego Stanforda przez Andrew Ng jest dość popularny. Skupia się on na uczeniu maszynowym, eksploracji danych i statystycznym rozpoznawaniu wzorców, a filmy wyjaśniające są bardzo pomocne w wyjaśnianiu teorii i podstawowych pojęć stojących za ML.
Jeśli chcesz mieć przewodnik do samodzielnej nauki uczenia maszynowego, to Machine Learning Crash Course od Google jest dla Ciebie dobry, ponieważ zapewni Ci wprowadzenie do uczenia maszynowego z wykładami wideo, studiami przypadków i praktycznymi ćwiczeniami.
W przypadku, gdy wolisz kurs offline, kurs Geeksforgeeks Machine Learning Foundation będzie dla Ciebie idealny. Ten kurs nauczy Cię o różnych koncepcjach Uczenia Maszynowego, a także praktycznego doświadczenia w ich implementacji w środowisku klasowym.

Krok 3 – Weź udział w Konkursach

Po zrozumieniu podstaw Uczenia Maszynowego, możesz przejść do szalonej części!!! Konkursy! Te w zasadzie uczynią Cię jeszcze bardziej biegłym w ML poprzez połączenie Twojej głównie teoretycznej wiedzy z praktyczną implementacją. Niektóre z podstawowych konkursów, od których możesz zacząć na Kaggle, które pomogą Ci zbudować pewność siebie, są podane tutaj:

Titanic: Uczenie maszynowe od katastrofy: The Titanic: Machine Learning from Disaster challenge jest bardzo popularnym projektem dla początkujących ML, ponieważ ma wiele dostępnych samouczków. Jest to więc świetne wprowadzenie do koncepcji ML, takich jak eksploracja danych, inżynieria cech i dostrajanie modelu.
Digit Recognizer: The Digit Recognizer to projekt po tym, jak masz już pewną wiedzę na temat Pythona i podstaw ML. Jest to świetne wprowadzenie do ekscytującego świata sieci neuronowych przy użyciu klasycznego zestawu danych, który zawiera wstępnie wyodrębnione cechy.

Po ukończeniu tych zawodów i innych tego typu prostych wyzwań …Gratulacje!!! Jesteś na dobrej drodze, aby stać się pełnoprawnym inżynierem uczenia maszynowego i możesz nadal podnosić swoje umiejętności, pracując nad coraz większymi wyzwaniami i ostatecznie tworząc coraz bardziej kreatywne i trudne projekty uczenia maszynowego.

Wypróbuj zupełnie nowy GeeksforGeeks Premium!

Tagi artykułów :

Tagi ćwiczeniowe :