GeeksforGeeks

Arthur Samuel bedacht de term “Machine Learning” in 1959 en definieerde het als een “vakgebied dat computers het vermogen geeft om te leren zonder expliciet geprogrammeerd te worden”.

En dat was het begin van Machine Learning! In de moderne tijd is Machine Learning een van de meest populaire (zo niet de meest!) carrièrekeuzes. Volgens Indeed is Machine Learning Engineer The Best Job of 2019 met een groei van 344% en een gemiddeld basissalaris van $146.085 per jaar.

Getting Started with Machine Learning

Maar er is nog veel twijfel over wat Machine Learning nu precies is en hoe je het moet gaan leren? Daarom behandelen we in dit artikel de basisprincipes van Machine Learning en ook het pad dat je kunt volgen om uiteindelijk een volwaardige Machine Learning Engineer te worden. Laten we nu beginnen!!!

Wat is Machine Learning?

Machine Learning behelst het gebruik van Kunstmatige Intelligentie om machines in staat te stellen een taak uit ervaring te leren zonder ze specifiek over die taak te programmeren. (Kortom, machines leren automatisch, zonder menselijke begeleiding!!!) Dit proces begint met het voeden van de machines met gegevens van goede kwaliteit en vervolgens het trainen van de machines door het bouwen van verschillende machine learning modellen met behulp van de gegevens en verschillende algoritmen. De keuze van de algoritmes hangt af van wat voor soort data we hebben en wat voor soort taak we proberen te automatiseren.

Hoe begin je met het leren van ML?

Dit is een ruw stappenplan dat je kunt volgen op je weg om een waanzinnig getalenteerde Machine Learning Engineer te worden. Natuurlijk kun je de stappen altijd aanpassen aan je behoeften om je gewenste einddoel te bereiken!

Stap 1 – Begrijp de vereisten

In het geval dat je een genie bent, kun je direct met ML beginnen, maar normaal gesproken zijn er enkele vereisten die je moet kennen, waaronder Lineaire Algebra, Multivariate Calculus, Statistiek, en Python. En als je deze niet kent, geen angst! Je hoeft geen Ph.D. in deze onderwerpen te hebben om te kunnen beginnen, maar je hebt wel een basiskennis nodig.

(a) Leer Lineaire Algebra en Multivariate Calculus

Zowel Lineaire Algebra als Multivariate Calculus zijn belangrijk bij Machine Learning. De mate waarin je ze nodig hebt, hangt echter af van je rol als data scientist. Als je meer gericht bent op applicatie zwaar machine learning, dan zal je niet zo sterk gericht zijn op wiskunde omdat er veel gemeenschappelijke bibliotheken beschikbaar zijn. Maar als je je wilt richten op R&D in Machine Learning, dan is beheersing van Lineaire Algebra en Multivariate Calculus erg belangrijk omdat je veel ML-algoritmen vanaf nul zult moeten implementeren.

(b) Leer Statistiek

Data speelt een enorme rol in Machine Learning. In feite zal ongeveer 80% van je tijd als ML-expert worden besteed aan het verzamelen en opschonen van gegevens. En statistiek is een vakgebied dat zich bezighoudt met het verzamelen, analyseren en presenteren van gegevens. Het is dus geen verrassing dat je het moet leren!!!
Enkele van de belangrijkste concepten in de statistiek die belangrijk zijn, zijn Statistical Significance, Probability Distributions, Hypothesis Testing, Regression, etc. Bayesiaans denken is ook een zeer belangrijk onderdeel van ML, dat zich bezighoudt met verschillende concepten zoals conditionele waarschijnlijkheid, Priors en Posteriors, maximale waarschijnlijkheid, enz.

(c) Leer Python

Sommige mensen geven er de voorkeur aan om Lineaire Algebra, Multivariate Calculus en Statistiek over te slaan en ze gaandeweg te leren met vallen en opstaan. Maar het enige dat je absoluut niet mag overslaan is Python! Hoewel er andere talen zijn die je kunt gebruiken voor Machine Learning zoals R, Scala, enz. Python is momenteel de meest populaire taal voor ML. In feite zijn er veel Python bibliotheken die specifiek nuttig zijn voor Artificial Intelligence en Machine Learning, zoals Keras, TensorFlow, Scikit-learn, enz.

Dus als je ML wilt leren, kun je het beste Python leren! Je kunt dat doen met behulp van verschillende online bronnen en cursussen, zoals Fork Python gratis beschikbaar op GeeksforGeeks.

Step 2 – Leer verschillende ML-concepten

Nu je klaar bent met de randvoorwaarden, kun je verdergaan met het daadwerkelijk leren van ML (Wat het leuke deel is!!!) Het is het beste om te beginnen met de basis en dan verder te gaan met de meer ingewikkelde dingen. Enkele basisbegrippen in ML zijn:

(a) Terminologieën van Machine Learning

  • Model – Een model is een specifieke representatie die uit gegevens wordt geleerd door toepassing van een of ander machine learning algoritme. Een model wordt ook wel een hypothese genoemd.
  • Feature – Een feature is een individuele meetbare eigenschap van de gegevens. Een reeks numerieke kenmerken kan gemakkelijk worden beschreven door een kenmerkvector. Feature vectoren worden als input aan het model toegevoerd. Om bijvoorbeeld een vrucht te voorspellen, kunnen er kenmerken zijn als kleur, geur, smaak, enz.
  • Doel (Label) – Een doelvariabele of label is de waarde die door ons model moet worden voorspeld. Voor het fruit voorbeeld besproken in de functie sectie, het label met elke set van input zou de naam van de vrucht, zoals appel, sinaasappel, banaan, etc.
  • Training – Het idee is om een set van inputs (kenmerken) en de verwachte outputs (labels), dus na de opleiding, zullen we een model (hypothese) die vervolgens zal nieuwe gegevens in kaart brengen om een van de categorieën getraind op.
  • Voorspelling – Zodra ons model klaar is, kan het worden gevoed met een reeks inputs waaraan het een voorspelde output (label) zal geven.

(b) Soorten Machine Learning

  • Begeleid leren – Hierbij wordt geleerd van een trainingsdataset met gelabelde gegevens met behulp van classificatie- en regressiemodellen. Dit leerproces gaat door totdat het vereiste prestatieniveau is bereikt.
  • Unsupervised Learning – Hierbij worden ongelabelde gegevens gebruikt en wordt de onderliggende structuur in de gegevens gevonden om steeds meer over de gegevens zelf te leren met behulp van factor- en clusteranalysemodellen.
  • Semi-supervised Learning – Hierbij worden net als bij Unsupervised Learning ongelabelde gegevens gebruikt met een kleine hoeveelheid gelabelde gegevens. Het gebruik van gelabelde data verhoogt de leernauwkeurigheid enorm en is ook kosteneffectiever dan Supervised Learning.
  • Reinforcement Learning – Hierbij worden optimale acties geleerd door trial and error. Dus de volgende actie wordt bepaald door het leren van gedrag dat is gebaseerd op de huidige toestand en dat de beloning in de toekomst zal maximaliseren.

(c) Hoe Machine Learning te oefenen?

  • Het meest tijdrovende deel in ML is eigenlijk het verzamelen, integreren, opschonen en voorbewerken van gegevens. Zorg er dus voor dat je hiermee oefent, want je hebt data van hoge kwaliteit nodig, maar grote hoeveelheden data zijn vaak vies. Dus dit is waar de meeste van uw tijd zal gaan!!!
  • Leer verschillende modellen en oefenen op echte datasets. Dit zal je helpen bij het creëren van je intuïtie rond welke soorten modellen geschikt zijn in verschillende situaties.
  • Naast deze stappen is het even belangrijk om te begrijpen hoe je de resultaten moet interpreteren die worden verkregen door verschillende modellen te gebruiken. Dit is gemakkelijker te doen als je de verschillende afstemmingsparameters en regularisatiemethoden die op verschillende modellen worden toegepast, begrijpt.

(d) Bronnen voor het leren van Machine Learning:

Er zijn verschillende online en offline bronnen (zowel gratis als betaald!) die kunnen worden gebruikt om Machine Learning te leren. Enkele daarvan worden hier gegeven:

  • Voor een brede inleiding in Machine Learning is Stanford’s Machine Learning Course van Andrew Ng vrij populair. Het richt zich op machine learning, data mining, en statistische patroonherkenning met uitleg video’s zijn zeer behulpzaam bij het opruimen van de theorie en de kernbegrippen achter ML.
  • Als u een zelfstudie gids voor Machine Learning, dan Machine Learning Crash Course van Google is goed voor je als het zal u een inleiding tot machine learning met video lezingen, real-world case studies, en hands-on praktijkoefeningen.
  • In het geval dat u liever een offline cursus, zal de Geeksforgeeks Machine Learning Foundation cursus zijn ideaal voor je. Deze cursus leert je over verschillende concepten van Machine Learning en ook praktische ervaring in het implementeren ervan in een klassikale omgeving.

Stap 3 – Doe mee aan Competities

Nadat je de basis van Machine Learning hebt begrepen, kun je overgaan naar het te gekke gedeelte!!! Competities! Deze zullen je in principe nog meer bekwamen in ML door je voornamelijk theoretische kennis te combineren met praktische implementatie. Een aantal van de basiscompetities waarmee je kunt beginnen op Kaggle die je zullen helpen vertrouwen op te bouwen worden hier gegeven:

  • Titanic: Machine Leren van Ramp: De Titanic: Machine Learning from Disaster challenge is een zeer populair beginnersproject voor ML omdat het meerdere tutorials beschikbaar heeft. Het is dus een geweldige introductie tot ML-concepten zoals data-exploratie, feature engineering, en model tuning.
  • Digit Recognizer: De Digit Recognizer is een project nadat je enige kennis hebt van Python en ML-basics. Het is een geweldige introductie in de spannende wereld van neurale netwerken met behulp van een klassieke dataset die vooraf geëxtraheerde features bevat.

Nadat je deze wedstrijden en andere dergelijke eenvoudige uitdagingen hebt voltooid …Gefeliciteerd!!! Je bent goed op weg om een volwaardige Machine Learning Engineer te worden en je kunt je vaardigheden blijven verbeteren door aan steeds meer uitdagingen te werken en uiteindelijk steeds creatievere en moeilijkere Machine Learning-projecten te maken.

Probeer het gloednieuwe GeeksforGeeks Premium!

Artikel tags :

Oefen Tags :

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.