GeeksforGeeks

Arthur Samuel a inventat termenul „Machine Learning” în 1959 și l-a definit ca fiind un „Domeniu de studiu care oferă computerelor capacitatea de a învăța fără a fi programate în mod explicit”.

Și acesta a fost începutul Machine Learning! În vremurile moderne, Machine Learning este una dintre cele mai populare (dacă nu chiar cea mai populară!) alegere de carieră. Potrivit Indeed, Machine Learning Engineer este cel mai bun loc de muncă din 2019, cu o creștere de 344% și un salariu de bază mediu de 146.085 de dolari pe an.

Începând cu Machine Learning

Dar există încă multe îndoieli cu privire la ce anume este Machine Learning și cum să începi să o înveți? Așadar, acest articol tratează elementele de bază ale Machine Learning și, de asemenea, calea pe care o puteți urma pentru a deveni în cele din urmă un inginer de Machine Learning cu drepturi depline. Acum haideți să începem!!!

Ce este Machine Learning?

Machine Learning implică utilizarea inteligenței artificiale pentru a permite mașinilor să învețe o sarcină din experiență fără a le programa în mod specific despre acea sarcină. (Pe scurt, mașinile învață în mod automat fără a fi ținute de mână de către om!!!) Acest proces începe cu alimentarea lor cu date de bună calitate și apoi cu antrenarea mașinilor prin construirea diferitelor modele de învățare automată folosind datele și diferiți algoritmi. Alegerea algoritmilor depinde de tipul de date pe care le avem și de tipul de sarcină pe care încercăm să o automatizăm.

Cum să începi să înveți ML?

Aceasta este o foaie de parcurs aproximativă pe care o poți urma în drumul tău spre a deveni un inginer de învățare automată nespus de talentat. Desigur, puteți oricând să modificați pașii în funcție de nevoile dvs. pentru a ajunge la obiectivul final dorit!

Pasul 1 – Înțelegeți condițiile prealabile

În cazul în care sunteți un geniu, ați putea începe ML direct, dar, în mod normal, există câteva condiții prealabile pe care trebuie să le cunoașteți, care includ Algebra liniară, Calculul multivariat, Statistica și Python. Iar dacă nu le cunoașteți, nu vă temeți! Nu aveți nevoie de o diplomă de doctorat în aceste subiecte pentru a începe, dar aveți nevoie de o înțelegere de bază.

(a) Învățați Algebra liniară și Calculul multivariat

Atât Algebra liniară, cât și Calculul multivariat sunt importante în Machine Learning. Cu toate acestea, măsura în care aveți nevoie de ele depinde de rolul dumneavoastră ca cercetător de date. Dacă vă concentrați mai mult pe învățarea automatizată cu aplicații grele, atunci nu vă veți concentra atât de mult pe matematică, deoarece există multe biblioteci comune disponibile. Dar dacă doriți să vă concentrați pe R&D în Machine Learning, atunci stăpânirea algebrei liniare și a calculului multivariat este foarte importantă, deoarece va trebui să implementați mulți algoritmi ML de la zero.

(b) Învățați statistica

Datele joacă un rol imens în Machine Learning. De fapt, aproximativ 80% din timpul dvs. în calitate de expert ML va fi petrecut cu colectarea și curățarea datelor. Iar statistica este un domeniu care se ocupă de colectarea, analiza și prezentarea datelor. Așadar, nu este o surpriză faptul că trebuie să o învățați!!!
Câteva dintre conceptele cheie din statistică care sunt importante sunt Semnificația statistică, Distribuțiile de probabilitate, Testarea ipotezelor, Regresia etc. De asemenea, Gândirea Bayesiană este, de asemenea, o parte foarte importantă a ML care se ocupă de diverse concepte precum Probabilitatea Condiționată, Priori și Posterioare, Probabilitatea Maximă, etc.

(c) Învățați Python

Câteva persoane preferă să sară peste Algebra Lineară, Calculul Multivariat și Statistică și să le învețe pe parcurs, prin încercări și erori. Dar singurul lucru peste care nu puteți sări absolut deloc este Python! Deși există și alte limbaje pe care le puteți folosi pentru Machine Learning, cum ar fi R, Scala etc. Python este în prezent cel mai popular limbaj pentru ML. De fapt, există multe biblioteci Python care sunt utile în mod special pentru Inteligență Artificială și Machine Learning, cum ar fi Keras, TensorFlow, Scikit-learn etc.

Deci, dacă doriți să învățați ML, cel mai bine este să învățați Python! Puteți face acest lucru folosind diverse resurse și cursuri online, cum ar fi Fork Python disponibil gratuit pe GeeksforGeeks.

Pasul 2 – Învățați diverse concepte ML

Acum că ați terminat cu cerințele prealabile, puteți trece la învățarea efectivă a ML (Care este partea distractivă!!!) Cel mai bine este să începeți cu elementele de bază și apoi să treceți la lucrurile mai complicate. Unele dintre conceptele de bază în ML sunt:

(a) Terminologii ale învățării automate

  • Model – Un model este o reprezentare specifică învățată din date prin aplicarea unui anumit algoritm de învățare automată. Un model se mai numește și ipoteză.
  • Caracteristică – O caracteristică – O caracteristică este o proprietate individuală măsurabilă a datelor. Un set de caracteristici numerice poate fi descris în mod convenabil printr-un vector de caracteristici. Vectorii de caracteristici sunt introduși ca intrare în model. De exemplu, pentru a prezice un fruct, pot exista caracteristici precum culoarea, mirosul, gustul etc.
  • Target (Label) – O variabilă țintă sau o etichetă este valoarea care urmează să fie prezisă de modelul nostru. Pentru exemplul de fructe discutat în secțiunea privind caracteristicile, eticheta cu fiecare set de intrări ar fi numele fructului, cum ar fi măr, portocală, banană etc.
  • Formare – Ideea este de a da un set de intrări (caracteristici) și ieșirile așteptate (etichete), astfel încât, după formare, vom avea un model (ipoteză) care va cartografia apoi date noi la una dintre categoriile pe care s-a făcut formarea.
  • Predicție – Odată ce modelul nostru este gata, acesta poate fi alimentat cu un set de intrări la care va furniza o ieșire (etichetă) prezisă.

(b) Tipuri de învățare automată

  • Învățare supravegheată – Aceasta implică învățarea dintr-un set de date de instruire cu date etichetate folosind modele de clasificare și regresie. Acest proces de învățare continuă până când se atinge nivelul necesar de performanță.
  • Învățare nesupravegheată – Aceasta implică utilizarea de date neetichetate și apoi găsirea structurii subiacente din date pentru a învăța din ce în ce mai mult despre datele în sine, folosind modele de analiză factorială și de cluster.
  • Învățare semisupravegheată – Aceasta implică utilizarea de date neetichetate ca și învățarea nesupravegheată cu o cantitate mică de date etichetate. Utilizarea datelor etichetate crește foarte mult acuratețea învățării și este, de asemenea, mai eficientă din punct de vedere al costurilor decât învățarea supravegheată.
  • Învățarea prin întărire – Aceasta implică învățarea acțiunilor optime prin încercări și erori. Astfel, următoarea acțiune este decisă prin învățarea comportamentelor care se bazează pe starea curentă și care vor maximiza recompensa în viitor.

(c) Cum se practică învățarea automată?

  • Partea cea mai consumatoare de timp în ML este de fapt colectarea, integrarea, curățarea și preprocesarea datelor. Așadar, asigurați-vă că practicați acest lucru, deoarece aveți nevoie de date de înaltă calitate, dar cantitățile mari de date sunt adesea murdare. Deci aici se va duce cea mai mare parte a timpului dumneavoastră!!!
  • Învățați diverse modele și exersați pe seturi de date reale. Acest lucru vă va ajuta în crearea intuiției dvs. în jurul căror tipuri de modele sunt adecvate în diferite situații.
  • În paralel cu acești pași, este la fel de important să înțelegeți cum să interpretați rezultatele obținute prin utilizarea diferitelor modele. Acest lucru este mai ușor de realizat dacă înțelegeți diferiți parametri de reglare și metode de regularizare aplicate pe diferite modele.

(d) Resurse pentru învățarea învățării automate:

Există diverse resurse online și offline (atât gratuite, cât și plătite!) care pot fi folosite pentru a învăța Machine Learning. Unele dintre acestea sunt furnizate aici:

  • Pentru o introducere generală în Machine Learning, cursul de învățare automată de la Stanford de Andrew Ng este destul de popular. Se concentrează asupra învățării automate, a mineritului de date și a recunoașterii modelelor statistice, cu videoclipuri explicative sunt foarte utile pentru a clarifica teoria și conceptele de bază din spatele ML.
  • Dacă doriți un ghid de auto-studiu pentru Machine Learning, atunci Machine Learning Crash Course de la Google este bun pentru dvs. deoarece vă va oferi o introducere în învățarea automată cu prelegeri video, studii de caz din lumea reală și exerciții practice practice.
  • În cazul în care preferați un curs offline, cursul Geeksforgeeks Machine Learning Foundation va fi ideal pentru dvs. Acest curs vă va învăța despre diverse concepte de Machine Learning și, de asemenea, experiență practică în implementarea acestora într-un mediu de clasă.

Pasul 3 – Participați la concursuri

După ce ați înțeles noțiunile de bază ale Machine Learning, puteți trece la partea nebună!!!! Concursurile! Practic, acestea vă vor face să deveniți și mai pricepuți în ML prin combinarea cunoștințelor dvs. în mare parte teoretice cu implementarea practică. Unele dintre competițiile de bază cu care puteți începe pe Kaggle și care vă vor ajuta să vă dezvoltați încrederea sunt prezentate aici:

  • Titanic: Învățarea mașinilor din dezastru: Titanic: Provocarea Machine Learning from Disaster este un proiect pentru începători foarte popular pentru ML, deoarece are mai multe tutoriale disponibile. Deci, este o introducere excelentă în conceptele ML, cum ar fi explorarea datelor, ingineria caracteristicilor și reglarea modelelor.
  • Recunoscător de cifre: Recunoscătorul de cifre este un proiect după ce aveți unele cunoștințe de bază Python și ML. Este o introducere excelentă în lumea interesantă a rețelelor neuronale folosind un set de date clasic care include caracteristici pre-extracte.

După ce ați finalizat aceste concursuri și alte provocări atât de simple …Felicitări!!! Sunteți pe drumul cel bun pentru a deveni un inginer de Machine Learning cu drepturi depline și puteți continua să vă îmbunătățiți abilitățile lucrând la tot mai multe provocări și, în cele din urmă, creând proiecte de Machine Learning din ce în ce mai creative și mai dificile.

Încercați noul GeeksforGeeks Premium!

Articolul Tags :

Etichete de practică :

.

Lasă un răspuns

Adresa ta de email nu va fi publicată.