GeeksforGeeks

Arthur Samuel 1959-ben alkotta meg a “gépi tanulás” kifejezést, és úgy definiálta, hogy “az a tudományterület, amely a számítógépeket képessé teszi a tanulásra anélkül, hogy kifejezetten programoznák őket”.

És ez volt a gépi tanulás kezdete! Napjainkban a gépi tanulás az egyik legnépszerűbb (ha nem a legnépszerűbb!) pályaválasztás. Az Indeed szerint a Machine Learning Engineer 2019 legjobb állása, 344%-os növekedéssel és évi 146 085 dolláros átlagos alapfizetéssel.

Elkezdeni a gépi tanulással

De még mindig sokan kételkednek abban, hogy pontosan mi is az a Machine Learning, és hogyan kezdjük el tanulni? Ezért ez a cikk a gépi tanulás alapjaival foglalkozik, valamint azzal az úttal, amelyet követve végül teljes értékű gépi tanuló mérnökké válhatsz. Most pedig vágjunk bele!!!

Mi az a gépi tanulás?

A gépi tanulás a mesterséges intelligencia felhasználásával lehetővé teszi a gépek számára, hogy tapasztalatból megtanuljanak egy feladatot anélkül, hogy kifejezetten az adott feladatra programoznák őket. (Röviden: A gépek automatikusan tanulnak emberi kéztartás nélkül!!!) Ez a folyamat azzal kezdődik, hogy jó minőségű adatokkal tápláljuk őket, majd az adatok és különböző algoritmusok felhasználásával különböző gépi tanulási modelleket építve betanítjuk a gépeket. Az algoritmusok kiválasztása attól függ, hogy milyen típusú adatokkal rendelkezünk és milyen feladatot próbálunk automatizálni.

Hogyan kezdjünk el ML-t tanulni?

Ez egy durva útiterv, amit követhetsz azon az úton, hogy őrülten tehetséges gépi tanuló mérnökké válj. Természetesen bármikor módosíthatod a lépéseket az igényeidnek megfelelően, hogy elérd a kívánt végcélt!

1. lépés – Értsd meg az előfeltételeket

Ha zseni vagy, akkor közvetlenül is belevághatsz az ML-be, de általában van néhány előfeltétel, amit ismerned kell, ezek közé tartozik a lineáris algebra, a többváltozós számtan, a statisztika és a Python. És ha ezeket nem ismered, ne félj! Nincs szükséged doktori fokozatra ezekből a témákból ahhoz, hogy belevágj, de alapvető ismeretekre igen.

(a) Tanulj lineáris algebrát és többváltozós számítást

A lineáris algebra és a többváltozós számítás egyaránt fontos a gépi tanulásban. Az azonban, hogy milyen mértékben van rájuk szükséged, attól függ, hogy milyen szerepet töltesz be adattudósként. Ha inkább az alkalmazásigényes gépi tanulásra koncentrálsz, akkor nem fogsz olyan erősen a matematikára koncentrálni, mivel sok közös könyvtár áll rendelkezésre. De ha a gépi tanulásban az R&D-re akarsz összpontosítani, akkor a lineáris algebra és a többváltozós számítás elsajátítása nagyon fontos, mivel sok ML-algoritmust kell majd a semmiből implementálnod.

(b) Tanulj statisztikát

Az adatok óriási szerepet játszanak a gépi tanulásban. Valójában ML-szakértőként az időd körülbelül 80%-át az adatok gyűjtésével és tisztításával fogod tölteni. A statisztika pedig egy olyan terület, amely az adatok gyűjtésével, elemzésével és bemutatásával foglalkozik. Így nem meglepő, hogy meg kell tanulnod!!!
A statisztika néhány fontos kulcsfogalma a statisztikai szignifikancia, a valószínűségi eloszlások, a hipotézisvizsgálat, a regresszió stb. Emellett a Bayes-i gondolkodás is nagyon fontos része az ML-nek, amely olyan különböző fogalmakkal foglalkozik, mint a feltételes valószínűség, a priorok és a poszteriorok, a maximális valószínűség stb.

(c) Tanulj Pythont

Néhányan inkább kihagyják a lineáris algebrát, a többváltozós számítást és a statisztikát, és menet közben, próbálgatással tanulják meg őket. De az egyetlen dolog, amit semmiképpen sem hagyhatsz ki, az a Python! Bár vannak más nyelvek is, amelyeket a gépi tanuláshoz használhatsz, mint például az R, a Scala stb. a Python jelenleg a legnépszerűbb nyelv az ML számára. Valójában számos olyan Python könyvtár létezik, amely kifejezetten a mesterséges intelligencia és a gépi tanulás számára hasznos, mint például a Keras, a TensorFlow, a Scikit-learn stb.

Szóval, ha ML-t szeretnél tanulni, a legjobb, ha Pythont tanulsz! Ezt különböző online források és tanfolyamok segítségével teheted meg, mint például a GeeksforGeeks-en ingyenesen elérhető Fork Python.

2. lépés – Különböző ML fogalmak megtanulása

Most, hogy végeztél az előfeltételekkel, áttérhetsz az ML tényleges tanulására (ami a szórakoztató rész!!!) A legjobb, ha az alapokkal kezded, majd áttérsz a bonyolultabb dolgokra. Az ML néhány alapfogalma a következő:

(a) A gépi tanulás terminológiái

  • Modell – A modell az adatokból valamilyen gépi tanulási algoritmus alkalmazásával megtanult speciális reprezentáció. A modellt hipotézisnek is nevezik.
  • Feature – A feature az adatok egy egyedi mérhető tulajdonsága. A numerikus jellemzők halmaza kényelmesen leírható egy jellemzővektorral. A feature-vektorokat a modell bemenetként kapja. Például egy gyümölcs előrejelzéséhez olyan jellemzők lehetnek, mint a szín, az illat, az íz stb.
  • Cél (címke) – A célváltozó vagy címke az az érték, amelyet a modellünk megjósol. A jellemzőkkel foglalkozó részben tárgyalt gyümölcsös példánál a címke minden bemeneti készlethez a gyümölcs neve lenne, mint például alma, narancs, banán stb.
  • Képzés – Az ötlet az, hogy megadjuk a bemenetek (jellemzők) és a várható kimenetek (címkék) készletét, így a képzés után lesz egy modellünk (hipotézis), amely aztán az új adatokat a képzett kategóriák egyikéhez fogja rendelni.
  • Előrejelzés – Ha a modellünk elkészült, betáplálhatunk vele egy bemeneti halmazt, amelyre egy előre jelzett kimenetet(címkét) fog adni.

(b) A gépi tanulás típusai

  • Felügyelt tanulás – Ez egy címkézett adatokkal ellátott képzési adathalmazból való tanulást jelent osztályozási és regressziós modellek segítségével. Ez a tanulási folyamat addig folytatódik, amíg a kívánt teljesítményszintet el nem érjük.
  • Felügyelet nélküli tanulás – Ez a címkézetlen adatok felhasználását jelenti, majd az adatok mögöttes struktúrájának megtalálását annak érdekében, hogy egyre többet tanuljunk magáról az adatról faktor- és klaszterelemzési modellek segítségével.
  • Félig felügyelt tanulás – Ez a felügyelet nélküli tanuláshoz hasonlóan címkézetlen adatok felhasználását jelenti, kis mennyiségű címkézett adatokkal. A címkézett adatok használata jelentősen növeli a tanulási pontosságot, és költséghatékonyabb is, mint a felügyelt tanulás.
  • Erősítéses tanulás – Ez az optimális cselekvések tanulását jelenti próba és hiba útján. Tehát a következő akciót az aktuális állapotra épülő és a jövőben a jutalmat maximalizáló viselkedések megtanulása dönti el.

(c) Hogyan gyakoroljuk a gépi tanulást?

  • A legidőigényesebb rész az ML-ben valójában az adatgyűjtés, integrálás, tisztítás és előfeldolgozás. Tehát mindenképpen gyakorolj ezzel, mert jó minőségű adatokra van szükséged, de a nagy mennyiségű adat gyakran piszkos. Tehát erre fog menni a legtöbb időd!!!
  • Tanulj meg különböző modelleket és gyakorolj valódi adathalmazokon. Ez segíteni fog Önnek abban, hogy kialakítsa intuícióját azzal kapcsolatban, hogy milyen típusú modellek megfelelőek a különböző helyzetekben.
  • Ezekkel a lépésekkel együtt ugyanilyen fontos megérteni, hogyan kell értelmezni a különböző modellek használatával kapott eredményeket. Ez könnyebben megy, ha megérti a különböző modelleken alkalmazott különböző hangolási paramétereket és regularizációs módszereket.

(d) Források a gépi tanulás tanulásához:

A gépi tanulás elsajátításához különböző online és offline források (ingyenes és fizetős!) állnak rendelkezésre. Ezek közül néhányat itt közlünk:

  • A gépi tanulás széleskörű bevezetéséhez elég népszerű a Stanford’s Machine Learning Course by Andrew Ng. A gépi tanulásra, adatbányászatra és statisztikai mintafelismerésre összpontosít, a magyarázó videókkal nagyon hasznosak az ML mögötti elmélet és alapfogalmak tisztázásában.
  • Ha önképzős útmutatót szeretne a gépi tanuláshoz, akkor a Google Machine Learning Crash Course jó választás, mivel videós előadásokkal, valós esettanulmányokkal és gyakorlati feladatokkal vezet be a gépi tanulásba.
  • Ha inkább offline tanfolyamot szeretne, akkor a Geeksforgeeks Machine Learning Foundation kurzusa ideális lesz az Ön számára. Ez a tanfolyam megtanít a gépi tanulás különböző fogalmaira, és gyakorlati tapasztalatokat is szerezhetsz azok tantermi környezetben történő megvalósításáról.

3. lépés – Vegyél részt versenyeken

Miután megértetted a gépi tanulás alapjait, jöhet az őrült rész!!! Versenyek! Ezek alapvetően még jobban elsajátíthatod az ML-t azáltal, hogy a többnyire elméleti tudásodat összekapcsolod a gyakorlati megvalósítással. Néhány alapvető versenyt, amelyekkel a Kaggle-en kezdhetsz, és amelyek segítenek az önbizalmad növelésében, itt találsz:

  • Titanic: Gépi tanulás a katasztrófából: A Titanic: Machine Learning from Disaster kihívás egy nagyon népszerű kezdő ML projekt, mivel több oktatóanyag is elérhető hozzá. Így remek bevezetés az olyan ML fogalmakba, mint az adatfeltárás, a feature engineering és a modellhangolás.
  • Digit Recognizer: A Digit Recognizer egy olyan projekt, miután rendelkezel némi Python és ML alapismerettel. Ez egy nagyszerű bevezetés a neurális hálózatok izgalmas világába egy klasszikus adatkészlet segítségével, amely előre kivont jellemzőket tartalmaz.

Azután, hogy teljesítette ezeket a versenyeket és más ilyen egyszerű kihívásokat … Gratulálunk!!! Jó úton haladsz afelé, hogy teljes értékű gépi tanulási mérnökké válj, és tovább fejlesztheted képességeidet azáltal, hogy egyre több és több kihíváson dolgozol, és végül egyre kreatívabb és nehezebb gépi tanulási projekteket készítesz.

Kipróbáld a teljesen új GeeksforGeeks Premiumot!

Cikk címkék :

Gyakorlat Címkék :

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.