Arthur Samuel a inventé le terme « Machine Learning » en 1959 et l’a défini comme un « Domaine d’étude qui donne aux ordinateurs la capacité d’apprendre sans être explicitement programmés ».
Et ce fut le début du Machine Learning ! À l’époque moderne, l’apprentissage automatique est l’un des choix de carrière les plus populaires (si ce n’est le plus !). Selon Indeed, l’ingénieur en apprentissage automatique est le meilleur emploi de 2019 avec une croissance de 344 % et un salaire de base moyen de 146 085 $ par an.
Mais il y a encore beaucoup de doutes sur ce qu’est exactement l’apprentissage automatique et comment commencer à l’apprendre ? Cet article traite donc des bases de l’apprentissage automatique et aussi du chemin que vous pouvez suivre pour éventuellement devenir un ingénieur en apprentissage automatique à part entière. Maintenant, commençons !!!
- Qu’est-ce que le Machine Learning ?
- Comment commencer à apprendre le ML?
- Étape 1 – Comprendre les prérequis
- (a) Apprenez l’algèbre linéaire et le calcul multivarié
- (b) Apprenez les statistiques
- (c) Apprenez Python
- Étape 2 – Apprendre divers concepts ML
- (a) Terminologies de l’apprentissage automatique
- (b) Types d’apprentissage automatique
- (c) Comment pratiquer l’apprentissage automatique ?
- (d) Ressources pour l’apprentissage du Machine Learning :
- Étape 3 – Participer à des concours
Qu’est-ce que le Machine Learning ?
Le Machine Learning implique l’utilisation de l’intelligence artificielle pour permettre aux machines d’apprendre une tâche à partir de l’expérience sans les programmer spécifiquement sur cette tâche. (En bref, les machines apprennent automatiquement sans l’aide de l’homme ! !!) Ce processus commence par leur fournir des données de bonne qualité, puis par former les machines en construisant divers modèles d’apprentissage automatique à l’aide des données et de différents algorithmes. Le choix des algorithmes dépend du type de données dont nous disposons et du type de tâche que nous essayons d’automatiser.
Comment commencer à apprendre le ML?
C’est une feuille de route approximative que vous pouvez suivre sur votre chemin pour devenir un ingénieur d’apprentissage automatique incroyablement talentueux. Bien sûr, vous pouvez toujours modifier les étapes en fonction de vos besoins pour atteindre votre objectif final souhaité !
Étape 1 – Comprendre les prérequis
Dans le cas où vous êtes un génie, vous pourriez commencer ML directement, mais normalement, il y a quelques prérequis que vous devez connaître qui comprennent l’algèbre linéaire, le calcul multivarié, les statistiques et Python. Et si vous ne les connaissez pas, n’ayez crainte ! Vous n’avez pas besoin d’un doctorat dans ces sujets pour commencer, mais vous devez avoir une compréhension de base.
(a) Apprenez l’algèbre linéaire et le calcul multivarié
L’algèbre linéaire et le calcul multivarié sont tous deux importants dans le Machine Learning. Cependant, la mesure dans laquelle vous en avez besoin dépend de votre rôle en tant que data scientist. Si vous vous concentrez davantage sur l’apprentissage automatique lourd d’application, alors vous ne serez pas si fortement concentré sur les mathématiques car il existe de nombreuses bibliothèques communes disponibles. Mais si vous voulez vous concentrer sur R&D en apprentissage automatique, alors la maîtrise de l’algèbre linéaire et du calcul multivarié est très importante car vous devrez mettre en œuvre de nombreux algorithmes ML à partir de zéro.
(b) Apprenez les statistiques
Les données jouent un rôle énorme dans l’apprentissage automatique. En fait, environ 80% de votre temps en tant qu’expert ML sera consacré à la collecte et au nettoyage des données. Et les statistiques sont un domaine qui gère la collecte, l’analyse et la présentation des données. Il n’est donc pas surprenant que vous deviez l’apprendre !!!
Certains des concepts clés des statistiques qui sont importants sont la signification statistique, les distributions de probabilités, les tests d’hypothèses, la régression, etc. De plus, la pensée bayésienne est également une partie très importante de ML qui traite de divers concepts comme la probabilité conditionnelle, les prieurs et les postérieurs, la vraisemblance maximale, etc.
(c) Apprenez Python
Certaines personnes préfèrent sauter l’algèbre linéaire, le calcul multivarié et les statistiques et les apprendre au fur et à mesure avec des essais et des erreurs. Mais la seule chose que vous ne pouvez absolument pas ignorer, c’est Python ! Bien qu’il existe d’autres langages que vous pouvez utiliser pour l’apprentissage automatique, comme R, Scala, etc. Python est actuellement le langage le plus populaire pour le ML. En fait, il existe de nombreuses bibliothèques Python qui sont spécifiquement utiles pour l’intelligence artificielle et l’apprentissage automatique, comme Keras, TensorFlow, Scikit-learn, etc.
Donc, si vous voulez apprendre le ML, il est préférable que vous appreniez Python ! Vous pouvez le faire en utilisant diverses ressources et cours en ligne tels que Fork Python disponible gratuitement sur GeeksforGeeks.
Étape 2 – Apprendre divers concepts ML
Maintenant que vous en avez fini avec les prérequis, vous pouvez passer à l’apprentissage effectif du ML (Ce qui est la partie amusante ! !!) Il est préférable de commencer par les bases et de passer ensuite aux choses plus compliquées. Voici quelques-uns des concepts de base du ML :
(a) Terminologies de l’apprentissage automatique
- Modèle – Un modèle est une représentation spécifique apprise à partir de données en appliquant un certain algorithme d’apprentissage automatique. Un modèle est également appelé une hypothèse.
- Fonctionnalité – Une fonctionnalité est une propriété individuelle mesurable des données. Un ensemble de caractéristiques numériques peut être décrit de manière pratique par un vecteur de caractéristiques. Les vecteurs de caractéristiques sont alimentés en entrée du modèle. Par exemple, pour prédire un fruit, il peut y avoir des caractéristiques comme la couleur, l’odeur, le goût, etc.
- Cible (étiquette) – Une variable ou étiquette cible est la valeur à prédire par notre modèle. Pour l’exemple du fruit discuté dans la section des caractéristiques, l’étiquette avec chaque ensemble d’entrée serait le nom du fruit comme la pomme, l’orange, la banane, etc.
- Formation – L’idée est de donner un ensemble d’entrées(caractéristiques) et ses sorties attendues(étiquettes), ainsi après la formation, nous aurons un modèle (hypothèse) qui va ensuite de nouvelles données à l’une des catégories formés sur.
- Prédiction – Une fois que notre modèle est prêt, il peut être alimenté par un ensemble d’entrées auxquelles il fournira une sortie prédite(étiquette).
(b) Types d’apprentissage automatique
- Apprentissage supervisé – Il s’agit d’apprendre à partir d’un ensemble de données d’entraînement avec des données étiquetées en utilisant des modèles de classification et de régression. Ce processus d’apprentissage se poursuit jusqu’à ce que le niveau de performance requis soit atteint.
- Apprentissage non supervisé – Il s’agit d’utiliser des données non étiquetées, puis de trouver la structure sous-jacente des données afin d’en apprendre toujours plus sur les données elles-mêmes à l’aide de modèles d’analyse factorielle et de cluster.
- Apprentissage semi-supervisé – Il s’agit d’utiliser des données non étiquetées comme l’apprentissage non supervisé avec une petite quantité de données étiquetées. L’utilisation de données étiquetées augmente considérablement la précision de l’apprentissage et est également plus rentable que l’apprentissage supervisé.
- Apprentissage par renforcement – Cela implique l’apprentissage d’actions optimales par essais et erreurs. Ainsi, la prochaine action est décidée en apprenant des comportements qui sont basés sur l’état actuel et qui maximiseront la récompense dans le futur.
(c) Comment pratiquer l’apprentissage automatique ?
- La partie la plus longue dans le ML est en fait la collecte, l’intégration, le nettoyage et le prétraitement des données. Assurez-vous donc de vous entraîner avec cela, car vous avez besoin de données de haute qualité, mais de grandes quantités de données sont souvent sales. C’est donc là que la plupart de votre temps ira !!!
- Apprendre divers modèles et s’exercer sur des ensembles de données réels. Cela vous aidera à créer votre intuition autour des types de modèles qui sont appropriés dans différentes situations.
- A côté de ces étapes, il est tout aussi important de comprendre comment interpréter les résultats obtenus en utilisant différents modèles. Cela est plus facile à faire si vous comprenez les différents paramètres de réglage et les méthodes de régularisation appliquées sur différents modèles.
(d) Ressources pour l’apprentissage du Machine Learning :
Il existe diverses ressources en ligne et hors ligne (gratuites et payantes !) qui peuvent être utilisées pour apprendre le Machine Learning. Certaines d’entre elles sont fournies ici :
- Pour une large introduction à l’apprentissage automatique, le cours d’apprentissage automatique de Stanford par Andrew Ng est assez populaire. Il se concentre sur l’apprentissage automatique, l’exploration de données et la reconnaissance statistique des formes avec des vidéos d’explication sont très utiles pour éclaircir la théorie et les concepts fondamentaux derrière ML.
- Si vous voulez un guide d’auto-apprentissage de l’apprentissage automatique, alors Machine Learning Crash Course de Google est bon pour vous car il vous fournira une introduction à l’apprentissage automatique avec des conférences vidéo, des études de cas du monde réel et des exercices pratiques.
- Dans le cas où vous préférez un cours hors ligne, le cours Geeksforgeeks Machine Learning Foundation sera idéal pour vous. Ce cours vous enseignera les différents concepts de l’apprentissage automatique et également une expérience pratique de leur mise en œuvre dans un environnement de classe.
Étape 3 – Participer à des concours
Après avoir compris les bases de l’apprentissage automatique, vous pouvez passer à la partie folle ! !! Les concours ! Ceux-ci vont essentiellement vous rendre encore plus compétent en ML en combinant vos connaissances principalement théoriques avec une mise en œuvre pratique. Certaines des compétitions de base avec lesquelles vous pouvez commencer sur Kaggle et qui vous aideront à renforcer votre confiance sont données ici :
- Titanic : L’apprentissage automatique à partir d’un désastre : Le défi Titanic : Machine Learning from Disaster challenge est un projet de débutant très populaire pour le ML car il a de multiples tutoriels disponibles. Il s’agit donc d’une excellente introduction aux concepts ML tels que l’exploration des données, l’ingénierie des caractéristiques et le réglage des modèles.
- Digit Recognizer : Le Digit Recognizer est un projet après que vous ayez une certaine connaissance de Python et des bases de ML. Il s’agit d’une excellente introduction au monde passionnant des réseaux neuronaux en utilisant un ensemble de données classique qui comprend des caractéristiques extraites au préalable.
Après avoir terminé ces concours et d’autres défis aussi simples …Félicitations ! !! Vous êtes en bonne voie pour devenir un ingénieur en apprentissage automatique à part entière et vous pouvez continuer à améliorer vos compétences en travaillant sur de plus en plus de défis et en créant éventuellement des projets d’apprentissage automatique de plus en plus créatifs et difficiles.