Arthur Samuel cunhou o termo “Machine Learning” em 1959 e definiu-o como um “Campo de estudo que dá aos computadores a capacidade de aprender sem ser explicitamente programado”.
E esse foi o início da Machine Learning! Nos tempos modernos, o Machine Learning é uma das escolhas de carreira mais populares (se não a mais popular!). De facto, Machine Learning Engineer Is The Best Job of 2019 com um crescimento de 344% e um salário base médio de $146,085 por ano.
Mas ainda há muitas dúvidas sobre o que é exactamente Machine Learning e como começar a aprendê-lo? Então este artigo trata das noções básicas de Machine Learning e também do caminho que você pode seguir para eventualmente se tornar um verdadeiro Machine Learning Engineer. Agora vamos começar!!!
- O que é Machine Learning?
- Como começar a aprender ML?
- Passo 1 – Entenda os Pré-requisitos
- (a) Aprenda Álgebra Linear e Cálculo Multivariado
- (b) Aprender Estatística
- (c) Aprenda Python
- Passo 2 – Aprenda Vários Conceitos de ML
- (a) Terminologias de Aprendizagem de Máquina
- (b) Tipos de Machine Learning
- (c) Como Praticar Aprendizagem de Máquina?
- (d) Recursos para a Aprendizagem da Máquina:
- Step 3 – Participe em Competições
O que é Machine Learning?
Machine Learning envolve o uso da Inteligência Artificial para permitir que as máquinas aprendam uma tarefa com a experiência sem programá-la especificamente sobre essa tarefa. (Em resumo, as Máquinas aprendem automaticamente sem a mão humana!!!) Este processo começa com a alimentação de dados de boa qualidade e depois o treino das máquinas através da construção de vários modelos de aprendizagem de máquinas usando os dados e diferentes algoritmos. A escolha dos algoritmos depende do tipo de dados que temos e que tipo de tarefa estamos a tentar automatizar.
Como começar a aprender ML?
Este é um roteiro rudimentar que você pode seguir no seu caminho para se tornar um Engenheiro de Aprendizagem de Máquinas insanamente talentoso. Claro, você sempre pode modificar os passos de acordo com suas necessidades para atingir o objetivo final desejado!
Passo 1 – Entenda os Pré-requisitos
No caso de você ser um gênio, você poderia começar ML diretamente, mas normalmente, há alguns pré-requisitos que você precisa saber que incluem Álgebra Linear, Cálculo Multivariado, Estatística e Python. E se você não os conhece, nunca tenha medo! Você não precisa de um Ph.D. nestes tópicos para começar, mas você precisa de um entendimento básico.
(a) Aprenda Álgebra Linear e Cálculo Multivariado
A Álgebra Linear e o Cálculo Multivariado são importantes no Aprendizado Mecânico. No entanto, a medida em que você precisa deles depende do seu papel como um cientista de dados. Se você estiver mais focado na aprendizagem de máquinas pesadas de aplicação, então você não estará tão focado em matemática, pois existem muitas bibliotecas comuns disponíveis. Mas se você quiser focar em R&D no Aprendizado de Máquinas, então o domínio da Álgebra Linear e Cálculo Multivariado é muito importante, pois você terá que implementar muitos algoritmos ML do zero.
(b) Aprender Estatística
Data desempenha um papel enorme no Aprendizado de Máquinas. Na verdade, cerca de 80% do seu tempo como um especialista em ML será gasto na recolha e limpeza de dados. E a estatística é um campo que lida com a recolha, análise e apresentação de dados. Portanto, não é surpresa que você precise aprender!!!
Alguns dos conceitos-chave em estatística que são importantes são Significância Estatística, Distribuições de Probabilidade, Teste de Hipóteses, Regressão, etc. Além disso, o Pensamento Bayesiano também é uma parte muito importante do ML que lida com vários conceitos como Probabilidade Condicional, Priores e Posteriores, Máxima Probabilidade, etc.
(c) Aprenda Python
algumas pessoas preferem saltar Álgebra Linear, Cálculo Multivariado e Estatística e aprendê-los à medida que vão avançando com tentativas e erros. Mas a única coisa que você absolutamente não pode pular é Python! Enquanto existem outras linguagens que você pode usar para Aprendizado Mecânico como R, Scala, etc. Python é atualmente a linguagem mais popular para o ML. Na verdade, existem muitas bibliotecas Python que são especificamente úteis para Inteligência Artificial e Aprendizagem de Máquina como Keras, TensorFlow, Scikit-learn, etc.
Então, se você quer aprender ML, é melhor se você aprender Python! Você pode fazer isso usando vários recursos online e cursos como o Fork Python disponível gratuitamente no GeeksforGeeks.
Passo 2 – Aprenda Vários Conceitos de ML
Agora que você tenha terminado com os pré-requisitos, você pode passar a aprender realmente ML (Que é a parte divertida!!!!) É melhor começar com o básico e depois passar para as coisas mais complicadas. Alguns dos conceitos básicos no ML são:
(a) Terminologias de Aprendizagem de Máquina
- Modelo – Um modelo é uma representação específica aprendida a partir de dados aplicando algum algoritmo de aprendizagem de máquina. Um modelo também é chamado de hipótese.
- Característica – Uma característica é uma propriedade individual mensurável dos dados. Um conjunto de características numéricas pode ser convenientemente descrito por um vetor de característica. Os vetores de característica são alimentados como entrada para o modelo. Por exemplo, para prever uma fruta, pode haver características como cor, cheiro, sabor, etc.
- Target (Label) – Uma variável alvo ou etiqueta é o valor a ser previsto pelo nosso modelo. Para o exemplo de fruta discutido na seção de características, a etiqueta com cada conjunto de input seria o nome da fruta como maçã, laranja, banana, etc.
- Treinamento – A idéia é dar um conjunto de inputs(características) e seus outputs(rótulos) esperados, então após o treinamento, teremos um modelo (hipótese) que irá mapear novos dados para uma das categorias treinadas.
- Predição – Uma vez que nosso modelo esteja pronto, ele pode ser alimentado com um conjunto de inputs para os quais ele fornecerá uma saída prevista(label).
(b) Tipos de Machine Learning
- Aprendizagem supervisionada – Isso envolve aprender com um conjunto de dados de treinamento com dados rotulados usando modelos de classificação e regressão. Este processo de aprendizagem continua até que o nível de desempenho exigido seja alcançado.
- Aprendizagem não supervisionada – Isto envolve o uso de dados não etiquetados e depois encontrar a estrutura subjacente nos dados a fim de aprender mais e mais sobre os dados em si usando modelos de análise de fatores e clusters.
- Aprendizagem Semi-supervisionada – Isto envolve o uso de dados não etiquetados como Aprendizagem não supervisionada com uma pequena quantidade de dados etiquetados. O uso de dados etiquetados aumenta enormemente a precisão do aprendizado e também é mais econômico que o Aprendizado Supervisionado.
- Aprendizado Reforçado – Isto envolve aprender ações ótimas através de tentativa e erro. Então a próxima ação é decidida através de comportamentos de aprendizagem que são baseados no estado atual e que irão maximizar a recompensa no futuro.
(c) Como Praticar Aprendizagem de Máquina?
- A parte mais demorada no ML é na verdade a coleta de dados, integração, limpeza e pré-processamento. Então certifique-se de praticar com isso porque você precisa de dados de alta qualidade, mas grandes quantidades de dados são muitas vezes sujos. Então é aqui que a maior parte do seu tempo irá!!!
- Aprenda vários modelos e pratique em conjuntos de dados reais. Isto irá ajudá-lo a criar a sua intuição em torno de que tipos de modelos são apropriados em diferentes situações.
- Durante estes passos, é igualmente importante compreender como interpretar os resultados obtidos utilizando diferentes modelos. Isto é mais fácil de fazer se você entender vários parâmetros de ajuste e métodos de regularização aplicados em diferentes modelos.
(d) Recursos para a Aprendizagem da Máquina:
Existem vários recursos online e offline (tanto gratuitos como pagos!) que podem ser utilizados para aprender Aprendizagem com Máquina. Alguns deles são fornecidos aqui:
- Para uma ampla introdução ao Machine Learning, o Curso de Aprendizagem Máquina de Stanford por Andrew Ng é bastante popular. Ele se concentra no aprendizado de máquinas, mineração de dados e reconhecimento de padrões estatísticos com vídeos explicativos são muito úteis no esclarecimento da teoria e conceitos centrais por trás do ML.
- Se você quiser um guia de auto-estudo para o Machine Learning, então o Machine Learning Crash Course do Google é bom para você, pois ele lhe dará uma introdução ao aprendizado de máquinas com palestras em vídeo, estudos de casos reais e exercícios práticos práticos.
- No caso de você preferir um curso offline, o curso Geeksforgeeks Machine Learning Foundation será ideal para você. Este curso irá ensiná-lo sobre vários conceitos de Machine Learning e também experiência prática na sua implementação num ambiente de sala de aula.
Step 3 – Participe em Competições
Depois de ter entendido os conceitos básicos de Machine Learning, você pode passar para a parte louca!!! Competições! Basicamente, estes torná-lo-ão ainda mais proficiente no ML, combinando os seus conhecimentos, na sua maioria teóricos, com a implementação prática. Algumas das competições básicas com as quais pode começar no Kaggle que o ajudarão a construir confiança são dadas aqui:
- Titanic: Aprendizagem Máquina a partir de Desastre: O Titanic: Machine Learning from Disaster challenge é um projeto muito popular para iniciantes do ML, pois tem vários tutoriais disponíveis. Então é uma ótima introdução aos conceitos do ML como exploração de dados, engenharia de características e ajuste de modelos.
- Digit Recognizer: O Digit Recognizer é um projeto depois de você ter algum conhecimento dos conceitos básicos de Python e ML. É uma grande introdução às excitantes redes neurais mundiais usando um conjunto de dados clássico que inclui funcionalidades pré-extraídas.
Após ter completado estas competições e outros desafios tão simples …Parabéns!! Você está no caminho certo para se tornar um Engenheiro de Aprendizagem de Máquina completo e você pode continuar melhorando suas habilidades trabalhando em mais e mais desafios e eventualmente criando mais e mais projetos de Aprendizagem de Máquina criativos e difíceis.
Try out the all-new GeeksforGeeks Premium!