O Machine Learning ou Aprendizado de Máquinas (ML) tem a ver com a compreensão do que realmente pode ser interpretado a partir dos dados quando os conjuntos de dados são muito complexos. Portanto, sua aplicação básica é quando os conjuntos de dados são mais complexos e maiores do que as técnicas usuais podem lidar. 

O que é aprendizado de máquina? 

Machine Learning is the field that tries to define algorithms that can understand and make sense out of large and complex datasets. A computer must execute the algorithms.

A diferença geral entre a operação de Machine Learning e a regressão, por exemplo, é que o ML tem um conjunto particular de algoritmos que funcionam para aplicações específicas com tipos específicos de dados. 

Por exemplo, se cada registro em um conjunto de dados está relacionado entre si e todas as características prevêem o mesmo caminho para todos eles, a regressão funciona perfeitamente para a obtenção de resultados. 

O aprendizado de máquinas, por outro lado, trata de conjuntos de dados que são estruturados de forma que a correlação entre as variáveis seja diferente em cada segmento. 

Isso significa que o Aprendizado de Máquina pode compreender as diferentes características dos segmentos. Sendo esses pedidos, produtos, classes e informações. 

As classes de algoritmos de aprendizagem de máquinas 

Existem quatro classes fundamentais de algoritmos de aprendizagem de máquinas, e eles diferem na aplicação geral e no tipo de dados disponíveis. Eles são: 

  1. Classificação: atribuição de registros a grupos discretos pré-definidos. 
  1. Agrupamento: divisão dos registros em grupos discretos com base na similaridade, sem conhecimento prévio. 
  1. Regressão: previsão de valores de variáveis contínuas e discretas. 
  1. Associar aprendizagem: observar quais valores aparecem juntos com freqüência. 

Dentro das aulas há dois tipos principais diferentes, a aprendizagem supervisionada e a aprendizagem não supervisionada, sobre a qual falaremos a seguir. 

Supervisionado vs Sem supervisão  

A maior diferença entre os dois é se conhecemos os dados do resultado antes do tempo.  

Supervisionado  

No aprendizado supervisionado a idéia é que existe uma maneira de definir uma resposta correta, ou rótulo, nos dados de treinamento para obter o resultado específico que você está procurando. 

Por exemplo, o rótulo pode ser aplicado por uma pessoa que conhece o resultado esperado ou já existe no conjunto de dados. Portanto, estes dados etiquetados são usados para treinar um algoritmo usando feedback. 

Geralmente, o que o aprendizado supervisionado tenta fazer é olhar para as etiquetas dos resultados e descobrir as características do sublinhado dos dados de entrada e entender como eles levam a pedidos bem sucedidos. 

Após esse processo, é hora de testar o modelo em novos dados, procurando prever a etiqueta.  

Sem supervisão  

Por outro lado, sem supervisão, procura encontrar padrões previamente desconhecidos nos dados sem qualquer rótulo ou orientação. O resultado específico não está predefinido, mas o algoritmo procurará semelhanças em grupos de dados. 

Neste caso, o modelo não requer nenhum treinamento, teste e validação, justamente porque a resposta correta é desconhecida. 

Supervised Machine Learning workflow 

O fluxo de trabalho normal para um algoritmo supervisionado é tomar dados brutos e colocá-los alguns rótulos. Esses rótulos podem ser características da operação ou sucesso e falhas. 

Depois, essas duas coisas juntas para treinar o algoritmo que irá consolidar o modelo. Uma vez concluído esse treinamento, ele poderá proceder à avaliação.

A fase de avaliação consiste em dar novos dados ao modelo consolidado para ver como o modelo se sai bem na prática. Com os resultados, é possível definir se o modelo está correto ou não.

Finalmente, o modelo fará previsões sobre dados não rotulados e decidirá se os dados correspondem aos resultados esperados. 

Fluxo de trabalho de aprendizagem sem supervisão de máquinas 

Aqui os procedimentos são um pouco diferentes. Leva os dados brutos sem rótulo ou parâmetro específico. Em seguida, observa como todos os registros ou grupos de dados se relacionam uns com os outros. 

Então, do algoritmo, chegamos a um modelo. Neste caso, o modelo definirá limites em torno de tipos específicos de registros para encontrar sucessos e fracassos. 

O que o modelo fará é tentar rotular os clusters de diferenças de dados para utilizá-los na produção a fim de prever possíveis resultados. 

Em suma 

O aprendizado de máquinas é a técnica para extrair informações valiosas para grupos de dados. Principalmente quando o conjunto de dados é maior e mais complexo do que os modelos usuais podem lidar. 

O aprendizado supervisionado usa variáveis de resultados conhecidas como rótulos para identificar padrões e características relacionadas à variável. Sem supervisão, o valor do resultado é desconhecido, portanto, busca-se relações entre as variáveis de entrada. 

Em conclusão, máquina é fazer previsões ou aprender sobre dados novos, não rotulados. 

    [email protected]

    Belo Horizonte

    Rua Carlos Alves, 88 -101 – São José

    São Paulo

    Cubo Itaú – Alameda Vicente Pinzon, 54 – Vila Olímpia

    pt_BRPortuguese