Aprendizagem supervisionada e aprendizagem de máquina não supervisionada

Conteúdo

Introdução

¿Cuál es la diferencia entre el aprendizagem supervisionada e ele Aprendizado não supervisionado?”

Esta é uma pergunta muito comum entre iniciantes e recém-chegados em aprendizado de máquina. A resposta para isso está no cerne da compreensão da essência dos algoritmos de aprendizado de máquina.. Sem uma distinção clara entre este aprendizado supervisionado e aprendizado não supervisionado, sua jornada simplesmente não pode progredir.

Na realidade, esta é uma das primeiras coisas que você deve aprender ao embarcar em sua jornada de aprendizado de máquina. Não podemos simplesmente pular para a fase de construção do modelo se não entendermos onde estão os algoritmos como a regressão linear., regressão logística, o agrupamento, redes neurais, etc.

supervisionado vs não supervisionado-1959390

Se não sabemos qual é o objetivo do algoritmo de aprendizado de máquina, falharemos em nosso esforço para construir um modelo preciso. É aqui que surge a ideia da aprendizagem supervisionada e da aprendizagem não supervisionada..

Neste artigo, Vou discutir esses dois conceitos usando exemplos e também responder à grande questão: Como decidir quando usar o aprendizado supervisionado ou não supervisionado?

Se você preferir aprender em forma de vídeo, o vídeo a seguir explica 10 algoritmos de aprendizado de máquina de uma maneira muito fácil de entender:

Mencionei alguns recursos excelentes abaixo que são ótimos para se referir a um novato no aprendizado de máquina.:

Vamos começar dando uma olhada no aprendizado supervisionado.

O que é aprendizagem supervisionada?

Na aprendizagem supervisionada, o computador é ensinado por exemplo. Aprenda com os dados anteriores e aplique o aprendizado aos dados atuais para prever eventos futuros. Neste caso, os dados de entrada e saída desejados ajudam a prever eventos futuros.

Para obter previsões precisas, os dados de entrada são marcados ou marcados como a resposta correta.

um algoritmo de aprendizado supervisionado típico-2301591

Categorização supervisionada de aprendizado de máquina

É importante lembrar que todos os algoritmos de aprendizagem supervisionada são algoritmos essencialmente complexos., categorizado como modelos de classificação ou regressão.

1) Modelos de classificaçãoLos modelos de clasificación se utilizan para problemas en los que la variável de salida se puede categorizar, O que “sim” o “Não”, o “Acontece” o “Não passa”. Modelos de classificação são usados ​​para prever a categoria de dados. Exemplos da vida real incluem detecção de spam, análise de opinião, previsão de exame com cartões de pontuação, etc.

2) Modelos de regressão – Modelos de regressão são usados ​​para problemas onde a variável de saída é um valor real, como um número único, Dólares, salário, peso ou pressão, por exemplo. Mais frequentemente usado para prever valores numéricos com base em observações de dados anteriores. Alguns dos algoritmos de regressão mais familiares incluem regressão linear, Regressão logística, regressão polinomial e regressão crista.

regressão vs classificação no aprendizado de máquina-4568442

Existem algumas aplicações muito práticas de algoritmos de aprendizagem supervisionada na vida real, Incluindo:

  • Categorização de texto
  • Detecção de rosto
  • Reconhecimento de assinatura
  • Descoberta de cliente
  • Detecção de spam
  • Previsão de tempo
  • Preveja os preços das casas com base no preço de mercado vigente
  • Previsões de preços de ações, entre outros

O que é aprendizagem não supervisionada?

Aprendizagem não supervisionada, por outro lado, é o método que treina máquinas para usar dados que não são classificados ou rotulados. Significa que no se pueden proporcionar datos de Treinamento y la máquina está hecha para aprender por sí misma. A máquina deve ser capaz de classificar os dados sem qualquer informação prévia sobre os dados.

A ideia é expor as máquinas a grandes volumes de dados variáveis ​​e permitir que aprendam com esses dados para fornecer informações anteriormente desconhecidas e identificar padrões ocultos.. Como tal, não há resultados necessariamente definidos de algoritmos de aprendizagem não supervisionados. Mais bem, determina o que é diferente ou interessante do conjunto de dados fornecido.

A máquina deve ser programada para aprender a si mesma. O computador precisa entender e fornecer informações de dados estruturados e não estruturados. Aqui está uma ilustração precisa da aprendizagem não supervisionada:

aprendizado não supervisionado-7369964

Categorização de aprendizado de máquina não supervisionado

1) Agrupamento é um dos métodos de aprendizagem não supervisionados mais comuns. O método de agrupamento envolve organizar os dados não rotulados em grupos semelhantes chamados clusters.. Portanto, um grupo é uma coleção de itens de dados semelhantes. O principal objetivo aqui é encontrar semelhanças nos pontos de dados e agrupar pontos de dados semelhantes em um grupo.

2) Detecção de anomalia é o método para identificar elementos raros, eventos ou observações que diferem significativamente da maioria dos dados. Em geral, procuramos anomalias ou outliers nos dados porque são suspeitos. A detecção de anomalias é frequentemente usada na detecção de fraudes bancárias e erros médicos.

Aplicativos de algoritmo de aprendizado não supervisionado

Algumas aplicações práticas de algoritmos de aprendizagem não supervisionados incluem:

  • Detecção de fraude
  • Detecção de malware
  • Identificação de erros humanos durante a entrada de dados
  • Executando uma análise precisa da cesta, etc.

Quando você deve escolher a aprendizagem supervisionada versus aprendizagem não supervisionada?

Na manufatura, um grande número de fatores afeta qual abordagem de aprendizado de máquina é melhor para uma determinada tarefa. E, já que cada problema de aprendizado de máquina é diferente, decidir qual técnica usar é um processo complexo.

Em geral, uma boa estratégia para aprimorar a abordagem correta de aprendizado de máquina é:

  • Avalie os dados. Está rotulado / Sem etiqueta? Há conhecimento especializado disponível para oferecer suporte a rotulagem adicional?? Isso ajudará a determinar se uma abordagem de aprendizagem supervisionada deve ser usada., não supervisionado, semi-supervisionado ou reforçado.
  • Defina a meta. O problema é recorrente, definido? Ou será que o algoritmo deverá prever novos problemas?
  • Analise os algoritmos disponíveis que pode se adequar ao problema em relação à dimensionalidade (número de recursos, atributos ou características). Os algoritmos candidatos devem ser adaptados ao volume geral de dados e sua estrutura.
  • Estude aplicativos de sucesso do tipo de algoritmo em problemas semelhantes

Notas finais

Aprendizagem supervisionada e aprendizagem não supervisionada são conceitos-chave no campo do aprendizado de máquina. Uma compreensão adequada dos fundamentos é muito importante antes de entrar no grupo de diferentes algoritmos de aprendizado de máquina..

Como próximo passo, vá em frente e confira o artigo a seguir, que cobre os principais e populares algoritmos de aprendizado de máquina:

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.