Matemática para Aprendizado de Máquina | Matemática para Ciência de Dados

Conteúdo

Este artigo foi publicado como parte do Data Science Blogathon

51102ml-8797358

Você é um aspirante a cientista de dados que é fascinado por como as coisas funcionam no mundo da ciência de dados e do aprendizado de máquina?? Nós vamos, parabéns por escolher a carreira certa que melhor atenda às suas necessidades neste momento. Porém, Você sabia que precisa dominar a matemática para aprendizado de máquina e ciência de dados?? sim, você ouviu bem.

Não importa que tipo de relação de amor e ódio você teve com matemática na escola. Os conceitos básicos usados ​​em matemática e estatística são, na verdade, muito úteis para a tomada de decisões estratégicas ao projetar modelos de aprendizado de máquina.. Então, se você decidiu escolher esta carreira no campo da ciência de dados, você deve começar a amar os conceitos da matemática e implementá-los em seu futuro, pois é um dos pré-requisitos para aprendizado de máquina.

Qual é a correlação entre aprendizado de máquina e matemática?

18057whatsapp20image202021-05-3120at208-41-4320pm201-6071198

O aprendizado de máquina envolve matemática, que por sua vez ajuda a criar um algoritmo que pode aprender com os dados para fazer uma previsão precisa. A previsão pode ser tão simples quanto classificar cães ou gatos a partir de um determinado conjunto de imagens ou que tipos de produtos recomendar a um cliente com base em compras anteriores.. Portanto, é muito importante entender adequadamente os conceitos matemáticos por trás de qualquer algoritmo de aprendizado de máquina principal. Desta forma, ajuda você a escolher todos os algoritmos certos para seu projeto de ciência de dados e aprendizado de máquina.

O aprendizado de máquina depende principalmente de pré-requisitos matemáticos, então, contanto que você possa entender porque a matemática é usada, você achará isso mais interessante. Com isto, você entenderá por que escolhemos um algoritmo de aprendizado de máquina em vez de outro e como isso afeta o desempenho do modelo de aprendizado de máquina.

Pontos a serem abordados nesta postagem do blog

  1. Quais conceitos matemáticos estão envolvidos no aprendizado de máquina?

  2. Por que você precisa de matemática em projetos de aprendizado de máquina?

  3. Qual é a maneira correta de aprender isso?

Na postagem de hoje do blog, discutiremos exatamente todos os conceitos matemáticos que você precisa aprender para dominar os conceitos de ciência de dados e aprendizado de máquina. Também aprenderemos por que usamos matemática no aprendizado de máquina com alguns exemplos.

Vamos começar examinando as muitas formas de matemática usadas em ciência de dados e aprendizado de máquina para que você possa entender melhor o que realmente precisa saber sobre matemática para a profissão de ciência de dados..

Quais conceitos matemáticos são implementados em ciência de dados e aprendizado de máquina

O aprendizado de máquina é baseado em quatro conceitos críticos e é estatístico, álgebra Linear, probabilidade e cálculo. Embora os conceitos estatísticos sejam a parte central de cada modelo, cálculo nos ajuda a aprender e otimizar um modelo. A álgebra linear é excepcionalmente útil ao lidar com um grande conjunto de dados e a probabilidade ajuda a prever a sustentação dos eventos que ocorrerão.. Esses são os conceitos matemáticos que você encontrará em sua carreira de ciência de dados e aprendizado de máquina com frequência..

Conceitos matemáticos importantes para aprendizado de máquina e ciência de dados:

  1. Álgebra Linear

  2. Cálculo

  3. Teoria da probabilidade

  4. Matemática discreta

  5. Estatisticas

97735whatsapp20image202021-05-3120at208-41-4420pm-5736471

Conceito de álgebra linear em aprendizado de máquina:

Compreender como construir equações lineares é um componente crítico no desenvolvimento de algoritmos centrais de aprendizado de máquina.. Estes serão usados ​​para avaliar e observar a coleta de dados. A álgebra linear é aplicada em algoritmos de aprendizado de máquina em funções de perda, regularização, matrizes de covarianza, decomposição de valor singular (SVD), operações de matriz e classificação de máquinas de vetores de suporte. Também é aplicado em algoritmos de aprendizado de máquina, como regressão linear. Estes são os conceitos necessários para entender os métodos de otimização usados ​​para aprendizado de máquina.

Para realizar uma análise de componente principal que é usada para reduzir a dimensionalidade dos dados, nós usamos álgebra linear. A álgebra linear também é amplamente usada em redes neurais para renderização e processamento de rede.. Desnecessário dizer que você deve estar interessado em álgebra linear, uma vez que é amplamente utilizado no campo da ciência de dados.

Porém, não se deixe intimidar por isso, pois entender os conceitos será importante, mas você não precisa ser um especialista em álgebra linear para resolver a maioria dos problemas. Apenas um entendimento sólido dos conceitos será bom o suficiente. Mathematics for Machine Learning, de Marc Peter deisenroth, é um excelente livro que o ajudará a iniciar essa jornada se você estiver tendo dificuldades com a matemática desde o início..

Cálculo em aprendizado de máquina:

Muitos alunos que não gostaram de aprender o cálculo que lhes foi ensinado na escola serão duramente atingidos., pois é parte integrante do aprendizado de máquina. Felizmente, você pode não precisar ser proficiente em cálculo, só é importante aprender e compreender os princípios do cálculo. O que mais, você deve compreender as aplicações práticas do aprendizado de máquina por meio da computação durante a construção do modelo.

Então, se você entender como a derivada da função retorna sua taxa de variação no cálculo, entender o conceito de gradiente descendente. Na descida gradiente, precisamos encontrar os mínimos locais para uma função e assim por diante. Se você tiver pontos de sela ou múltiplos mínimos, uma descida gradiente pode encontrar um mínimo local e não um mínimo global, a menos que você comece de vários pontos. Alguns dos tópicos necessários para dominar a parte do cálculo da ciência de dados são Cálculo Diferencial e Integral, Derivadas parciais, Funções de valor vetorial, Gradientes direcionais.

O cálculo multivariado é usado no treinamento do algoritmo, bem como na descida de gradientes. Derivados, divergência, curvatura e aproximações quadráticas são conceitos importantes que você pode aprender e implementar.

A matemática do aprendizado de máquina pode parecer intimidante para você agora, porém, você será capaz de entender os conceitos computacionais necessários para construir um modelo de aprendizado de máquina bem-sucedido em alguns dias de aprendizado construtivo.

Uso de estatísticas descritivas

A estatística descritiva é um conceito fundamental que todo aspirante a cientista de dados deve aprender a entender o aprendizado de máquina ao trabalhar com classificações como regressão logística., distribuições, análise de discriminação e teste de hipótese.

Se eu estivesse lutando com estatísticas na escola, então você deve colocar seu 200 por cento para aprender a parte matemática da estatística, pois é muito essencial para você se tornar um cientista de dados de sucesso. Para colocar em palavras mais simples, a estatística é a parte principal da matemática para o aprendizado de máquina. Algumas das estatísticas fundamentais necessárias para ML são Combinatorics, Axiomas, Teorema de Bayes, Variância e expectativa, Variáveis ​​aleatórias, Distribuições condicionais e conjuntas.

Matemática discreta no aprendizado de máquina

A matemática discreta lida com números não contínuos, na maioria das vezes inteiros. Muitos aplicativos requerem o uso de números discretos. Ao agendar uma frota de táxis, por exemplo, Não é possível enviar 0,34 Táxis; você deve enviar os completos. Não pode ter meio carteiro ou obrigá-lo a visitar 1 e meio lugares para entregar as cartas.

Muitas das estruturas de inteligência artificial são discretas. Neuronal vermelho una, por exemplo, tem um número inteiro de nós e interconexões. Não pode ter 0,65 nós ou um nono de um link. Como resultado, a matemática usada para construir uma rede neural deve incluir um elemento discreto, o inteiro representa o número de nós e interconexões.

Você pode se safar com os fundamentos da matemática discreta para aprendizado de máquina, a menos que você queira trabalhar com domínios relacionais, modelos gráficos, problemas combinatórios, predição estruturada, etc. Para dominar esses conceitos, deve consultar livros sobre matemática discreta. Felizmente para graduados em ciência da computação, esses conceitos são abordados de forma adequada em sua universidade. Porém, outros podem precisar se esforçar mais para entender este tópico. Portanto, matemática discreta é um componente muito importante da IA & ML.

11332como-matemática-importa-em-ciência-6-638-1907947

Teoria de probabilidade em aprendizado de máquina

Para trabalhar com sucesso em um projeto de modelagem preditiva de aprendizado de máquina, seria razoável concluir que a probabilidade é essencial.

Aprendizado de máquina é o processo de criação de modelos de previsão a partir de dados ambíguos. Trabalhar com informações defeituosas ou incompletas é o que leva à incerteza.

A incerteza é crucial para o aprendizado de máquina, porém, é um dos componentes que cria mais dificuldades para os recém-chegados, particularmente aqueles que vêm de experiência em programação.

No aprendizado de máquina, existem três fontes principais de incerteza: dados barulhentos, cobertura limitada da área do problema e, claro, modelos imperfeitos. Porém, com a ajuda das ferramentas de probabilidade certas, podemos estimar a solução para o problema.

A probabilidade é essencial para testar hipóteses e distribuições, como a distribuição gaussiana e a função de densidade de probabilidade..

Vamos agora olhar para os aplicativos depois de analisarmos os tipos em matemática e ciência de dados.

Por que você deveria se preocupar com matemática? Por que você precisa de matemática em projetos de aprendizado de máquina?

Existem vários motivos pelos quais a matemática para o aprendizado de máquina é importante, e vou compartilhar algumas das dicas importantes abaixo:

  • A escolha do melhor algoritmo requer levar em consideração a precisão, tempo de treino, a complexidade do modelo, o número de parâmetros e o número de funções.

  • Escolha de valores de parâmetro e métodos de validação.

  • Compreender a compensação de variação de polarização permite que você identifique problemas de sobreajuste e desajuste que normalmente ocorrem durante a execução do programa.

  • Determinando o intervalo de confiança correto e incerteza.

Qual é a maneira correta de aprender matemática para ciência de dados e aprendizado de máquina?

24384stencil-default-8961707

Embora existam muitos recursos valiosos disponíveis na Internet que explicam conceitos como o cálculo de vetores de decomposição de matriz, a matriz de geometria analítica de álgebra linear, a matemática por trás da análise de componentes principais e máquinas de vetores de suporte. Nem todos os recursos são uma solução abrangente para sua compreensão. Portanto, Eu compilei uma lista de livros, Sites e canais do YouTube que podem ajudá-lo a melhorar seu conceito teórico no campo da inteligência artificial.

  1. Matemática para Aprendizado de Máquina de Marc Peter Deisenroth é o livro que pode ajudá-lo a começar sua jornada matemática. As aplicações práticas dos algoritmos e a matemática por trás deles foram claramente explicadas. Todos os conceitos da matemática foram explicados corretamente. Você pode verificar o pdf online aqui -https: //mml-book.github.io/book/mml-book.pdf

  2. Cálculo multivariado pelo Imperial College London – O Imperial College London basicamente criou uma série no YouTube que cobre os conceitos importantes do cálculo multivariado e sua aplicação em vários algoritmos de ml.. Embora todo o curso seja em colaboração com o Coursera, Imperial College London tornou-o disponível gratuitamente para todos os alunos curiosos.

  3. Cursos de Khan Academy sobre Álgebra Linear, Probabilidade e Estatística, Cálculo multivariado, e Melhoria– Um recurso muito abrangente e gratuito disponível para todos os alunos para aprofundar seus conhecimentos de conceitos complexos, como a Matriz de Geometria Analítica de Álgebra Linear.

  4. Todas as estatísticas: um curso conciso em inferência estatística por Larry Wasserman é supostamente outro recurso abrangente que contém uma explicação detalhada de conceitos importantes, como

  5. De Udacity Introdução às estatísticas– é outro recurso gratuito através do qual você pode obter um nível inicial de compreensão no campo da estatística que é necessário para a ciência de dados.

conclusão

Irá levá-lo entre 3 e 4 meses para aprender conceitos matemáticos e colocá-los em prática. Confira os recursos mencionados acima e não se esqueça de continuar aprendendo junto com os algoritmos de aprendizado de máquina para que você possa entender qual é o algoritmo correto para escolher para seu modelo.

A mídia mostrada neste artigo não é propriedade da Analytics Vidhya e é usada a critério do autor.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.