Distribuições discretas de probabilidade | Tipos de distribuições de probabilidade

Compartilhar no Facebook
Compartilhar no Twitter
Compartilhar no LinkedIn
Compartilhar no telegrama
Compartilhar no Whatsapp

Conteúdo

Este artigo foi publicado como parte do Data Science Blogathon.

Introdução

Hoje, vamos falar sobre um dos conceitos fundamentais da estatística: distribuições de probabilidade. Eles ajudam a compreender melhor os dados e atuam como uma base para a compreensão de conceitos mais estatísticos, como intervalos de confiança e testes de hipótese.

Definição informal

Seja X uma variável aleatória que tem mais de um resultado possível. Trace a probabilidade no eixo y e o resultado no eixo x. Se repetirmos o experimento muitas vezes e representarmos graficamente a probabilidade de cada resultado possível, obtemos um gráfico que representa as probabilidades. Este gráfico é chamado de distribuição de probabilidade (PD). A altura do gráfico para X dá a probabilidade desse resultado.

24896binomial-2152455

Tipos de distribuições de probabilidade

Existem dois tipos de distribuições de acordo com o tipo de dados gerados pelos experimentos.

1. Distribuições discretas de probabilidade

Essas distribuições modelam as probabilidades de variáveis ​​aleatórias que podem ter valores discretos como resultados.. Por exemplo, os valores possíveis para a variável aleatória X que representa o número de caras que podem ocorrer quando uma moeda é lançada duas vezes são o conjunto {0, 1, 2} e não qualquer valor de 0 uma 2 O que 0.1 o 1.6.

Exemplos: Bernoulli, Binomial, Binomial negativo, Hipergeométrico, etc.,

2. Distribuições de probabilidade contínua

Essas distribuições modelam as probabilidades de variáveis ​​aleatórias que podem ter qualquer resultado possível.. Por exemplo, os valores possíveis para a variável aleatória X que representa o peso dos cidadãos em uma cidade que pode ter qualquer valor, como 34,5, 47,7, etc.

Exemplos: Normal, T o Aluno, Chi ao quadrado, Exponencial, etc.,

Terminologias

Cada DP nos fornece informações adicionais sobre o comportamento dos dados envolvidos.. Cada PD é dado por uma função de probabilidade que generaliza as probabilidades dos resultados.

Com isto, podemos estimar a probabilidade de um determinado resultado (discreto) ou a probabilidade de que caia dentro de um determinado intervalo de valores para qualquer resultado (contínuo). A função é chamada de função de massa de probabilidade (PMF) para distribuições discretas e função de densidade de probabilidade (PDF) para distribuições contínuas. O valor total de PMF e PDF em todo o domínio é sempre igual a um.

Função de distribuição cumulativa

O PDF fornece a probabilidade de um determinado resultado, enquanto a função de distribuição cumulativa fornece a probabilidade de ver um resultado menor ou igual a um determinado valor da variável aleatória. Os CDFs são usados ​​para verificar como a probabilidade foi adicionada até um certo ponto. Por exemplo, e P (X = 5) é a probabilidade de que o número de caras ao jogar uma moeda seja 5, P (X <= 5) denota a probabilidade cumulativa de obter de 1 uma 5 rostos.

As funções de distribuição cumulativa também são usadas para calcular os valores p como parte do teste de hipótese..

Distribuições discretas de probabilidade

Existem muitas distribuições de probabilidade discretas para usar em diferentes cenários. Discutiremos distribuições discretas neste artigo.. As distribuições binomial e de Poisson são as mais discutidas na lista a seguir.

1. Distribuição Bernoulli

Essa distribuição é gerada quando realizamos um experimento uma vez e só tem dois resultados possíveis: sucesso e fracasso. Os testes desse tipo são chamados de testes de Bernoulli., que formam a base de muitas distribuições discutidas abaixo. Seja p a probabilidade de sucesso e 1 – p é a probabilidade de falha.

O PMF é dado como

22323bernoulli_pmf-1340999

Um exemplo disso seria jogar uma moeda uma vez. p é a probabilidade de progredir e 1 – p é a probabilidade de obter uma cauda. Observe que o sucesso e o fracasso são subjetivos e nós os definimos com base no contexto.

2. Distribuição binomial

Isso é gerado para variáveis ​​aleatórias com apenas dois resultados possíveis. Seja p a probabilidade de que um evento seja um sucesso, o que implica que 1 – p é a probabilidade de que o evento seja uma falha. Realizar o experimento repetidamente e representar graficamente a probabilidade a cada vez nos dá a distribuição Binomial.

O exemplo mais comum dado para a distribuição binomial é lançar uma moeda n várias vezes e calcular as probabilidades de obter um determinado número de caras. Mais exemplos do mundo real incluem o número de ligações de vendas bem-sucedidas para uma empresa ou se um medicamento funciona ou não para uma doença..

O PMF é dado como,

55002binomial_pmf-9219053

onde p é a probabilidade de sucesso, n é o número de tentativas e x é o número de vezes que obtivemos sucesso.

3. Distribuição hipergeométrica

Considere o caso de remover uma bola de gude vermelha de uma caixa de bolas de gude de cores diferentes.. O evento de tirar uma bola vermelha é um sucesso e não puxá-la é um fracasso. Mas toda vez que uma bola de gude é desenhada, não é devolvido à caixa e, portanto, isso afeta a probabilidade de obter uma bola na próxima rodada. A distribuição hipergeométrica modela a probabilidade de sucessos k em n tentativas, onde cada tentativa é realizada sem substituição. Isso é diferente da distribuição binomial, onde a probabilidade permanece constante durante as tentativas..

O PMF é dado como,

85862hipergeométrico-1646114

onde k é o número de sucessos possíveis, x é o número desejado de sucessos, N é o tamanho da população e n é o número de tentativas.

4. Distribuição binomial negativa

Às vezes, queremos verificar quantos testes de Bernoulli precisamos fazer para obter um resultado específico. O resultado desejado é especificado com antecedência e continuamos o experimento até que seja alcançado. Considere o exemplo de rolar um dado. Nosso resultado desejado, definido como um sucesso, é conseguir um 4. Queremos saber a probabilidade de obter este resultado três vezes. Isso é interpretado como o número de falhas (outros números além de 4) o que vai acontecer antes de vermos o terceiro sucesso.

O PMF é dado como,

77645nb_formula-6630828

onde p é a probabilidade de sucesso, k é o número de falhas observadas e r é o número desejado de sucessos até que o experimento seja interrompido.

Como na distribuição binomial, a probabilidade entre as tentativas permanece constante e cada tentativa é independente da outra.

5. Distribuição geométrica

Este é um caso especial de distribuição binomial negativa, onde o número desejado de sucessos é 1. Mede o número de falhas que obtivemos antes de um sucesso. Usando o mesmo exemplo dado na seção anterior, gostaríamos de saber o número de falhas que vemos antes de obter as primeiras 4 ao jogar os dados.

42464geométrico-4296509

onde p é a probabilidade de sucesso ek é o número de falhas. Aqui, r = 1.

6. Distribuição de veneno

Esta distribuição descreve os eventos que ocorrem em um intervalo fixo de tempo ou espaço.. Um exemplo pode esclarecer isso. Considere o caso do número de chamadas que um centro de atendimento ao cliente recebe por hora. Podemos estimar o número médio de chamadas por hora, mas não podemos determinar o número exato e a hora exata em que há uma chamada. Cada ocorrência de um evento é independente das outras ocorrências.

O PMF é dado como,

89911poisson_formula-8714956

onde λ é o número médio de vezes que o evento ocorreu em um determinado período de tempo, x é o resultado desejado e e é o número de Euler.

7. Distribuição multinomial

Em distribuições anteriores, existem apenas dois resultados possíveis: sucesso e fracasso. Porém, distribuição multinomial descreve variáveis ​​aleatórias com muitos resultados possíveis. Às vezes, isso também é chamado de distribuição categórica, uma vez que cada resultado possível é tratado como uma categoria separada. Considere o cenário de jogar um jogo n vezes. A distribuição multinomial nos ajuda a determinar a probabilidade combinada de que o jogador 1 ganhar x1 vezes, o jogador 2 vai ganhar x2 vezes e o jogador k vence Xk vezes.

O PMF é dado como,

45389multinomial_formula-4394383

onde n é o número de tentativas, p1,…… pagk denotam as probabilidades dos resultados x1…… Xk respectivamente.

Neste post, Definimos as distribuições de probabilidade e discutimos brevemente as diferentes distribuições de probabilidade discretas. Deixe-me saber sua opinião sobre o artigo na seção de comentários abaixo..

Referências

1. https://www.statisticshowto.com/

2. https://stattrek.com/

3. Wikipedia

Sobre mim

Sou um ex-engenheiro de software que trabalha na transição para a ciência de dados. Eu sou um estudante de mestrado em ciência de dados. Sinta-se à vontade para se conectar comigo em https://www.linkedin.com/in/priyanka-madiraju/

A mídia mostrada neste artigo não é propriedade da DataPeaker e é usada a critério do autor.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.