Análise de série temporal | Qual é a série temporal? Análise de série temporal em Python

Conteúdo

Este artigo foi publicado como parte do Data Science Blogathon

Tabela de conteúdos

Vamos dar uma olhada rápida neste blog.

→ ¿Qué es una Série temporal?

→ Cenários de séries temporais da vida real

→ Análise de série temporal

→ Previsão

→ Tipos de previsão

1) Previsão quantitativa

2) Previsão qualitativa

→ Regressão versus série temporal

→ Componentes da série temporal

→ Análise de dados de série temporal kaggle

→ Trace o gráfico da série temporal

O que é uma série temporal?

A série temporal é uma sequência ou série de pontos de dados em que o componente de tempo está envolvido ao longo da ocorrência.

Exemplo de dados de série temporal

Indústria da Saúde – Monitoramento de pressão arterial, monitoramento de freqüência cardíaca.

Meio Ambiente – Temperatura global e níveis de poluição do ar.

Sociedade – Taxas de natalidade durante um período de tempo, população, etc.

51945untitled20design208-8805687

https://www.google.com/url?

O que é análise de série temporal?

A análise desses dados de série temporal com certas ferramentas e técnicas é chamada de análise de série temporal..

Visitantes diários de restaurantes são previstos por esta série de dados temporais. Para que a gerência do restaurante possa nomear e acomodar a equipe de acordo com o número de visitantes.

Previsão

Previsão é o processo de fazer previsões a partir de dados históricos para que você possa prever o futuro a partir de dados passados ​​e presentes.

Tipos de previsão:

1) Previsão quantitativa

2) Previsão qualitativa

Vamos ver o que é

1) Previsão quantitativa

A previsão quantitativa é feita com base em dados históricos (eu, e) Dados passados ​​e presentes, principalmente dados numéricos. Por meio desses dados históricos, usamos métodos estatísticos e, portanto, podemos prever com menos preconceito.

2) Previsão qualitativa

A previsão qualitativa é feita com base na opinião e julgamento de especialistas no assunto e clientes. Por que confiamos no julgamento em vez de dados? Porque em alguns casos, os dados acima não estão disponíveis ou não são claros. então aqui nós dependemos de julgamento e opiniões.

Você pode ter algumas dúvidas sobre regressão e série temporal. Ambos têm algumas semelhanças e diferenças.

Regressão versus série temporal

A análise de regressão e a análise de série temporal são realizadas em variáveis ​​contínuas.

Regressão

→ É a relação entre as variáveis ​​dependentes e independentes.

→ La variável objetivo es continua.

→ Isso envolve encontrar padrões nos dados e prever o alvo com este padrão.

62642untitled20design202-6372751
Regressão

Séries Temporais

→ É a série de pontos de dados associados ao tempo.

→ A variável de destino é contínua.

→ Isso envolve encontrar tendências nos dados e prever o futuro com essa tendência.

82932untitled20design209-7667099

Séries Temporais: https://i1.wp.com/statisticsbyjim.com/wp-content/uploads/2020/07/TimeSeriesTrade.png?ajuste = 576% 2C384&ssl = 1

Componentes da série temporal

O gráfico de série temporal ajuda a destacar a tendência e o comportamento dos dados ao longo do tempo para construir um modelo mais confiável. Para entender esses padrões, devemos estruturar esses dados e dividi-los em vários fatores. Usamos vários componentes para decompor esses dados. Filho,

Quebras estruturais

Tendência

Sazonalidade

Ciclicidade

Barulho

Nível

1) Quebras estruturais

É um componente que mostra alguma mudança repentina nos dados da série temporal. Essa quebra estrutural afeta a confiabilidade dos resultados.. Métodos estatísticos devem ser usados ​​para identificar quebras estruturais.

38862untitled20design2010-7380476
QUEBRAS ESTRUTURAIS

2) Tendência

Os dados de série temporal podem ter algo que é proporcional ao período de tempo. Aí ocorre a tendência. Em resumo, “Tendência” é a demonstração de se a série temporal subiu ou desceu ao longo de um período de tempo. A confiabilidade dos resultados da série temporal é baseada na identificação correta das tendências temporais.

A seguir, um exemplo é mostrado, a renda mensal de uma empresa. Isso mostra uma tendência crescente

37722untitled20design207-1968231

3) Sazonalidade

A sazonalidade também é um componente no qual os dados da série temporal mostram um padrão regular ao longo de um intervalo de tempo.. Repete-se após intervalo de tempo fixo.

(Um exemplo de série temporal com sazonalidade são as vendas, que muitas vezes aumenta a cada 20 dias)

89766untitled20design2012-5470355
https://www.vosesoftware.com/riskwiki/images/image1858.gif

4) Ciclicidade

A ciclicidade é o componente no qual os dados da série temporal se repetem após um intervalo de tempo. O intervalo não está definido aqui.

Exemplo:

A demanda de eletricidade por semana é traçada em um gráfico de série temporal. A demanda por 2 semanas se repetem ciclicamente. Isso representa ciclicidade.

95216untitled20design2013-5170449

https://robjhyndman.com/hyndsight/2011-12-14-cyclicts_files/figure-html/unnamed-chunk-3-1.png

5) barulho

O ruído é a flutuação aleatória nos dados da série temporal. Não podemos considerá-los para prever o futuro.

6) Nível

A série temporal média é chamada de nível.

Análise de dados de série temporal Kaggle:

Nesta análise, eu costumava Kaggleconjunto de dados. Kaggle é uma plataforma onde podemos encontrar conjuntos de dados, cadernos e outros tipos de coisas relacionadas à ciência de dados. Competições para a prática também são organizadas.

Conjunto de dados utilizado nesta análise: Conjunto de dados de inicialização da série time

Leia o conjunto de dados

import pandas as pd
data = pd.read_csv('/conteúdo/sample_data/Month_Value_1.csv')
data.head()

52781sem título20design203-1947272

Limpando o conjunto de dados:

78363sem título20design204-6354263

Este conjunto de dados contém 5 colunas e 96 filas.

As colunas são

[0] – Período

[1] – Renda

[2] – Quantidade de vendas

[3] – Costo_promedio

[4] – El_payor_anual_promedio_de_la_región

Descrição de cada coluna para decidir qual é importante

Período: contém o período de modelo. A data mensal sábia de 2015 uma 2020 é especificado aqui.

Renda: receita da empresa para cada mês a partir de 2015 até 2020.

Sales_quantity: quantidade de vendas da empresa

Average_cost: custo médio de produção

The_average_annual_payroll_of_the_region: o número médio de funcionários na região por ano.

Trazar el gráfico de linha para 5 colunas

data.plot.line(x = nenhum,y = nenhum)
21673untitled20design205-1421351

Contém todos os dados de 5 colunas. Portanto, não dá uma visão exata. Então

Vamos limpar o conjunto de dados.

Podemos analisar a série temporal da receita de 2015 uma 2020 e remova todas as outras colunas agora.

48834untitled20design206-5110545
data = data.drop('Sales_quantity', 1)
data = data.drop('Custo médio', 1)
data = data.drop('The_average_annual_payroll_of_the_region', 1)

A sintaxe para remover a coluna é

dataframe.drop('Nome da coluna',1)

Onde 1 é o número do eixo (0 para linhas e 1 para colunas)

Agora temos apenas colunas de período e receita para análise.

Vamos desenhar o gráfico

data.plot.line(x = nenhum,y = nenhum)
86311untitled20design207-6232244

Este gráfico de série temporal mostra a tendência de aumento. Então, a receita da empresa aumenta de 2015 uma 2020.

Você pode dar uma olhada neste bloco de notas de série temporal para ver o código:

Bloco de anotações de conjunto de dados de inicialização de série temporal

Notas finais

Vimos alguns conceitos de análise de série temporal e analisamos o conjunto de dados inicial de Kaggle para séries temporais.

Obrigado pela leitura!

Espero que você tenha gostado do artigo e aumentado seu conhecimento sobre a análise de séries temporais. Por favor sinta-se à vontade para me contactar uma [e-mail protegido] Linkedin

Você quer compartilhar seus pensamentos? Sinta-se livre para comentar abaixo

Sobre o autor

Mohamed Illiyas

Atualmente, Estou cursando meu Bacharelado em Engenharia (SER) em Ciência da Computação da Escola de Engenharia do Governo, Srirangam, Tamil Nadu. Estou muito animado com as estatísticas, aprendizado de máquina e ciência de dados.

Conecte-se comigo no Linkedin Mohamed Illiyas

A mídia mostrada neste artigo que explica como implementar o aplicativo Streamlit no Heroku não é propriedade da DataPeaker e é usada a critério do autor.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.