Este artigo foi publicado como parte do Data Science Blogathon
Tabela de conteúdos
Vamos dar uma olhada rápida neste blog.
→ ¿Qué es una Série temporalUma série temporal é um conjunto de dados coletados ou medidos em momentos sucessivos, geralmente em intervalos de tempo regulares. Esse tipo de análise permite identificar padrões, Tendências e ciclos nos dados ao longo do tempo. Sua aplicação é ampla, abrangendo áreas como economia, Meteorologia e saúde pública, facilitando a previsão e a tomada de decisões com base em informações históricas....?
→ Cenários de séries temporais da vida real
→ Análise de série temporal
→ Previsão
→ Tipos de previsão
1) Previsão quantitativa
2) Previsão qualitativa
→ Regressão versus série temporal
→ Componentes da série temporal
→ Análise de dados de série temporal kaggle
→ Trace o gráfico da série temporal
O que é uma série temporal?
A série temporal é uma sequência ou série de pontos de dados em que o componente de tempo está envolvido ao longo da ocorrência.
Exemplo de dados de série temporal
Indústria da Saúde – Monitoramento de pressão arterial, monitoramento de freqüência cardíaca.
Meio Ambiente – Temperatura global e níveis de poluição do ar.
Sociedade – Taxas de natalidade durante um período de tempo, população, etc.
https://www.google.com/url?
O que é análise de série temporal?
A análise desses dados de série temporal com certas ferramentas e técnicas é chamada de análise de série temporal..
Visitantes diários de restaurantes são previstos por esta série de dados temporais. Para que a gerência do restaurante possa nomear e acomodar a equipe de acordo com o número de visitantes.
Previsão
Previsão é o processo de fazer previsões a partir de dados históricos para que você possa prever o futuro a partir de dados passados e presentes.
Tipos de previsão:
1) Previsão quantitativa
2) Previsão qualitativa
Vamos ver o que é
1) Previsão quantitativa
A previsão quantitativa é feita com base em dados históricos (eu, e) Dados passados e presentes, principalmente dados numéricos. Por meio desses dados históricos, usamos métodos estatísticos e, portanto, podemos prever com menos preconceito.
2) Previsão qualitativa
A previsão qualitativa é feita com base na opinião e julgamento de especialistas no assunto e clientes. Por que confiamos no julgamento em vez de dados? Porque em alguns casos, os dados acima não estão disponíveis ou não são claros. então aqui nós dependemos de julgamento e opiniões.
Você pode ter algumas dúvidas sobre regressão e série temporal. Ambos têm algumas semelhanças e diferenças.
Regressão versus série temporal
A análise de regressão e a análise de série temporal são realizadas em variáveis contínuas.
Regressão
→ É a relação entre as variáveis dependentes e independentes.
→ La variávelEm estatística e matemática, uma "variável" é um símbolo que representa um valor que pode mudar ou variar. Existem diferentes tipos de variáveis, e qualitativo, que descrevem características não numéricas, e quantitativo, representando quantidades numéricas. Variáveis são fundamentais em experimentos e estudos, uma vez que permitem a análise de relações e padrões entre diferentes elementos, facilitando a compreensão de fenômenos complexos.... objetivo es continua.
→ Isso envolve encontrar padrões nos dados e prever o alvo com este padrão.
Séries Temporais
→ É a série de pontos de dados associados ao tempo.
→ A variável de destino é contínua.
→ Isso envolve encontrar tendências nos dados e prever o futuro com essa tendência.
Séries Temporais: https://i1.wp.com/statisticsbyjim.com/wp-content/uploads/2020/07/TimeSeriesTrade.png?ajuste = 576% 2C384&ssl = 1
Componentes da série temporal
O gráfico de série temporal ajuda a destacar a tendência e o comportamento dos dados ao longo do tempo para construir um modelo mais confiável. Para entender esses padrões, devemos estruturar esses dados e dividi-los em vários fatores. Usamos vários componentes para decompor esses dados. Filho,
Quebras estruturais
Tendência
Sazonalidade
Ciclicidade
Barulho
Nível
1) Quebras estruturais
É um componente que mostra alguma mudança repentina nos dados da série temporal. Essa quebra estrutural afeta a confiabilidade dos resultados.. Métodos estatísticos devem ser usados para identificar quebras estruturais.
2) Tendência
Os dados de série temporal podem ter algo que é proporcional ao período de tempo. Aí ocorre a tendência. Em resumo, “Tendência” é a demonstração de se a série temporal subiu ou desceu ao longo de um período de tempo. A confiabilidade dos resultados da série temporal é baseada na identificação correta das tendências temporais.
A seguir, um exemplo é mostrado, a renda mensal de uma empresa. Isso mostra uma tendência crescente
3) Sazonalidade
A sazonalidade também é um componente no qual os dados da série temporal mostram um padrão regular ao longo de um intervalo de tempo.. Repete-se após intervalo de tempo fixo.
(Um exemplo de série temporal com sazonalidade são as vendas, que muitas vezes aumenta a cada 20 dias)
4) Ciclicidade
A ciclicidade é o componente no qual os dados da série temporal se repetem após um intervalo de tempo. O intervalo não está definido aqui.
Exemplo:
A demanda de eletricidade por semana é traçada em um gráfico de série temporal. A demanda por 2 semanas se repetem ciclicamente. Isso representa ciclicidade.
https://robjhyndman.com/hyndsight/2011-12-14-cyclicts_files/figure-html/unnamed-chunk-3-1.png
5) barulho
O ruído é a flutuação aleatória nos dados da série temporal. Não podemos considerá-los para prever o futuro.
6) Nível
A série temporal média é chamada de nível.
Análise de dados de série temporal Kaggle:
Nesta análise, eu costumava Kaggleconjunto de dados. Kaggle é uma plataforma onde podemos encontrar conjuntos de dados, cadernos e outros tipos de coisas relacionadas à ciência de dados. Competições para a prática também são organizadas.
Conjunto de dados utilizado nesta análise: Conjunto de dados de inicialização da série time
Leia o conjunto de dados
import pandas as pd
data = pd.read_csv('/conteúdo/sample_data/Month_Value_1.csv')
data.head()
Limpando o conjunto de dados:
Este conjunto de dados contém 5 colunas e 96 filas.
As colunas são
[0] – Período
[1] – Renda
[2] – Quantidade de vendas
[3] – Costo_promedio
[4] – El_payor_anual_promedio_de_la_región
Descrição de cada coluna para decidir qual é importante
Período: contém o período de modelo. A data mensal sábia de 2015 uma 2020 é especificado aqui.
Renda: receita da empresa para cada mês a partir de 2015 até 2020.
Sales_quantity: quantidade de vendas da empresa
Average_cost: custo médio de produção
The_average_annual_payroll_of_the_region: o número médio de funcionários na região por ano.
Trazar el gráfico de linhaEl gráfico de líneas es una herramienta visual utilizada para representar datos a lo largo del tiempo. Consiste en una serie de puntos conectados por líneas, lo que permite observar tendencias, fluctuaciones y patrones en los datos. Este tipo de gráfico es especialmente útil en áreas como la economía, la meteorología y la investigación científica, facilitando la comparación de diferentes conjuntos de datos y la identificación de comportamientos a lo... para 5 colunas
data.plot.line(x = nenhum,y = nenhum)
Contém todos os dados de 5 colunas. Portanto, não dá uma visão exata. Então
Vamos limpar o conjunto de dados.
Podemos analisar a série temporal da receita de 2015 uma 2020 e remova todas as outras colunas agora.
data = data.drop('Sales_quantity', 1) data = data.drop('Custo médio', 1) data = data.drop('The_average_annual_payroll_of_the_region', 1)
A sintaxe para remover a coluna é
dataframe.drop('Nome da coluna',1)
Onde 1 é o número do eixo (0 para linhas e 1 para colunas)
Agora temos apenas colunas de período e receita para análise.
Vamos desenhar o gráfico
data.plot.line(x = nenhum,y = nenhum)
Este gráfico de série temporal mostra a tendência de aumento. Então, a receita da empresa aumenta de 2015 uma 2020.
Você pode dar uma olhada neste bloco de notas de série temporal para ver o código:
Bloco de anotações de conjunto de dados de inicialização de série temporal
Notas finais
Vimos alguns conceitos de análise de série temporal e analisamos o conjunto de dados inicial de Kaggle para séries temporais.
Obrigado pela leitura!
Espero que você tenha gostado do artigo e aumentado seu conhecimento sobre a análise de séries temporais. Por favor sinta-se à vontade para me contactar uma [e-mail protegido] Linkedin
Você quer compartilhar seus pensamentos? Sinta-se livre para comentar abaixo
Sobre o autor
Mohamed Illiyas
Atualmente, Estou cursando meu Bacharelado em Engenharia (SER) em Ciência da Computação da Escola de Engenharia do Governo, Srirangam, Tamil Nadu. Estou muito animado com as estatísticas, aprendizado de máquina e ciência de dados.
Conecte-se comigo no Linkedin Mohamed Illiyas
A mídia mostrada neste artigo que explica como implementar o aplicativo Streamlit no Heroku não é propriedade da DataPeaker e é usada a critério do autor.