Analyse des séries chronologiques | Quelle est la série temporelle? Analyse de séries temporelles en Python

Contenu

Cet article a été publié dans le cadre du Blogathon sur la science des données

Table des matières

Jetons un coup d'oeil rapide à ce blog.

→ ¿Qué es una Séries chronologiques?

→ Scénarios de séries temporelles en vie réelle

→ Analyse de séries temporelles

→ Prévision

→ Types de prévisions

1) Prévision quantitative

2) Prévision qualitative

→ Régression versus séries temporelles

→ Composantes des séries temporelles

→ Analyse des données de séries chronologiques de Kaggle

→ Tracer le graphique de la série temporelle

Qu'est-ce qu'une série temporelle?

La série temporelle est une séquence ou une série de points de données dans laquelle la composante temporelle est impliquée tout au long de l'occurrence.

Exemple de données de séries temporelles

Industrie de la santé – Surveillance de la pression artérielle, surveillance de la fréquence cardiaque.

Environnement – Température mondiale et niveaux de pollution de l'air.

Société – Taux de natalité sur une période de temps, Ville, etc.

51945sans titre20design208-8805687

https://www.google.com/url?

Qu'est-ce que l'analyse des séries chronologiques?

L'analyse de ces données de séries chronologiques avec certains outils et techniques est appelée analyse de séries chronologiques..

Les visiteurs quotidiens du restaurant sont prédits par cette série de données temporelles. Pour que la direction du restaurant nomme et accueille le personnel en fonction du nombre de visiteurs.

Prévision

La prévision est le processus consistant à faire des prédictions à partir de données historiques afin que vous puissiez prédire l'avenir à partir de données passées et présentes..

Types de prévisions:

1) Prévision quantitative

2) Prévision qualitative

Voyons ce que c'est

1) Prévision quantitative

La prévision quantitative est faite sur la base de données historiques (je, e) Données passées et présentes, principalement des données numériques. Grâce à ces données historiques, nous utilisons des méthodes statistiques et, donc, nous pouvons prédire avec moins de biais.

2) Prévision qualitative

La prévision qualitative est faite sur la base de l'opinion et du jugement des experts en la matière et des clients. Pourquoi comptons-nous sur le jugement plutôt que sur les données? Car dans certains cas, les données ci-dessus ne sont pas disponibles ou ne sont pas claires. donc ici nous dépendons du jugement et des opinions.

Vous pouvez avoir des doutes sur la régression et les séries chronologiques. Ils ont tous les deux des similitudes et des différences.

Régression par rapport aux séries chronologiques

L'analyse de régression et l'analyse des séries chronologiques sont effectuées sur des variables continues.

Régression

→ C'est la relation entre les variables dépendantes et indépendantes.

→ La variable objetivo es continua.

→ Cela implique de trouver des modèles dans les données et de prédire la cible avec ce modèle.

62642sans titre20design202-6372751
Régression

Des séries chronologiques

→ C'est la série de points de données associés au temps.

→ La variable cible est continue.

→ Il s'agit de trouver des tendances dans les données et de prévoir l'avenir avec cette tendance.

82932sans titre20design209-7667099

Des séries chronologiques: https://i1.wp.com/statisticsbyjim.com/wp-content/uploads/2020/07/TimeSeriesTrade.png?ajustement=576,384&SSL=1

Composants de séries temporelles

Le graphique de série chronologique permet de mettre en évidence la tendance et le comportement des données au fil du temps pour créer un modèle plus fiable. Pour comprendre ces modèles, il faut structurer ces données et les décomposer en plusieurs facteurs. Nous utilisons plusieurs composants pour décomposer ces données. Fils,

Ruptures structurelles

Tendance

Saisonnalité

Cyclicité

Bruit

Niveau

1) Ruptures structurelles

C'est un composant qui montre un changement soudain dans les données de la série chronologique. Cette rupture structurelle affecte la fiabilité des résultats.. Des méthodes statistiques devraient être utilisées pour identifier les ruptures structurelles.

38862sans titre20design2010-7380476
PAUSES STRUCTURELLES

2) Tendance

Les données de séries chronologiques peuvent avoir quelque chose de proportionnel à la période de temps. Là, la tendance se produit. En résumé, « Tendance » est la démonstration de si la série chronologique a évolué vers le haut ou vers le bas sur une période de temps. La fiabilité des résultats des séries chronologiques repose sur une identification correcte des tendances temporelles.

Ensuite, un exemple est montré, le revenu mensuel d'une entreprise. Cela montre une tendance à la hausse

37722sans titre20design207-1968231

3) Saisonnalité

La saisonnalité est également une composante dans laquelle les données de la série chronologique montrent un modèle régulier sur un intervalle de temps.. Se répète après l'intervalle de temps fixe.

(Les ventes sont un exemple de série chronologique avec saisonnalité, qui augmentent souvent chaque 20 jours)

89766sans titre20design2012-5470355
https://www.vosesoftware.com/riskwiki/images/image1858.gif

4) Cyclicité

La cyclicité est la composante dans laquelle les données de la série chronologique se répètent après un intervalle de temps. L'intervalle n'est pas défini ici.

Exemple:

La demande d'électricité par semaine est tracée sur un graphique de série chronologique. La demande de 2 semaines se répète cycliquement. Cela représente la cyclicité.

95216sans titre20design2013-5170449

https://robjhyndman.com/hyndsight/2011-12-14-cyclicts_files/figure-html/unnamed-chunk-3-1.png

5) bruit

Le bruit est la fluctuation aléatoire des données de la série chronologique. On ne peut pas les considérer pour prédire l'avenir.

6) Niveau

La série temporelle moyenne est appelée le niveau.

Analyse de données de séries chronologiques Kaggle:

Dans cette analyse, j'ai utilisé Kagglebase de données. Kaggle est une plate-forme où nous pouvons trouver des ensembles de données, cahiers et autres types de contenus liés à la science des données. Des compétitions sont également organisées pour la pratique.

Ensemble de données utilisé dans cette analyse: Ensemble de données de début de série temporelle

Lire l'ensemble de données

importer des pandas au format pd
données = pd.read_csv('/content/sample_data/Month_Value_1.csv')
data.head()

52781sans titre20design203-1947272

Nettoyage de l'ensemble de données:

78363sans titre20design204-6354263

Cet ensemble de données contient 5 colonnes et 96 Lignes.

Les colonnes sont

[0] – Cours du temps

[1] – Revenu

[2] – Quantité de vente

[3] – Coût moyen

[4] – Le_payeur_annuel_moyen_de_la_région

Description de chaque colonne pour décider laquelle est importante

Cours du temps: contient la période modèle. La date sage mensuelle de 2015 une 2020 spécifié ici.

Revenu: le chiffre d'affaires de l'entreprise pour chaque mois de 2015 jusqu'à 2020.

Quantité_ventes: montant des ventes de l'entreprise

Coût moyen: coût moyen de production

The_average_annual_payroll_of_the_region: le nombre moyen d'employés dans la région par an.

Trazar el graphique linéaire à 5 Colonnes

data.plot.line(x=aucun,y=aucun)
21673sans titre20design205-1421351

Contient toutes les données de 5 Colonnes. Donc ça ne donne pas une vue exacte. Ensuite

Nettoyons l'ensemble de données.

Nous pouvons analyser la série chronologique des revenus de 2015 une 2020 et supprimez toutes les autres colonnes maintenant.

48834sans titre20design206-5110545
données = données.drop('Sales_quantity', 1)
données = données.drop('Coût moyen', 1)
données = données.drop('The_average_annual_payroll_of_the_region', 1)

La syntaxe pour supprimer la colonne est

dataframe.drop('Nom de colonne',1)

où 1 est le numéro de l'axe (0 pour les lignes et 1 pour les colonnes)

Maintenant, nous n'avons que des colonnes de période et de revenu pour l'analyse.

Dessinons le graphique

data.plot.line(x=Aucun,y=Aucun)
86311sans titre20design207-6232244

Ce graphique de série chronologique montre la tendance à la hausse. Ensuite, les revenus de l'entreprise augmentent de 2015 une 2020.

Vous pouvez jeter un œil à ce cahier de séries temporelles pour voir le code:

Bloc-notes de l'ensemble de données de démarrage des séries temporelles

Remarques finales

Nous avons examiné certains concepts d'analyse de séries chronologiques et analysé l'ensemble de données de départ de Kaggle pour les séries chronologiques.

Merci pour la lecture!

J'espère que vous avez apprécié l'article et augmenté vos connaissances sur l'analyse des séries chronologiques. N'hésitez pas à me contacter une [email protégé] Linkedin

Vous voulez partager vos pensées? N'hésitez pas à commenter ci-après

A propos de l'auteur

Mohamed Illias

Actuellement, Je poursuis mon baccalauréat en ingénierie (ÊTRE) en informatique de la École d'ingénieurs du gouvernement, Srirangam, Tamil Nadu. Je suis très excité par les statistiques, apprentissage automatique et science des données.

Connectez-vous avec moi sur Linkedin Mohamed Illias

Les supports présentés dans cet article expliquant comment implémenter l'application Streamlit sur Heroku ne sont pas la propriété de DataPeaker et sont utilisés à la discrétion de l'auteur.

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.