Cet article a été publié dans le cadre du Blogathon sur la science des données
Table des matières
Jetons un coup d'oeil rapide à ce blog.
→ ¿Qué es una Séries chronologiquesUne série chronologique est un ensemble de données collectées ou mesurées à des moments successifs, généralement à intervalles réguliers. Ce type d’analyse vous permet d’identifier des modèles, Tendances et cycles des données au fil du temps. Son application est large, couvrant des domaines tels que l’économie, Météorologie et santé publique, faciliter la prédiction et la prise de décision sur la base d’informations historiques....?
→ Scénarios de séries temporelles en vie réelle
→ Analyse de séries temporelles
→ Prévision
→ Types de prévisions
1) Prévision quantitative
2) Prévision qualitative
→ Régression versus séries temporelles
→ Composantes des séries temporelles
→ Analyse des données de séries chronologiques de Kaggle
→ Tracer le graphique de la série temporelle
Qu'est-ce qu'une série temporelle?
La série temporelle est une séquence ou une série de points de données dans laquelle la composante temporelle est impliquée tout au long de l'occurrence.
Exemple de données de séries temporelles
Industrie de la santé – Surveillance de la pression artérielle, surveillance de la fréquence cardiaque.
Environnement – Température mondiale et niveaux de pollution de l'air.
Société – Taux de natalité sur une période de temps, Ville, etc.
https://www.google.com/url?
Qu'est-ce que l'analyse des séries chronologiques?
L'analyse de ces données de séries chronologiques avec certains outils et techniques est appelée analyse de séries chronologiques..
Les visiteurs quotidiens du restaurant sont prédits par cette série de données temporelles. Pour que la direction du restaurant nomme et accueille le personnel en fonction du nombre de visiteurs.
Prévision
La prévision est le processus consistant à faire des prédictions à partir de données historiques afin que vous puissiez prédire l'avenir à partir de données passées et présentes..
Types de prévisions:
1) Prévision quantitative
2) Prévision qualitative
Voyons ce que c'est
1) Prévision quantitative
La prévision quantitative est faite sur la base de données historiques (je, e) Données passées et présentes, principalement des données numériques. Grâce à ces données historiques, nous utilisons des méthodes statistiques et, donc, nous pouvons prédire avec moins de biais.
2) Prévision qualitative
La prévision qualitative est faite sur la base de l'opinion et du jugement des experts en la matière et des clients. Pourquoi comptons-nous sur le jugement plutôt que sur les données? Car dans certains cas, les données ci-dessus ne sont pas disponibles ou ne sont pas claires. donc ici nous dépendons du jugement et des opinions.
Vous pouvez avoir des doutes sur la régression et les séries chronologiques. Ils ont tous les deux des similitudes et des différences.
Régression par rapport aux séries chronologiques
L'analyse de régression et l'analyse des séries chronologiques sont effectuées sur des variables continues.
Régression
→ C'est la relation entre les variables dépendantes et indépendantes.
→ La variableEn statistique et en mathématiques, ongle "variable" est un symbole qui représente une valeur qui peut changer ou varier. Il existe différents types de variables, et qualitatif, qui décrivent des caractéristiques non numériques, et quantitatif, représentation de grandeurs numériques. Les variables sont fondamentales dans les expériences et les études, puisqu’ils permettent l’analyse des relations et des modèles entre différents éléments, faciliter la compréhension de phénomènes complexes.... objetivo es continua.
→ Cela implique de trouver des modèles dans les données et de prédire la cible avec ce modèle.
Des séries chronologiques
→ C'est la série de points de données associés au temps.
→ La variable cible est continue.
→ Il s'agit de trouver des tendances dans les données et de prévoir l'avenir avec cette tendance.
Des séries chronologiques: https://i1.wp.com/statisticsbyjim.com/wp-content/uploads/2020/07/TimeSeriesTrade.png?ajustement=576,384&SSL=1
Composants de séries temporelles
Le graphique de série chronologique permet de mettre en évidence la tendance et le comportement des données au fil du temps pour créer un modèle plus fiable. Pour comprendre ces modèles, il faut structurer ces données et les décomposer en plusieurs facteurs. Nous utilisons plusieurs composants pour décomposer ces données. Fils,
Ruptures structurelles
Tendance
Saisonnalité
Cyclicité
Bruit
Niveau
1) Ruptures structurelles
C'est un composant qui montre un changement soudain dans les données de la série chronologique. Cette rupture structurelle affecte la fiabilité des résultats.. Des méthodes statistiques devraient être utilisées pour identifier les ruptures structurelles.
2) Tendance
Les données de séries chronologiques peuvent avoir quelque chose de proportionnel à la période de temps. Là, la tendance se produit. En résumé, « Tendance » est la démonstration de si la série chronologique a évolué vers le haut ou vers le bas sur une période de temps. La fiabilité des résultats des séries chronologiques repose sur une identification correcte des tendances temporelles.
Ensuite, un exemple est montré, le revenu mensuel d'une entreprise. Cela montre une tendance à la hausse
3) Saisonnalité
La saisonnalité est également une composante dans laquelle les données de la série chronologique montrent un modèle régulier sur un intervalle de temps.. Se répète après l'intervalle de temps fixe.
(Les ventes sont un exemple de série chronologique avec saisonnalité, qui augmentent souvent chaque 20 jours)
4) Cyclicité
La cyclicité est la composante dans laquelle les données de la série chronologique se répètent après un intervalle de temps. L'intervalle n'est pas défini ici.
Exemple:
La demande d'électricité par semaine est tracée sur un graphique de série chronologique. La demande de 2 semaines se répète cycliquement. Cela représente la cyclicité.
https://robjhyndman.com/hyndsight/2011-12-14-cyclicts_files/figure-html/unnamed-chunk-3-1.png
5) bruit
Le bruit est la fluctuation aléatoire des données de la série chronologique. On ne peut pas les considérer pour prédire l'avenir.
6) Niveau
La série temporelle moyenne est appelée le niveau.
Analyse de données de séries chronologiques Kaggle:
Dans cette analyse, j'ai utilisé Kagglebase de données. Kaggle est une plate-forme où nous pouvons trouver des ensembles de données, cahiers et autres types de contenus liés à la science des données. Des compétitions sont également organisées pour la pratique.
Ensemble de données utilisé dans cette analyse: Ensemble de données de début de série temporelle
Lire l'ensemble de données
importer des pandas au format pd données = pd.read_csv('/content/sample_data/Month_Value_1.csv') data.head()
Nettoyage de l'ensemble de données:
Cet ensemble de données contient 5 colonnes et 96 Lignes.
Les colonnes sont
[0] – Cours du temps
[1] – Revenu
[2] – Quantité de vente
[3] – Coût moyen
[4] – Le_payeur_annuel_moyen_de_la_région
Description de chaque colonne pour décider laquelle est importante
Cours du temps: contient la période modèle. La date sage mensuelle de 2015 une 2020 spécifié ici.
Revenu: le chiffre d'affaires de l'entreprise pour chaque mois de 2015 jusqu'à 2020.
Quantité_ventes: montant des ventes de l'entreprise
Coût moyen: coût moyen de production
The_average_annual_payroll_of_the_region: le nombre moyen d'employés dans la région par an.
Trazar el graphique linéaireLe graphique linéaire est un outil visuel utilisé pour représenter les données au fil du temps. Il se compose d’une série de points reliés par des droites, qui vous permet d’observer les tendances, Fluctuations et modèles dans les données. Ce type de graphique est particulièrement utile dans des domaines tels que l’économie, Météorologie et recherche scientifique, ce qui facilite la comparaison de différents ensembles de données et l’identification des comportements à tous les niveaux.. à 5 Colonnes
data.plot.line(x=aucun,y=aucun)
Contient toutes les données de 5 Colonnes. Donc ça ne donne pas une vue exacte. Ensuite
Nettoyons l'ensemble de données.
Nous pouvons analyser la série chronologique des revenus de 2015 une 2020 et supprimez toutes les autres colonnes maintenant.
données = données.drop('Sales_quantity', 1) données = données.drop('Coût moyen', 1) données = données.drop('The_average_annual_payroll_of_the_region', 1)
La syntaxe pour supprimer la colonne est
dataframe.drop('Nom de colonne',1)
où 1 est le numéro de l'axe (0 pour les lignes et 1 pour les colonnes)
Maintenant, nous n'avons que des colonnes de période et de revenu pour l'analyse.
Dessinons le graphique
data.plot.line(x=Aucun,y=Aucun)
Ce graphique de série chronologique montre la tendance à la hausse. Ensuite, les revenus de l'entreprise augmentent de 2015 une 2020.
Vous pouvez jeter un œil à ce cahier de séries temporelles pour voir le code:
Bloc-notes de l'ensemble de données de démarrage des séries temporelles
Remarques finales
Nous avons examiné certains concepts d'analyse de séries chronologiques et analysé l'ensemble de données de départ de Kaggle pour les séries chronologiques.
Merci pour la lecture!
J'espère que vous avez apprécié l'article et augmenté vos connaissances sur l'analyse des séries chronologiques. N'hésitez pas à me contacter une [email protégé] Linkedin
Vous voulez partager vos pensées? N'hésitez pas à commenter ci-après
A propos de l'auteur
Mohamed Illias
Actuellement, Je poursuis mon baccalauréat en ingénierie (ÊTRE) en informatique de la École d'ingénieurs du gouvernement, Srirangam, Tamil Nadu. Je suis très excité par les statistiques, apprentissage automatique et science des données.
Connectez-vous avec moi sur Linkedin Mohamed Illias
Les supports présentés dans cet article expliquant comment implémenter l'application Streamlit sur Heroku ne sont pas la propriété de DataPeaker et sont utilisés à la discrétion de l'auteur.