SAS reste l'un des outils les plus utilisés dans le Science des données industrie. Bien que les gens puissent avoir des opinions différentes sur sa durabilité et ses fonctionnalités par rapport à d'autres outils comme R et Python, deux choses sont sûres:
- Une part de marché saine – SAS continue d'avoir la plus grande part de marché en termes d'emplois, même sur des marchés avancés comme les États-Unis. UU. Et le Royaume-Uni, La part du marché du travail de SAS serait d'au moins 40%. Dans des pays comme l'Inde, ce serait plus que 70%.
- Facilité d'apprentissage et soutien incroyable – Parmi tous les outils que je connais, SAS serait probablement considéré comme le plus facile à apprendre. La langue est facile et peut être apprise rapidement même par les débutants.
Celles 2 les raisons sont assez bonnes pour considérer SAS, si vous débutez dans cette industrie. Vous pouvez trouver plus de détails sur la façon dont SAS se compare à d'autres outils ici.
Paso 0: Pourquoi apprendre SAS?
Une petite vidéo pour vous préparer à ce qui vous attend:
https://www.youtube.com/watch?v=ksp8CzIgb-E
Paso 1: Téléchargement et installation de SAS
Téléchargez l'édition Université en créant un profil SAS. Vous devrez également télécharger VMWare ou Oracle Virtual box. voici les liens:
Notes d'installation:
- L'édition universitaire SAS ne fonctionne aujourd'hui que sur des machines de 64 morceaux
- Vous devez d'abord télécharger VMWare Player ou Oracle Virtual Box, puis télécharger la version respective de l'édition SAS University.
Paso 2: Base d'apprentissage SAS
Suivez la formation Base SAS sur sas.com. Cette formation est gratuite et vous apprendra les bases du langage SAS en 24 Heures.
Programmation SAS 1: Fondamentaux
Tâche / Test: Résoudre le questionnaire à la fin de chaque section du cours.
Paso 3: Apprentissage SQL
Maintenant que vous connaissez la base SAS dans une certaine mesure, Je devrais trouver un autre moyen de saisir les données dans SAS – PROC SQL. Lisez cet article pour comprendre comment PROC SQL aide: Comparaison entre Proc SQL et Data Step
Si vous connaissez déjà SQL, Je remercierais SAS d'avoir créé PROC SQL. Même si vous ne connaissez pas SQL, vous trouverez peut-être plus facile de faire vos tâches quotidiennes de gestion des données dans SAS. Vous pouvez consulter ce document SUGI: Introduction à PROC SQL Si vous avez besoin d'un tutoriel plus détaillé, tu peux consulter ce tuto: Introduction à PROC SQL
Paso 4: Apprendre les statistiques descriptives
Commençons notre apprentissage statistique maintenant. C'est le bon moment pour suivre le cours Statistiques DataPeaker. Ce cours utiliserait Python pour vous enseigner toutes les bases des statistiques descriptives. Si vous les connaissez déjà, vous pouvez sauter cette étape.
Mission: Les devoirs après chaque chapitre du cours doivent être effectués en SAS. Votre connaissance du cours Base SAS devrait être suffisante pour les compléter. Si vous avez besoin d'une aide spécifique, utiliser la documentation SAS.
Paso 5: apprendre les statistiques inférentielles
Les cours précité couvre également les statistiques inférentielles en Python, y compris des sujets tels que les tests d'hypothèses, test t et bien d'autres. Si vous les connaissez déjà, vous pouvez sauter cette étape.
Mission: Les devoirs après chaque chapitre du cours précédent doivent être effectués en Python ou Excel pour le moment. Nous les visiterons à nouveau une fois que nous aurons franchi les prochaines étapes avec le cours SAS.
Paso 6: Apprendre de l'ANOVA, régression linéaire et logistique en SAS
EntraînementLa formation est un processus systématique conçu pour améliorer les compétences, connaissances ou aptitudes physiques. Il est appliqué dans divers domaines, Comme le sport, Éducation et développement professionnel. Un programme d’entraînement efficace comprend la planification des objectifs, Pratique régulière et évaluation des progrès. L’adaptation aux besoins individuels et la motivation sont des facteurs clés pour obtenir des résultats réussis et durables dans toutes les disciplines.... de sas.com – Introduction à l'ANOVA, régression et régression logistique.
Mission: Disponible dans le cours et à partir du cours Udacity
Si vous travaillez dans l'édition SAS University, vous devrez sauter les étapes 7, 9 Oui 10. L'édition SAS University a ses propres limites et ne peut pas exécuter d'arbres de décision ou de modèles de séries chronologiques.
Paso 7: apprentissage des arbres de décision
Maintenant que vous connaissez quelques algorithmes, regardons les arbres de décision. Voici un article étonnant expliquant le fonctionnement des arbres de décision:
- Arbre de décision: simplifié
Voici un guide pour courir Arbres de décision dans Enterprise Miner et voici un papier qui l'implémente dans Base SAS
Paso 8: agrupación y segmentationLa segmentation est une technique de marketing clé qui consiste à diviser un large marché en groupes plus petits et plus homogènes. Cette pratique permet aux entreprises d’adapter leurs stratégies et leurs messages aux spécificités de chaque segment, améliorant ainsi l’efficacité de vos campagnes. Le ciblage peut se faire sur des critères démographiques, Psychographique, géographique ou comportementale, Faciliter une communication plus pertinente et personnalisée avec le public cible....
Premier, regarde le premier 4 vidéos dans cette playlist pour l'introduction au clustering k-means. Lecture suivante ce guide À propos de la mise en cluster SAS. Parallèlement à ce guide, vous pouvez aussi utiliser Ce chapitre comme une bonne référence.
Paso 9: apprentissage des prévisions de séries chronologiques
Voici une bonne introduction pour commencer à apprendre. Séries temporelles de prévision et utilisez plus tard ce guide pour faire des prévisions à l'aide de Séries temporelles en SAS
Paso 10: apprendre IML
Voici un certain nombre de publications qui peuvent vous aider à vous familiariser avec IML:
- Présentation de SAS IML
- Prochaines étapes dans le monde PROC IML
- Aplicación de PROC IML en analytiqueL’analytique fait référence au processus de collecte, Mesurer et analyser les données pour obtenir des informations précieuses qui facilitent la prise de décision. Dans divers domaines, Comme les affaires, Santé et sport, L’analytique peut identifier des modèles et des tendances, Optimiser les processus et améliorer les résultats. L’utilisation d’outils et de techniques statistiques de pointe est essentielle pour transformer les données en connaissances applicables et stratégiques....
Paso 11: Apprendre les macros SAS
Vous trouverez ci-dessous la série d'articles pouvant contribuer à la compréhension de SAS Macro:
- Introduction à la macro SAS
- Déclarations de macros itératives et conditionnelles SAS
- Introduction aux fonctions macro SAS
Autres ressources utiles pour SAS:
- Livret SAS
- ATS UCLA Parcours d'apprentissage
- Exemples d'analyse de données – exemples sur des sujets spécifiques dans SAS.