Introduction au Big Data avec Apache Spark – Université de BerkeleyX

Contenu

Ce cours tentera d'articuler les résultats attendus des scientifiques des données, puis enseignera aux étudiants comment utiliser PySpark (parte de Apache Spark) pour répondre à ces attentes. Les devoirs du cours comprennent des exercices d'extraction de grumes, accréditation d'entités textuelles et filtrage collaboratif qui enseignent aux étudiants comment manipuler des ensembles de données via un traitement parallèle avec PySpark.

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.