Introduzione ai Big Data con Apache Spark – UC Berkeley X

Contenuti

Questo corso tenterà di articolare l'output atteso dei data scientist e quindi insegnerà agli studenti come utilizzare PySpark (parte de Apache Spark) per soddisfare queste aspettative. Le assegnazioni del corso includono esercizi di log mining, accreditamento delle entità testuali e filtraggio collaborativo che insegnano agli studenti come manipolare i set di dati attraverso l'elaborazione parallela con PySpark.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.