Formation Apprendre à programmer avec Apache Spark

Jonas PASQUET

jonas.pasquet@kereon-intelligence.com

06 09 86 33 30

But et objectifs de la formation

Permettre aux Data Engineers et / ou Scientists d’acquérir les bases de développement avec Apache Spark et de créer des applications distribuées permettant de préparer, transformer et enrichir efficacement des volumes importants de données.

Apprendre les bases de développement avec Apache Spark
Développer des applications distribuées et optimisées

Modalités de suivi et d’exécution de la formation

Exécution de l’action

Feuilles de présence émargées par les stagiaires et le formateur
Evaluation des acquis en fin de session

Modalités d’évaluation des résultats (ou acquisition des compétences)

Questions écrites (QCM)
Questions pendant la formation
Résultats des exercices pratiques

Méthodes pédagogiques, techniques et d'encadrement mobilisées et informations complémentaires

Méthodes et outils pédagogiques

De la théorie à la pratique avec des cas d’usages concrets
Supports pédagogiques : Support du diaporama et ressources documentaires au format PDF
Prise en compte du handicap : Possibilité d’adapter les supports de formation et les lieux de formation en fonction des handicaps. Etude au cas par cas.

Eléments matériels de la formation

Supports techniques : L’ordinateur du stagiaire est requis.
Salle de formation : Rétroprojecteur, Espace de détente, Mobilisation d’une salle adaptée au PMR en cas de besoin
Equipements divers mis à disposition : N/A
Documentation : Diaporama formateur, site officiel de « Apache Spark »

Compétences des formateurs

Fiches de compétences des formateurs fournies au moment de la demande.

Informations complémentaires

Horaires : 9h-12h30 et 13h30-17h
Sessions à Niort ou Paris
Cette fomation s'adresse à des Data Engineers ou des Data Scientists

Accessibilité Handicap

Possibilité d’adapter les supports de formation et les lieux de formation en fonction des handicaps. Etude au cas par cas.

Public visé : Salarié, Manager

Format : Présentiel

Pré-requis : Aucun

Modalités et délai d'accès : Questionnaire de recueil des besoins, Délai d'accès : environ 15 jours à réception des documents contractuels signés, Délai d'inscription : au plus tard 15 jours avant le démarrage de la formation

Modalités d'évaluation : Etude de cas, Questionnaire

Rythme : Temps plein

Niveau de Formation : D - Autre formation professionnelle

Spécialité : Informatique, traitement de l'information, réseaux de transmission

Tarif formation HT : 1600,00 €Tarif HT par personne. Pour les formations en intra, nous consulter. Eligible OPCO

Durée :

2.0 jour(s)

14.0 heure(s)

Résumé du programme

SPARK_2J

Sessions à venir :

N'hésitez pas à nous contacter pour en savoir plus sur les prochaines sessions.

Programme de la formation

SPARK_2J

SPARK_2J
1. Big Data et Apache Spark a. Introduction au paradigme « Big Data » b. Apache Spark, à l’aide ! 2. Environnement de développement a. Environnement de développement (VSCode) b. Console interactive PySpark c. « Hello World » en Spark 3. Spark, DataFrames et Transformations a. Découverte de Spark SQL b. Création et évaluation des DataFrames c. Opérations de transformations 4. Architecture Spark a. Architecture et composants Spark b. Optimisation des requêtes c. Partitionnement des données 5. Structured Streaming a. Requête en flux continu b. Aggrégation des flux 6. Bonus : Machine Learning avec Spark MLlib a. Aperçu de Spark MLlib : notions de pipeline et modèle de Machine Learning

Documents

Statistiques & Indicateurs

Taux de satisfaction

90.9 %

Taux de réussite

100.0 %

Nombre de stagiaires5