Dernière mise à jour le 12/07/2024

AWS : BigData avec Hadoop EMR

Informations générales

Type de formation : Formation continue
Domaine : Systèmes et Réseaux
Filière : Cloud computing
Rubrique : AWS
Formation éligible au CPF : Non
Formation Action collective : Non

Objectifs & compétences

Savoir mettre en oeuvre les techniques de calcul distribué avec Hadoop EMR

Public visé

Architectes, chefs de projets souhaitant bénéficier des services offerts par la distribution Hadoop fournie par AWS

Pré-requis

Connaissance des fondamentaux du cloud

Programme

Présentation AWS Hadoop EMR  
Rappels des services de base : EC2 (Elastic Compute Cloud), VPC (Virtual Private Cloud), S3 (Simple Storage Service), EBS (Elastic Block Storage), RDS (Relational Database Service)
Caractéristiques du calcul distribué et du service EMR (Amazon Elactis MapReduce)  
La distribution Hadoop EMR  
Historique du projet hadoop
Les fonctionnalités : stockage, outils d'extraction, de conversion, ETL, analyse, ...  
Exemples de cas d'utilisation sur des grands projets.
Les principaux composants :HDFS pour le stockage et YARN pour les calculs.
Les distributions et leurs caractéristiques.
Composants de la distribution Hadoop EMR  
Mise en œuvre  
Démonstrations sur une architecture Hadoop multi-noeuds.
TP : mise en place d'une configuration de base avec HBase.
Cycle de fonctionnement.
Transferts par s3.
Envoi des travaux.
Visualisation des résultats.
Suivi des travaux avec Hue.
Interactivité avec les Notebooks : jupyter.
Configuration des composants de la distribution.  
Exploitation  
Gestion des évènements avec Events.
Contrôle du réseau et des VPC.
Automatisation de l'exécution sur AWS depuis un poste local.
Suivi distant des travaux.
Journalisation, visualisation des logs.Utilisation de la ferme aws en débordement d'une ferme locale.  
Sécurité : mise en place d'une configuration de sécurité.
Liens avec IAM.  
Optimisation  
Analyse des performances.
Déploiement d'une configuration avec Spark.
Evaluation des performances par rapport à une ferme locale.
Comparaison des coûts.
Mise en place d'automates d'optimisation.
 

Modalités

Modalités : en présentiel, distanciel ou mixte – Horaires de 9H à 12H30 et de 14H à 17H30 soit 7H – Intra et Inter entreprise
Pédagogie : essentiellement participative et ludique, centrée sur l’expérience, l’immersion et la mise en pratique. Alternance d’apports théoriques et d’outils pratiques.
Ressources techniques et pédagogiques : Support de formation au format PDF ou PPT Ordinateur, vidéoprojecteur, Tableau blanc, Visioconférence : Cisco Webex / Teams / Zoom
Pendant la formation : mises en situation, autodiagnostics, travail individuel ou en sous-groupe sur des cas réels

Méthodes

Fin de formation : entretien individuel
Satisfaction des participants : questionnaire de satisfaction réalisé en fin de formation
Assiduité : certificat de réalisation (validation des acquis)
Code de formation : VC203

Tarifs

Prix public : 1900
Tarif & financement :
Nous vous accompagnons pour trouver la meilleure solution de financement parmi les suivantes :
  • Le plan de développement des compétences de votre entreprise : rapprochez-vous de votre service RH.
  • Le dispositif FNE-Formation.
  • L’OPCO (opérateurs de compétences) de votre entreprise.
  • Pôle Emploi sous réserve de l’acceptation de votre dossier par votre conseiller Pôle Emploi.
  • CPF -MonCompteFormation
Contactez nous pour plus d’information

Lieux & Horaires

Durée : 21 heures
Délai d'accès :
Jusqu’à 8 jours avant le début de la formation

Prochaines sessions

Handi-accueillante Accessible aux personnes en situations de handicap. Pour toutes demandes, contactez notre référente, Mme Rizlene Zumaglini Mail : rzumaglini@aston-ecole.com

à voir aussi dans le même domaine...

Formation continue

Cloud computing

AZ303

Microsoft Azure – Technologies pour les architectes

Comprendre comment gérer les souscriptions et les ressources Azure Savoir implémenter et gérer le stockage dans Azure Être capable de déployer et gérer des machines virtuelles Comprendre comment configurer et gérer des réseaux virtuels Savoir mettre en oeuvre la gestion des identités et en assurer la sécurité Connaître les différentes techniques et services propres à Azure (Service Fabric, Azure Kubernetes, …)  S

35 heures de formations sur 5 Jours
En savoir plus

Formation continue

Cloud computing

MSDP100

Microsoft Azure – Conception et implémentation de solutions de Data Science

Connaître les services d’Azure supportant la Data Science Comprendre comment utiliser les services Azure pour mettre en œuvre et déployer des solutions Machine Learning Savoir automatiser une solution de Data Science Comprendre comment mettre en œuvre une surveillance efficace de la solution  

21 heures de formations sur 3 Jours
En savoir plus

Formation continue

Cloud computing

AS951

Etat de l’art de la virtualisation

Comprendre les principes et les stratégies de virtualisation Connaître et différencier les différentes solutions du marché Savoir où et comment implémenter les infrastructures virtuelles Pouvoir décider de l'éligibilité des ressources à virtualiser Harmoniser la production virtuelle avec la production traditionnelle Être informé des règles de l'art dans la gestion des infrastructures virtuelles  

14 heures de formations sur 2 Jours
En savoir plus

Formation continue

Cloud computing

VC202

AWS : opérations système

Connaître les outils d'exploitation et d'administration disponibles dans le cloud AWS.

21 heures de formations sur 3 Jours
En savoir plus

Formation continue

Cloud computing

AZ304

Microsoft Azure – Conception d’architectures

Connaître les composants de l’architecture. Créer et déployer les modèles ARM. Comparer des infras variées, serverless, des BdD et des services de communication tels que les AppServices, les paramètres de montée en charge des machines virtuelles, Azure Cosmos DB, les BdD SQL. Incorporer des services variés de la plate-forme Azure dans une solution complète. Sécuriser, surveiller et sauvegarder des solutions déployées dans Azure, créer des solutions automatisées DevOps  

28 heures de formations sur 4 Jours
En savoir plus

Formation continue

Cloud computing

MSDP203

Microsoft Azure – Ingénierie de données

Savoir explorer les options de calcul et de stockage pour les charges de travail d'ingénierie des données dans Azure Être capable de concevoir et mettre en oeuvre la couche de diffusion Pouvoir comprendre les considérations d'ingénierie des données

28 heures de formations sur 4 Jours
En savoir plus