Pourquoi choisir AWS Glue ?
Préparer vos données pour obtenir des résultats de qualité est la première étape d'un projet analytique ou de ML. AWS Glue est un service d'intégration des données sans serveur qui facilite et accélère la préparation des données, et en réduit les coûts. Vous pouvez découvrir plus de 70 sources de données diverses et vous y connecter, gérer vos données dans un catalogue de données centralisé, et créer, exécuter et surveiller visuellement des pipelines ETL pour charger des données dans vos lacs de données.
Présentation d'AWS Glue (01:54)

Les avantages d'AWS Glue

Prise en charge flexible de l'ETL, de l'ELT, du traitement par lots, du streaming, etc., sans enfermement.
Échelle de plusieurs pétaoctets et facturation à l'utilisation quelle que soit la taille des données.
Fonctionnalités complètes d'intégration des données dans un seul service sans serveur.
Accompagne tous les utilisateurs de données, des développeurs aux utilisateurs professionnels.

Fonctionnement

AWS Glue est un service d'intégration des données sans serveur qui facilite la découverte, la préparation, le déplacement et l'intégration des données depuis des sources multiples pour l'analytique, le machine learning (ML) et le développement des applications.

  • Options des moteurs d'intégration des données
  • Sélectionnez votre moteur d'intégration des données favori dans AWS Glue pour prendre en charge vos utilisateurs et vos charges de travail.

    Le diagramme présente plusieurs options de moteurs de traitement des données pour AWS Glue.
  • ETL basé sur les événements
  • AWS Glue peut exécuter vos tâches d'extraction, de transformation et de chargement (ETL) à mesure que les nouvelles données arrivent. Par exemple, vous pouvez configurer AWS Glue pour que vos tâches ETL s'exécutent dès que de nouvelles données sont disponibles dans Amazon Simple Storage Service (S3).

    Diagramme indiquant comment AWS Glue peut exécuter vos tâches ETL à mesure que les nouvelles données arrivent.
  • Catalogue de données AWS Glue
  • Vous pouvez utiliser le catalogue de données pour la découverte et la recherche rapides sur plusieurs jeux de données AWS sans devoir déplacer les données. Une fois que les données sont cataloguées, elles sont immédiatement disponibles pour la recherche et l'interrogation avec Amazon Athena, Amazon EMR et Amazon Redshift Spectrum.

    Diagramme montrant le catalogue de données découvrant et recherchant des jeux de données sans déplacer les données.
  • Tâches ETL sans code
  • AWS Glue Studio facilite la création, l'exécution et la surveillance visuelles des tâches ETL dans AWS Glue. Vous pouvez créer des tâches ETL qui déplacent et transforment les données à l'aide d'un éditeur glisser-déposer. AWS Glue génère automatiquement le code.

    Diagramme indiquant comment les utilisateurs peuvent composer des tâches ETL qui déplacent et transforment les données à l'aide d'un éditeur glisser-déposer.
  • Gérer et contrôler la qualité des données
  • AWS Glue Data Quality automatise la création, la gestion et la surveillance des règles de qualité des données afin de garantir des données de haute qualité dans vos lacs et pipelines de données.

    Le diagramme présente comment AWS Glue Data Quality mesure, surveille et gère automatiquement la qualité des données dans les lacs et les pipelines de données.
  • Préparation des données
  • AWS Glue DataBrew vous permet d'explorer et d'expérimenter avec des données provenant directement de votre lac de données, de vos entrepôts de données et de vos bases de données, y compris Amazon S3, Amazon Redshift, AWS Lake Formation, Amazon Aurora et Amazon Relational Database Service (RDS). Vous pouvez choisir parmi plus de 250 transformations pré-intégrées dans DataBrew pour automatiser les tâches de préparation des données, telles que le filtrage des anomalies, la normalisation des formats et la correction des valeurs non valides.

    En outre, AWS Glue Studio offre un outil de préparation des données. Cet outil vous permet de préparer facilement les données grâce à une interface visuelle interactive de type pointer-cliquer sans écrire de code.

    Diagramme indiquant comment DataBrew automatise les tâches de préparation des données pour les utilisateurs.

Cas d'utilisation

Identifier efficacement les données

Identifiez rapidement les données sur AWS, sur site et dans d'autres clouds, puis rendez-les instantanément disponibles pour les interroger et les transformer.

Prendre en charge divers cadres de traitement et charges de travail

Prise en charge plus facile de divers cadres de traitement des données, tels que ETL et ELT, et de diverses charges de travail, y compris batch, micro-batch et streaming.

Explorer, expérimenter et traiter les données de manière interactive

Grâce aux sessions interactives AWS Glue, les ingénieurs de données peuvent explorer et préparer les données de manière interactive en utilisant l'environnement de développement intégré (IDE) ou le bloc-notes de leur choix.

Simplifier le développement de pipeline ETL

Supprimez la gestion de l'infrastructure grâce à l'allocation automatique et à la gestion des travailleurs, et regroupez tous vos besoins en matière d'intégration de données en un seul service.

Nouveautés

  • Date (de la plus récente à la plus ancienne)
Aucun résultat correspondant
1

Découvrir davantage sur AWS