Gentis Recruitment SASParis, FR

đŸ“© Data Engineer confirmĂ© – Environnement Data Platform / Gouvernance

Project-Based

Description

Contexte de la mission Dans le cadre du dĂ©veloppement d’une plateforme data au sein d’un grand groupe du secteur de l’énergie, vous intervenez au sein d’une Ă©quipe transverse dĂ©diĂ©e Ă  l’accĂ©lĂ©ration des usages Data et IA. L’équipe accompagne les diffĂ©rents mĂ©tiers dans la conception, la mise en Ɠuvre et l’industrialisation de solutions data Ă  grande Ă©chelle, dans un environnement moderne (cloud, big data, data gouvernance). Missions Collecter et intĂ©grer des donnĂ©es issues de sources multiples (structurĂ©es et non structurĂ©es) Concevoir et maintenir des pipelines de donnĂ©es fiables et performants Structurer et modĂ©liser la donnĂ©e (logique sĂ©mantique, normalisation) Mettre en place des processus de data quality (nettoyage, dĂ©duplication, validation) Assurer la qualitĂ© et la cohĂ©rence des donnĂ©es intĂ©grĂ©es dans le Data Lake Participer Ă  la cartographie et Ă  la gestion des rĂ©fĂ©rentiels de donnĂ©es Collaborer avec les Data Analysts et Data Scientists pour faciliter l’exploitation des donnĂ©es Contribuer Ă  la gouvernance des donnĂ©es et Ă  la dĂ©finition du cycle de vie de la donnĂ©e Participer Ă  l’amĂ©lioration continue des performances et des coĂ»ts des traitements Environnement technique SQL (niveau avancĂ©) Spark Python APIs AWS Databricks Outils de data gouvernance (type Collibra

  • apprĂ©ciĂ©)

Skills

Apache SparkSQLDatabricksSparkAWSPython

Want AI to find more roles like this?

Upload your CV once. Get matched to relevant assignments automatically.

Try personalized matching