Site Reliability Engineer (SRE) – Datadog
Description
Dans le cadre du renforcement des pratiques d’ observabilité et de fiabilité opérationnelle , nous recherchons un Site Reliability Engineer (SRE) spécialisé sur Datadog . Vous interviendrez sur des applications critiques afin de fiabiliser le Run, anticiper les incidents et améliorer la performance globale des systèmes. Vous intégrerez les équipes Ops / Plateforme / Production , en collaboration étroite avec les équipes Développement, Cloud et Sécurité . Objectifs de la mission Consolider et industrialiser le monitoring et l’observabilité Améliorer la qualité du Run Anticiper et réduire les incidents récurrents Renforcer la fiabilité et la résilience des applications du périmètre Missions principales Observabilité & Monitoring
- Datadog Définir, mettre en place et optimiser les dashboards Datadog Configurer et maintenir l’ APM (Application Performance Monitoring) Implémenter des monitors (alerting, sondes, seuils dynamiques) Créer des dashboards métiers et techniques pour les équipes applicatives Superviser logs, métriques, traces et événements via : Datadog Logs Datadog Metrics Datadog Tracing
Skills
Want AI to find more roles like this?
Upload your CV once. Get matched to relevant assignments automatically.