Publié il y a 13 jours

Observability Manager (H/F)

Entreprise

Cherry PickPlateforme freelance

Localisation

Paris

Hybride

Type de contrat

Freelance

Niveau

SENIOR

Rémunération

550€• Taux journalier

0vues

0clics

Description du poste

📌 Contexte & Enjeux

Dans un contexte de transformation technologique à grande échelle, nous recherchons un(e) Observability Manager afin de piloter et structurer la stratégie d’observabilité globale des plateformes IT, infrastructures cloud et applications critiques du groupe.

Rattaché(e) au DevOps Manager, vous jouerez un rôle central dans l’amélioration de la visibilité opérationnelle des systèmes, la réduction du MTTR, l’optimisation des performances applicatives et le renforcement de la résilience des environnements techniques.

Vous interviendrez sur un périmètre transverse couvrant les infrastructures on-premise, les environnements cloud (AWS/GCP), les plateformes conteneurisées, les APIs, les systèmes événementiels, les middlewares et les applications métiers critiques.

🎯 Missions principales

🔎 Définition de la stratégie Observability

Définir et piloter la stratégie globale d’observabilité couvrant :
- logs,
- métriques,
- traces,
- événements,
- dashboards,
- KPIs métiers,
- synthetic monitoring.
Standardiser les pratiques et usages des outils d’observabilité au sein des équipes techniques.
Définir les standards d’instrumentation et de télémétrie pour les architectures cloud-native et microservices.
Accompagner les projets de modernisation vers des environnements hautement observables.

⚙️ Gestion des plateformes d’observabilité

Garantir la disponibilité, la performance et la scalabilité des plateformes de monitoring et de logging.
Piloter les configurations, upgrades, intégrations et stratégies de capacity planning.
Superviser les connecteurs applicatifs, APIs, bases de données, composants réseau et services cloud.
Assurer la qualité des données collectées, les politiques de rétention et l’efficacité de l’indexation.

🌐 Visibilité End-to-End & Monitoring avancé

Déployer et faire respecter les standards d’instrumentation sur :
- applications,
- conteneurs Kubernetes,
- workloads serverless,
- bases de données,
- infrastructures,
- composants réseau.
Collaborer avec les équipes DevOps, SRE et Software Engineering pour intégrer les mécanismes de tracing et telemetry.
Participer à la mise en place des SLO, error budgets et stratégies d’alerting.

🚨 Incident Intelligence & Fiabilité des services

Mettre en œuvre des mécanismes de détection proactive des anomalies.
Améliorer les capacités de Root Cause Analysis (RCA), dependency mapping et topology analysis.
Réduire les temps de résolution des incidents (MTTR).
Fournir des dashboards temps réel pour accompagner la gestion des incidents majeurs.

🤖 Automatisation & Alerting intelligent

Définir des politiques d’alerting intelligentes :
- réduction du bruit,
- corrélation,
- classification des alertes.
Développer des automatisations intégrées aux pipelines DevOps et opérations.
Exploiter les capacités AI/ML des plateformes d’observabilité pour l’analyse prédictive et la stabilité des systèmes.🤝 Collaboration & Accompagnement transverse

Collaborer avec les équipes :
- IT Operations,
- DevOps,
- SRE,
- Architecture,
- Cybersécurité,
- QA,
- Data.
Accompagner les équipes techniques dans l’adoption des bonnes pratiques d’observabilité.
Produire la documentation technique et animer des sessions de formation.
Être le point de contact principal sur les sujets observabilité lors des programmes de transformation.

📦 Livrables attendus

Stratégie d’observabilité globale.
Standards d’instrumentation et de monitoring.
Dashboards techniques et KPIs métiers.
Plans d’amélioration de la fiabilité et de la performance.
Documentation et référentiels observabilité.
Reporting de performance et de stabilité.
Mise en œuvre des SLO / alerting / monitoring intelligent.

🛠️ Compétences requises

🔹 Observability & Monitoring

Dynatrace
Splunk
Zabbix
Datadog
Prometheus / Grafana
ELK Stack
CloudWatch / GCP Monitoring

🔹 Cloud & Architecture

AWS
GCP
Kubernetes (EKS / GKE)
Microservices
APIs
Kafka / Event-Driven Architecture
Environnements cloud-native

🔹 Automatisation & Scripting

Python
Bash
PowerShell
Terraform
CI/CD & GitOps

🔹 Bases techniques complémentaires

Monitoring de bases Oracle, PostgreSQL, SQL Server
Réseaux (VPN, SD-WAN, Load Balancers)
VMware & infrastructures hybrides
Observabilité applicative & distributed tracing

👤 Profil recherché

8 à 12 ans d’expérience en IT Operations, DevOps, SRE ou Performance Engineering.
Expérience confirmée dans la gestion de plateformes d’observabilité à grande échelle.
Solide expertise des environnements distribués et cloud-native.
Expérience significative sur des architectures microservices et événementielles.

Exigences du poste

Stack technique :

DynatraceSplunkZabbixDatadogPrometheusGrafanaElk stackCloudWatchGCPAWS

À propos de l'entreprise

Cherry PickPlateforme freelance

Secteur ::Transport

Voir toutes les offres de Cherry Pick

Publié par

Recruteur

Intéressé par cette offre ?

Cliquez sur "Postuler" pour accéder à l'offre.