ML platform senior DevOps engineer (H/F)
Salaire du marché
Basé sur 66 offres pour ce poste (SENIOR, France, 3 dernières semaines). Fourchette habituelle 440€/j–565€/j, médiane 485€/j. Cette offre (450€/j) est dans la fourchette.
Description du poste
🧩 Contexte de mission
Au sein des équipes ML Platform et ML Lab, la mission vise à améliorer la productivité des chercheurs en machine learning (ML) via le développement de bibliothèques, services et bonnes pratiques, tout en assurant la robustesse des environnements de production ML à grande échelle. L’équipe ML Lab, orientée recherche académique, nécessite des outils et infrastructures dédiés, indépendants de l’infrastructure CFM, pour accéder aux ressources open-source et collaborer avec des partenaires externes.
🛠 Missions principales et rôle
En tant que DevOps Engineer Senior ML Platform, vous serez responsable de :
- Configuration du cloud Lambda pour fournir un accès GPU au ML Lab.
- Mise en œuvre de fonctionnalités FinOps et protections minimales contre les erreurs critiques.
- Optimisation des images Docker pour accélérer les démarrages à froid.
- Implémentation et maintenance de systèmes de monitoring pour l’entraînement des modèles.
- Participation ponctuelle aux projets ML Platform sur AWS, incluant CI/CD et outils pour l’ensemble des chercheurs CFM.
- Promotion et mise en œuvre des processus d’automatisation.
- Renforcement des protocoles de sécurité, incluant évaluation des vulnérabilités et gestion des risques.
🎯 Objectifs et livrables
- Environnements cloud configurés pour la recherche ML avec GPU et sécurité minimale.
- Images Docker optimisées et pipelines CI/CD robustes.
- Monitoring fiable des entraînements ML avec alertes pertinentes.
- Processus d’automatisation documentés et appliqués.
- Amélioration de la sécurité via audits et mesures correctives.
📚 Compétences requises
Techniques (obligatoires)
- Terraform et AWS (provisioning, infrastructure as code).
- CI/CD (GitLab CI, Jenkins) et automatisation.
- Docker et gestion d’images à grande échelle.
- Systèmes UNIX/Linux et administration.
- Mise en place et suivi de systèmes de monitoring.
Soft skills
- Capacité à défendre des opinions techniques de manière constructive.
- Savoir s’adapter et accepter des décisions tout en restant engagé.
- Orientation utilisateur et vision long terme pour les solutions.
- Motivation et engagement envers le partage de compétences et la productivité collective.
Techniques (appréciées / nice to have)
- Expérience liée au ML ou environnements de calcul haute performance.
- Expérience avec Lambda et environnements on-premise.
- Connaissance de Slurm appréciée.
👤 Profil recherché
- Formation : Bac+5 en informatique, génie logiciel ou équivalent.
- Expérience : Minimum 3-5 ans en DevOps, idéalement dans un environnement ML ou recherche scientifique.
- Qualités personnelles : rigueur, autonomie, esprit d’analyse, capacité à travailler en équipe multiculturelle et distribuée.
- Langues : anglais professionnel courant (écrit et oral) pour documentation et échanges avec équipes internationales.
- Atouts : curiosité pour les technologies ML, capacité à proposer des solutions innovantes et à partager les bonnes pratiques DevOps.
Exigences du poste
Stack technique :
À propos de l'entreprise
Publié par
Intéressé par cette offre ?
Cliquez sur "Postuler" pour accéder à l'offre.