Publié le 28/11/2024
En tant que SRE, vos missions seront de :
Prendre en charge le run et la supervision des systèmes :
Gérer les incidents en production et assurer le maintien en conditions opérationnelles (MCO) des environnements clients (AWS, Kubernetes, on-premise).
Développer des processus pour la gestion proactive des incidents (prévention, alertes, escalades).
Travailler à la réduction du « toil » en automatisant les tâches répétitives et les processus manuels liés au run.
Superviser et optimiser la fiabilité des systèmes :
Mettre en place et maintenir des outils de supervision, monitoring et alerting (Prometheus, Grafana, ELK, etc.).
Garantir la disponibilité et la performance des systèmes grâce à des indicateurs SLA, SLO et SLI.
Identifier les points de contention et proposer des optimisations pour garantir la scalabilité et la résilience des infrastructures.
Développer l’automatisation des pipelines CI/CD et améliorer les processus de déploiement
Participer à l’évolution des chaînes CI/CD et du patrimoine applicatif pour tendre vers un déploiement continu (Continuous Deployment).
Standardiser les pipelines d’intégration et de livraison pour qu’ils répondent aux besoins des équipes produit et intégration.
Contribuer à la fiabilité et la cohérence des déploiements sur des environnements variés (AWS, Kubernetes, on-premise) en appui du Lead Dev.
Participer aux projets de migration
Apporter une expertise technique pour migrer nos clients vers AWS ou des hébergeurs SecNumCloud.
Contribuer à la mise en oeuvre d’architectures robustes et scalables adaptées à chaque environnement client en appui aux équipes architectes.
Collaborer avec les équipes pluridisciplinaires :
Accompagner l’équipe d’intégration dans le déploiement des solutions sur les contextes clients.
Travailler avec l’équipe architecture pour standardiser et optimiser les bonnes pratiques.
Soutenir l’équipe produit dans la mise en place d’environnement de travail adapté.
Profil du candidat
Cloud : Expertise avec AWS (EC2, S3, RDS, EKS, etc.) et bonne compréhension des enjeux multi-clouds et hybrid-clouds.
Conteneurs et orchestration : Maîtrise de Kubernetes et des environnements conteneurisés (Docker).
Run et exploitation : Expérience dans la gestion du MCO et de la production dans des environnements complexes.
Infrastructure as Code : Expérience avec Terraform, Ansible ou équivalent.
Observabilité : Compétence sur des outils comme Prometheus, Grafana, ELK, ou équivalents.
CI/CD : Connaissance approfondie des outils comme GitLab CI, ou équivalents, avec une expérience dans l’évolution vers le déploiement continu.
Langages : Bonne maîtrise de langages de scripting (Python, Bash) et compréhension des bases de développement logiciel.
Description de l‘entreprise
Compétences comportementales
Capacité à résoudre des problèmes complexes, y compris en situation d’urgence.
Fort esprit collaboratif et capacité à se coordonner avec plusieurs équipes.
Orientation résultat et volonté d’améliorer les processus existants.
Capacité à s’adapter rapidement à des environnements techniques variés.
Formation supérieure en informatique (Bac+5 ou équivalent).
Expérience de 3 à 5 ans dans un rôle similaire (SRE, DevOps, ou Ingénieur système avec une forte dimension opérationnelle).
Il n'y a pas d'offres.
All rights reserved © FreelanceDay 2025
FeelanceDay, date création entreprise 12-05-2017 - Il y a 8 ans, forme juridique : SARL unipersonnelle, noms commerciaux REESK DIGITAL SOLUTION, adresse postale 28 RUE DE LONDRES 75009 PARIS, numéro SIREN : 829739622, numéro SIRET (siège) : 2973962200019, numéro TVA Intracommunautaire : FR28829739622, numéro RCS Paris B 829 739 622, activité (Code NAF ou APE), edition de logiciels applicatifs (5829C)