Fiche de poste : Ops Plateforme et IaC
1. Contexte et finalité du poste
Edu-Kit est une plateforme de virtualisation à vocation pédagogique destinée aux établissements d’enseignement supérieur et technique. Le poste s’intègre au pôle Ops (4 personnes au total) et porte trois périmètres complémentaires : la gestion de la plateforme côté provisionnement automatisé (cluster Proxmox), l’infrastructure en tant que code (Infrastructure as Code), et la gestion centralisée des secrets (Vaultwarden).
La finalité du poste est de rendre l’infrastructure reproductible, automatisable et auditée, en garantissant que tout l’état de la plateforme est descriptible dans du code versionné et reconstructible à partir de celui-ci.
Le titulaire travaille en polyvalence avec les trois autres Ops (Architecte Réseau et accès distants, Plateforme et supervision, Sécurité et intégration continue), au sein d’une équipe agile fonctionnant en sprints Scrum de 3 semaines.
2. Missions principales
- Concevoir, déployer et maintenir l’infrastructure en tant que code (Infrastructure as Code) avec OpenTofu pour le provisionnement et Ansible pour la configuration.
- Co-piloter la gestion du cluster Proxmox côté provisionnement automatisé (en co-responsabilité avec l’Ops Plateforme et supervision qui pilote l’exploitation).
- Mettre en place et opérer Vaultwarden comme coffre-fort de secrets de l’équipe (configuration, rotation, politiques d’accès, intégration applicative).
- Industrialiser le déploiement des composants techniques de la plateforme (y compris des outils sécurité comme Wazuh, dont l’opération et les règles de détection restent du ressort de l’Ops Sécurité et CI/CD).
- Documenter les procédures d’exploitation associées dans le repo de documentation.
3. Responsabilités détaillées
- Responsable final de l’IaC : OpenTofu, Ansible, scriptage d’inventaires, méthode GitOps appliquée à l’infrastructure.
- Responsable final de Vaultwarden : configuration, rotation des secrets, politiques d’accès.
- Co-responsable, avec l’Ops Plateforme et supervision, du cluster Proxmox (provisionnement automatisé d’un côté, exploitation et supervision de l’autre).
- Contributeur sur les revues d’architecture lorsqu’il y a un impact sur la chaîne d’automatisation.
- Garant de la reproductibilité : tout l’état de la plateforme doit être descriptible et reconstructible à partir du code versionné.
4. Compétences techniques requises
| Compétence | Niveau attendu |
|---|---|
| OpenTofu (Terraform compatible) : modules, état distant, planification, application | Avancé |
| Ansible : rôles, playbooks, inventaires, vault, gestion de configuration | Avancé |
| Proxmox VE (côté API et provisionnement) | Avancé |
| Vaultwarden (déploiement, configuration, intégration applicative) | Confirmé |
| Linux serveur (noyau, réseau, processus, sécurité) | Avancé |
| Scriptage Bash et Python | Confirmé |
| Méthode GitOps appliquée à l’infrastructure | Confirmé |
5. Compétences non techniques attendues
- Rigueur dans la documentation : tout geste manuel doit aussitôt être automatisé ou documenté.
- Capacité à dialoguer avec les autres Ops sur les chaînes croisées (provisionnement IaC ↔ exploitation, IaC ↔ CI/CD applicative, IaC ↔ déploiement d’outils sécurité).
- Communication écrite et orale en français et en anglais (équivalent niveau B2 attendu pour la documentation OpenTofu et Ansible, majoritairement anglophone).
- Sens du collectif : travail régulier avec l’Ops Plateforme et supervision sur le cluster Proxmox, avec l’Ops Sécurité et CI/CD sur l’intégration des secrets dans les déploiements.
6. Livrables types
- Code Terraform / OpenTofu modulaire, versionné, avec état distant maîtrisé.
- Playbooks Ansible idempotents, avec inventaires séparés par environnement.
- Configuration Vaultwarden versionnée, politiques d’accès documentées.
- Procédures d’exploitation pour les gestes récurrents (rotation de secrets, ajout d’un module OpenTofu, mise à jour d’un playbook Ansible, etc.).
- Schémas d’architecture de la chaîne IaC à jour.
7. Indicateurs de réussite
| Indicateur | Cible |
|---|---|
| Couverture IaC : pourcentage de l’infrastructure descriptible en code | ≥ 90 % |
| Délai moyen de propagation d’un changement IaC en production | < 30 minutes (validation incluse) |
| Rotation des secrets Vaultwarden sensibles | ≤ 90 jours |
| Disponibilité du cluster Proxmox côté provisionnement | ≥ 99,5 % |
| Taux de couverture des procédures d’exploitation sur les gestes récurrents | 100 % |
8. Interactions principales
- Développeur back et architecte : conception des contrats de déploiement applicatif, gestion des secrets côté API via Vaultwarden.
- Ops Plateforme et supervision : co-responsabilité du cluster Proxmox, complémentarité provisionnement automatisé ↔ exploitation et supervision.
- Ops Architecte Réseau et accès distants : intégration des règles réseau Mikrotik dans les playbooks Ansible.
- Ops Sécurité et intégration continue : intégration des secrets Vaultwarden dans les pipelines K3S et ArgoCD, déploiement industrialisé des composants de sécurité opérés par l’Ops Sécurité (notamment les agents Wazuh) via Ansible.
- Product Owner du sprint : priorisation des évolutions IaC, arbitrages sur les nouvelles automatisations à mettre en place.