35-3 · Chapitre 35 · 6 min de lecture

L'approbation de déploiement ne signifie pas ralentir

Un changement prêt à être déployé ne devrait pas être bloqué par une cascade d'approbations. Découvrez comment la gouvernance basée sur les risques permet d'allier vitesse et sécurité.

L'approbation de déploiement ne signifie pas ralentir

Vous avez un changement prêt à être mis en production. Il est testé, revu, et il attend dans une branche. Mais avant que quelqu'un puisse appuyer sur le bouton, la question fatidique se pose : qui doit approuver ce déploiement ?

Certaines équipes répondent en listant toutes les personnes potentiellement impactées. Le manager doit signer. L'ingénieur principal doit vérifier. Le responsable QA doit confirmer. Le RSSI veut une revue. Avant que vous ne vous en rendiez compte, vous avez cinq personnes qui doivent approuver un seul déploiement, et chacune met entre une heure et deux jours à répondre.

Le résultat est prévisible. L'équipe attend. Le déploiement stagne. Et quand finalement quelque chose tourne mal, toutes ces approbations n'ont de toute façon pas empêché le problème. Le processus a ajouté du délai sans ajouter de sécurité.

C'est un piège courant. Plus d'approbations donnent l'impression d'avoir plus de contrôle. Mais en pratique, les couches d'approbation créent souvent un faux sentiment de sécurité tout en ralentissant tout le monde. La question n'est pas de savoir qui doit approuver. La question est de savoir quel risque ce changement comporte et si l'équipe est prête à le gérer.

Gouvernance basée sur les risques : adapter les vérifications à l'impact

Une meilleure approche consiste à adapter le niveau de contrôle au risque réel du changement. C'est ce qu'on appelle la gouvernance basée sur les risques, mais l'idée est plus simple que le nom ne le suggère.

Les changements à faible risque doivent aller vite. Les changements à haut risque doivent recevoir plus de vérifications. Ces vérifications ne signifient pas forcément attendre que des gens approuvent. Elles peuvent signifier des tests automatisés plus poussés, une vérification manuelle sur des parties spécifiques, ou limiter le nombre d'utilisateurs impactés en cas de problème.

Prenons deux exemples. Votre équipe veut changer la couleur d'un bouton sur une page de paramètres. L'impact est minime. Les utilisateurs ne le remarqueront peut-être même pas. Si quelque chose casse, le pire des cas est un bouton difficile à voir. Ce changement peut partir directement en production sans attendre personne.

Imaginez maintenant que votre équipe doive modifier le schéma de base de données d'une table de transactions. L'impact est énorme. Une erreur pourrait corrompre des données ou perdre des enregistrements clients. Ce changement nécessite plus de préparation : tester la migration sur un environnement semblable à la production, préparer un plan de rollback, et faire vérifier le script par quelqu'un qui comprend la base de données.

Voici un extrait de pipeline YAML qui implémente cette idée en sautant l'approbation manuelle pour les changements à faible risque et en l'exigeant pour les changements à haut risque :

# .github/workflows/deploy.yml (extrait)
name: Deploy
on: [push]

jobs:
  deploy:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - name: Determine risk level
        id: risk
        run: |
          changed=$(git diff --name-only ${{ github.event.before }} ${{ github.sha }})
          if echo "$changed" | grep -qE "^(db/|src/payments/)"; then
            echo "level=high" >> $GITHUB_OUTPUT
          else
            echo "level=low" >> $GITHUB_OUTPUT
          fi
      - name: Manual approval for high-risk changes
        if: steps.risk.outputs.level == 'high'
        uses: trstringer/manual-approval@v1
        with:
          secret: ${{ secrets.APPROVAL_TOKEN }}
          approvers: team-leads
      - name: Deploy
        run: ./deploy.sh

Même équipe, même pipeline de déploiement, mais des niveaux de contrôle différents. C'est ça, la gouvernance basée sur les risques en pratique.

Comment déterminer le niveau de risque

Les équipes ont besoin d'un moyen pratique pour décider si un changement est à faible ou haut risque. Voici quatre facteurs qui aident :

Voici un organigramme qui associe l'évaluation des risques au chemin de déploiement approprié :

flowchart TD A[Changement prêt] --> B{Évaluer le niveau de risque} B -->|Faible risque| C[Tests automatisés passent] C --> D[Déployer directement] B -->|Risque moyen| E[Tests automatisés + vérification manuelle] E --> F[Déployer avec monitoring] B -->|Haut risque| G[Vérifications complètes : test de charge, plan de rollback, revue par un pair] G --> H[Déploiement progressif : canary ou feature flag] H --> I[Surveiller et rollback si nécessaire]

Quelle est l'ampleur de l'impact ? Le changement affecte-t-il une petite fonctionnalité ou l'ensemble du système ? Un changement sur une page d'administration rarement utilisée a moins d'impact qu'un changement sur le flux de connexion.

Quelle est la criticité de la partie modifiée ? Gère-t-elle des données utilisateur, des paiements ou de l'authentification ? Ces domaines méritent plus de prudence que les changements cosmétiques.

Est-il facile d'annuler le changement ? Pouvez-vous faire un rollback en quelques secondes, ou cela prend-il des heures ? Les migrations de base de données sont souvent plus difficiles à inverser que les changements de code. Les releases mobiles sont plus difficiles à retirer que les déploiements web.

Quelle est la préparation de l'équipe en cas d'échec ? Avez-vous un monitoring qui détecterait rapidement les problèmes ? Existe-t-il un runbook pour gérer les incidents ? Si l'équipe a une bonne observabilité et des procédures de reprise claires, elle peut aller plus vite même sur des changements plus risqués.

Ces facteurs aident les équipes à prendre des décisions cohérentes. La même équipe peut déployer dix petits changements en une journée sans friction, puis prendre plus de temps pour un gros changement. Ce n'est pas de l'incohérence. C'est une gestion proportionnée des risques.

Des critères de préparation, pas des listes d'approbation

Au lieu de demander qui doit signer, définissez les conditions qui doivent être remplies avant le déploiement. Ce sont des critères de préparation, et ils doivent découler du changement lui-même, pas du titre de poste de quelqu'un.

Pour un changement à faible risque, les critères de préparation peuvent être simples : tous les tests automatisés passent, et aucune nouvelle erreur n'est apparue en staging.

Pour un changement à haut risque, les critères de préparation peuvent inclure : tests de charge terminés, script de migration vérifié par une deuxième personne, plan de rollback documenté et testé, et tableaux de bord de monitoring confirmés comme fonctionnels.

Les critères sont objectifs. Ils ne dépendent pas de qui a la voix la plus forte ou le rang le plus élevé. Ils dépendent de ce dont le changement a besoin pour être sûr.

Cette approche maintient l'équipe en mouvement. Les changements à faible risque ne sont pas ralentis par des approbations inutiles. Les changements à haut risque reçoivent l'attention qu'ils méritent sans se transformer en jeu d'attente pour des signatures qui ne réduisent pas réellement le risque.

Une checklist pratique pour votre équipe

Si vous voulez commencer à appliquer cela dès aujourd'hui, voici un cadre simple :

Pour chaque changement, demandez : quel est le pire qui pourrait arriver ?
Si le pire des cas est mineur, déployez sans attendre.
Si le pire des cas est grave, définissez les vérifications nécessaires avant le déploiement.
Faites de ces vérifications une partie intégrante du processus, pas une étape d'approbation séparée.
Révisez les critères régulièrement. Ce qui semblait risqué il y a six mois pourrait être routinier maintenant.

Ce qu'il faut retenir

La vitesse et la sécurité ne sont pas opposées. Les équipes les plus rapides ne sont pas celles qui ont le moins d'approbations. Ce sont celles qui adaptent leur processus au risque réel de chaque changement. Lorsque vous arrêtez de demander qui doit approuver et commencez à demander de quoi le changement a besoin pour être sûr, vous supprimez les frictions inutiles sans supprimer la protection nécessaire. Votre équipe va plus vite, et votre production reste stable.