Sécurité
Playbook d'incident: rollback rapide en moins de 10 minutes
Standardiser la réponse lorsqu'une régression de performance ou une anomalie thermique apparaît.
Mis à jour le 31 janv. 2026 · 7 min · Équipes NOC et support
Conditions de déclenchement du rollback
Déclenchez le rollback si le ratio de shares rejetées double ou si la température des cartes dépasse votre seuil critique.
Arrêtez immédiatement l'extension du déploiement et isolez le lot affecté.
Étapes standard de rollback
Appliquez l'image précédente validée via votre gestionnaire firmware centralisé.
Confirmez la reconnexion stratum, la stabilité des fréquences et l'acceptation pool avant de clôturer l'incident.
Postmortem et requalification
Consignez les conditions ambiantes, la révision machine et le profil utilisé pendant l'incident.
Reprenez le déploiement uniquement après reproduction et correction du problème sur un rack pilote.
Conseil: lancez des lots pilotes avant le déploiement large et conservez les images firmware précédentes.
Avertissement: évitez les changements de profil en conditions de refroidissement instables ou lors d'une indisponibilité partielle de rack.
