SAN01¶
Criticite C1 - SPOF MAJEUR CLUSTER BUREAUX
SAN01 est le point de defaillance unique (SPOF) ultime du cluster bureaux. Une panne totale entraine l'arret simultane de toutes les VMs bureaux. L'usine (soresxback) n'est pas impactee (stockage local).
Identite¶
| Champ | Valeur |
|---|---|
| Nom | SAN01 |
| Type | Baie de stockage SAN |
| Modele | HPE MSA 2040 SAS |
| Firmware | GL225R003 |
| Numero de serie | A completer |
| Site | Vonnas |
| Emplacement | Salle serveur Bureaux |
| Controleurs | Dual - Controller A (Top) + Controller B (Bottom) - Operational |
| Disques | SAS 600GB |
| Interface web | https://10.1.250.1 ou https://10.1.250.2 |
| Criticite | C1 |
| Statut | Actif |
| Garantie | A completer |
Credentials d'urgence¶
Acces restreint
Les identifiants sont stockes dans le coffre-fort. Ne jamais les noter en clair.
| Compte | Usage | Localisation |
|---|---|---|
manage |
Administrateur SAN | Coffre-fort > SAN01 > manage |
Architecture stockage¶
Vdisks¶
| Vdisk | Slots | RAID | Type disque | Usage |
|---|---|---|---|---|
| Vdisk01-R5 | 1.1 - 1.4 | RAID 5 | SAS 600GB | Datastores VMs |
| Vdisk02-R10 | 1.21 - 1.24 | RAID 10 | SAS 600GB | Datastores VMs |
Disques de secours (Spare)¶
| Slots | Role | Comportement |
|---|---|---|
| 1.15, 1.16 | Dedicated Spare | Rebuild automatique en cas de panne disque |
Rebuild automatique
En cas de panne d'un disque, le spare prend le relais et le rebuild demarre automatiquement. Le rebuild peut prendre plusieurs heures. Pendant ce temps le RAID est en etat Degraded : une seconde panne disque serait critique.
Dependances¶
En amont (depend de)¶
graph TD
ELEC[Alimentation electrique] --> SAN01
ONDULEUR["Onduleur Riello (10.1.250.100)"] --> SAN01
SAS_LINK[Connectique SAS] --> SAN01
| Ressource | Detail |
|---|---|
| Alimentation electrique | Double alimentation (a confirmer) |
| Onduleur Riello | 10.1.250.100 - Protection electrique |
| Connectique SAS | Liens SAS directs vers soresx1 et soresx2 |
En aval (requis par)¶
SPOF - Impact en cas de panne totale SAN01
TOUTES les VMs du cluster CLU-Soreal deviennent inaccessibles. C'est la panne majeure du site bureaux.
| Equipement | Impact si SAN01 DOWN |
|---|---|
| SORESX1 | Hyperviseur sans datastores - VMs inaccessibles |
| soresx2 | Hyperviseur sans datastores - VMs inaccessibles |
| SORDC1 | AD / DNS / DHCP KO |
| SorFS1 | Fichiers partages inaccessibles |
| VCSA7 | vCenter KO |
| ESMC_Appliance | Console ESET KO |
| SorM365 | Connecteur M365 KO |
| SORERLA | Application metier KO |
Ce qui n'est PAS impacte
soresxback (usine) dispose de son propre stockage local. La production usine continue normalement en cas de panne SAN01.
Reseau¶
| Interface | IP | VLAN | Usage |
|---|---|---|---|
| Controller A (Top) | 10.1.250.1 |
V250 (LAN_MGMT) | Management |
| Controller B (Bottom) | 10.1.250.2 |
V250 (LAN_MGMT) | Management |
- Connexion : relie a BAIE_ADMINISTRATION via SAS
- Liens SAS directs vers soresx1 et soresx2
- Passerelle : FortiGate 60F (
.254)
Sauvegarde¶
CRITIQUE - Aucune sauvegarde de la configuration SAN
La configuration du SAN01 n'est pas sauvegardee. En cas de perte totale, la reconfiguration devra etre faite manuellement.
| Champ | Valeur |
|---|---|
| Outil de backup | Aucun |
| Frequence | Aucune |
| RPO | N/A |
| Niveau de protection | 0 |
| Statut | CRITIQUE |
| Backup config | NON |
| Backup Veeam | Non applicable (pas de backup du SAN lui-meme) |
Action corrective recommandee
Exporter regulierement la configuration via l'interface web MSA :
https://10.1.250.1 > Configuration > Export Config
Stocker l'export dans un emplacement securise hors-SAN.
Restauration¶
Source de verite
Procedure embarquee depuis la fiche reflexe Sentinel (A7).
Procedure en cas d'alerte¶
Panne d'un controleur (A ou B)¶
- Pas de panique - le second controleur prend le relais automatiquement
- Se connecter a l'interface web du controleur restant : https://10.1.250.1 ou https://10.1.250.2
- Verifier l'etat : System > Health Summary
- Contacter HPE pour remplacement du controleur defaillant
- Les VMs continuent de tourner normalement
Panne d'un disque¶
- Pas de panique - le spare rebuild automatiquement
- Verifier dans l'interface web : Disks > chercher le disque en "Degraded" ou "Failed"
- Le rebuild sur le spare demarre automatiquement (peut prendre plusieurs heures)
- Surveiller : pendant le rebuild, le RAID est degrade - une seconde panne disque serait critique
- Commander un disque de remplacement HPE (SAS 600GB) en urgence
Panne totale SAN (les 2 controleurs ou perte RAID critique)¶
- Toutes les VMs bureaux sont DOWN - c'est la panne majeure
- Les VMs usine (soresxback) ne sont PAS impactees
- Plan B : activer les replicas Veeam sur soresxback (usine)
- Les replicas des VMs bureaux existent sur soresxback
- Basculer via Veeam > Failover
- Attention : soresxback devra porter la prod usine ET les VMs bureaux = performances degradees
- Contacter HPE en urgence pour intervention sur site
Verification post-incident
- Interface web SAN : https://10.1.250.1
- System > Health : tout en "OK"
- Disks : tous les disques en "Up"
- Vdisks : RAID "Optimal" (pas "Degraded")
- vCenter : les datastores sont accessibles, les VMs tournent
Contact support¶
| Fournisseur | Perimetre | Contact | Contrat |
|---|---|---|---|
| HPE | MSA 2040 SAS - Materiel et firmware | A completer | A completer |
Supervision¶
NON supervise
SAN01 n'est actuellement pas supervise (couverture 0%). Aucune alerte ne sera declenchee en cas de degradation.
Action corrective recommandee
Mettre en place une supervision SNMP ou via l'API MSA pour detecter : - Panne controleur - Disque en etat Degraded / Failed - Rebuild en cours - Temperature anormale
Historique¶
| Date | Evenement | Operateur |
|---|---|---|
| 2026-02-17 | Refactoring embed Obsidian (Restauration via fiche reflexe) | A2-Cataloger |
| 2026-02-17 | Creation de la fiche equipement (POC) | Tom |
Sources¶
- fiche-reflexe-SAN01
- plan-adressage-ip-vonnas
- topologie-reseau-vonnas
- cablage-brassage-vonnas
- infrastructure-vonnas-synthese
- carte-dependances-vonnas
- documentation-supervision-vonnas
- matrice-sauvegardes
- guide-tout-down
Voir aussi¶
- SORESX1 - Hyperviseur principal (consomme les datastores SAN01)
- soresx2 - Hyperviseur secondaire (consomme les datastores SAN01)
- soresxback - Hyperviseur usine (stockage local, non impacte par SAN01)
- VCSA7 - vCenter gerant le cluster CLU-Soreal
- carte-dependances-vonnas - Vue globale des dependances du site
- guide-tout-down - Procedure en cas de panne generalisee