SAN01¶

Criticite C1 - SPOF MAJEUR CLUSTER BUREAUX

SAN01 est le point de defaillance unique (SPOF) ultime du cluster bureaux. Une panne totale entraine l'arret simultane de toutes les VMs bureaux. L'usine (soresxback) n'est pas impactee (stockage local).

Identite¶

Champ	Valeur
Nom	SAN01
Type	Baie de stockage SAN
Modele	HPE MSA 2040 SAS
Firmware	GL225R003
Numero de serie	A completer
Site	Vonnas
Emplacement	Salle serveur Bureaux
Controleurs	Dual - Controller A (Top) + Controller B (Bottom) - Operational
Disques	SAS 600GB
Interface web	`https://10.1.250.1` ou `https://10.1.250.2`
Criticite	C1
Statut	Actif
Garantie	A completer

Credentials d'urgence¶

Acces restreint

Les identifiants sont stockes dans le coffre-fort. Ne jamais les noter en clair.

Compte	Usage	Localisation
`manage`	Administrateur SAN	Coffre-fort > SAN01 > manage

Architecture stockage¶

Vdisks¶

Vdisk	Slots	RAID	Type disque	Usage
Vdisk01-R5	1.1 - 1.4	RAID 5	SAS 600GB	Datastores VMs
Vdisk02-R10	1.21 - 1.24	RAID 10	SAS 600GB	Datastores VMs

Disques de secours (Spare)¶

Slots	Role	Comportement
1.15, 1.16	Dedicated Spare	Rebuild automatique en cas de panne disque

Rebuild automatique

En cas de panne d'un disque, le spare prend le relais et le rebuild demarre automatiquement. Le rebuild peut prendre plusieurs heures. Pendant ce temps le RAID est en etat Degraded : une seconde panne disque serait critique.

Dependances¶

En amont (depend de)¶

graph TD
    ELEC[Alimentation electrique] --> SAN01
    ONDULEUR["Onduleur Riello (10.1.250.100)"] --> SAN01
    SAS_LINK[Connectique SAS] --> SAN01

Ressource	Detail
Alimentation electrique	Double alimentation (a confirmer)
Onduleur Riello	`10.1.250.100` - Protection electrique
Connectique SAS	Liens SAS directs vers soresx1 et soresx2

En aval (requis par)¶

SPOF - Impact en cas de panne totale SAN01

TOUTES les VMs du cluster CLU-Soreal deviennent inaccessibles. C'est la panne majeure du site bureaux.

Equipement	Impact si SAN01 DOWN
SORESX1	Hyperviseur sans datastores - VMs inaccessibles
soresx2	Hyperviseur sans datastores - VMs inaccessibles
SORDC1	AD / DNS / DHCP KO
SorFS1	Fichiers partages inaccessibles
VCSA7	vCenter KO
ESMC_Appliance	Console ESET KO
SorM365	Connecteur M365 KO
SORERLA	Application metier KO

Ce qui n'est PAS impacte

soresxback (usine) dispose de son propre stockage local. La production usine continue normalement en cas de panne SAN01.

Reseau¶

Interface	IP	VLAN	Usage
Controller A (Top)	`10.1.250.1`	V250 (LAN_MGMT)	Management
Controller B (Bottom)	`10.1.250.2`	V250 (LAN_MGMT)	Management

Connexion : relie a BAIE_ADMINISTRATION via SAS
Liens SAS directs vers soresx1 et soresx2
Passerelle : FortiGate 60F (.254)

Sauvegarde¶

CRITIQUE - Aucune sauvegarde de la configuration SAN

La configuration du SAN01 n'est pas sauvegardee. En cas de perte totale, la reconfiguration devra etre faite manuellement.

Champ	Valeur
Outil de backup	Aucun
Frequence	Aucune
RPO	N/A
Niveau de protection	0
Statut	CRITIQUE
Backup config	NON
Backup Veeam	Non applicable (pas de backup du SAN lui-meme)

Action corrective recommandee

Exporter regulierement la configuration via l'interface web MSA : https://10.1.250.1 > Configuration > Export Config Stocker l'export dans un emplacement securise hors-SAN.

Restauration¶

Source de verite

Procedure embarquee depuis la fiche reflexe Sentinel (A7).

Procedure en cas d'alerte¶

Panne d'un controleur (A ou B)¶

Pas de panique - le second controleur prend le relais automatiquement
Se connecter a l'interface web du controleur restant : https://10.1.250.1 ou https://10.1.250.2
Verifier l'etat : System > Health Summary
Contacter HPE pour remplacement du controleur defaillant
Les VMs continuent de tourner normalement

Panne d'un disque¶

Pas de panique - le spare rebuild automatiquement
Verifier dans l'interface web : Disks > chercher le disque en "Degraded" ou "Failed"
Le rebuild sur le spare demarre automatiquement (peut prendre plusieurs heures)
Surveiller : pendant le rebuild, le RAID est degrade - une seconde panne disque serait critique
Commander un disque de remplacement HPE (SAS 600GB) en urgence

Panne totale SAN (les 2 controleurs ou perte RAID critique)¶

Toutes les VMs bureaux sont DOWN - c'est la panne majeure
Les VMs usine (soresxback) ne sont PAS impactees
Plan B : activer les replicas Veeam sur soresxback (usine)
Les replicas des VMs bureaux existent sur soresxback
Basculer via Veeam > Failover
Attention : soresxback devra porter la prod usine ET les VMs bureaux = performances degradees
Contacter HPE en urgence pour intervention sur site

Verification post-incident

Interface web SAN : https://10.1.250.1
System > Health : tout en "OK"
Disks : tous les disques en "Up"
Vdisks : RAID "Optimal" (pas "Degraded")
vCenter : les datastores sont accessibles, les VMs tournent

Contact support¶

Fournisseur	Perimetre	Contact	Contrat
HPE	MSA 2040 SAS - Materiel et firmware	A completer	A completer

Supervision¶

NON supervise

SAN01 n'est actuellement pas supervise (couverture 0%). Aucune alerte ne sera declenchee en cas de degradation.

Action corrective recommandee

Mettre en place une supervision SNMP ou via l'API MSA pour detecter : - Panne controleur - Disque en etat Degraded / Failed - Rebuild en cours - Temperature anormale

Historique¶

Date	Evenement	Operateur
2026-02-17	Refactoring embed Obsidian (Restauration via fiche reflexe)	A2-Cataloger
2026-02-17	Creation de la fiche equipement (POC)	Tom

Sources¶

Voir aussi¶

SORESX1 - Hyperviseur principal (consomme les datastores SAN01)
soresx2 - Hyperviseur secondaire (consomme les datastores SAN01)
soresxback - Hyperviseur usine (stockage local, non impacte par SAN01)
VCSA7 - vCenter gerant le cluster CLU-Soreal
carte-dependances-vonnas - Vue globale des dependances du site
guide-tout-down - Procedure en cas de panne generalisee