Aller au contenu

SAN01

Criticite C1 - SPOF MAJEUR CLUSTER BUREAUX

SAN01 est le point de defaillance unique (SPOF) ultime du cluster bureaux. Une panne totale entraine l'arret simultane de toutes les VMs bureaux. L'usine (soresxback) n'est pas impactee (stockage local).


Identite

Champ Valeur
Nom SAN01
Type Baie de stockage SAN
Modele HPE MSA 2040 SAS
Firmware GL225R003
Numero de serie A completer
Site Vonnas
Emplacement Salle serveur Bureaux
Controleurs Dual - Controller A (Top) + Controller B (Bottom) - Operational
Disques SAS 600GB
Interface web https://10.1.250.1 ou https://10.1.250.2
Criticite C1
Statut Actif
Garantie A completer

Credentials d'urgence

Acces restreint

Les identifiants sont stockes dans le coffre-fort. Ne jamais les noter en clair.

Compte Usage Localisation
manage Administrateur SAN Coffre-fort > SAN01 > manage

Architecture stockage

Vdisks

Vdisk Slots RAID Type disque Usage
Vdisk01-R5 1.1 - 1.4 RAID 5 SAS 600GB Datastores VMs
Vdisk02-R10 1.21 - 1.24 RAID 10 SAS 600GB Datastores VMs

Disques de secours (Spare)

Slots Role Comportement
1.15, 1.16 Dedicated Spare Rebuild automatique en cas de panne disque

Rebuild automatique

En cas de panne d'un disque, le spare prend le relais et le rebuild demarre automatiquement. Le rebuild peut prendre plusieurs heures. Pendant ce temps le RAID est en etat Degraded : une seconde panne disque serait critique.


Dependances

En amont (depend de)

graph TD
    ELEC[Alimentation electrique] --> SAN01
    ONDULEUR["Onduleur Riello (10.1.250.100)"] --> SAN01
    SAS_LINK[Connectique SAS] --> SAN01
Ressource Detail
Alimentation electrique Double alimentation (a confirmer)
Onduleur Riello 10.1.250.100 - Protection electrique
Connectique SAS Liens SAS directs vers soresx1 et soresx2

En aval (requis par)

SPOF - Impact en cas de panne totale SAN01

TOUTES les VMs du cluster CLU-Soreal deviennent inaccessibles. C'est la panne majeure du site bureaux.

Equipement Impact si SAN01 DOWN
SORESX1 Hyperviseur sans datastores - VMs inaccessibles
soresx2 Hyperviseur sans datastores - VMs inaccessibles
SORDC1 AD / DNS / DHCP KO
SorFS1 Fichiers partages inaccessibles
VCSA7 vCenter KO
ESMC_Appliance Console ESET KO
SorM365 Connecteur M365 KO
SORERLA Application metier KO

Ce qui n'est PAS impacte

soresxback (usine) dispose de son propre stockage local. La production usine continue normalement en cas de panne SAN01.


Reseau

Interface IP VLAN Usage
Controller A (Top) 10.1.250.1 V250 (LAN_MGMT) Management
Controller B (Bottom) 10.1.250.2 V250 (LAN_MGMT) Management
  • Connexion : relie a BAIE_ADMINISTRATION via SAS
  • Liens SAS directs vers soresx1 et soresx2
  • Passerelle : FortiGate 60F (.254)

Sauvegarde

CRITIQUE - Aucune sauvegarde de la configuration SAN

La configuration du SAN01 n'est pas sauvegardee. En cas de perte totale, la reconfiguration devra etre faite manuellement.

Champ Valeur
Outil de backup Aucun
Frequence Aucune
RPO N/A
Niveau de protection 0
Statut CRITIQUE
Backup config NON
Backup Veeam Non applicable (pas de backup du SAN lui-meme)

Action corrective recommandee

Exporter regulierement la configuration via l'interface web MSA : https://10.1.250.1 > Configuration > Export Config Stocker l'export dans un emplacement securise hors-SAN.


Restauration

Source de verite

Procedure embarquee depuis la fiche reflexe Sentinel (A7).

Procedure en cas d'alerte

Panne d'un controleur (A ou B)

  1. Pas de panique - le second controleur prend le relais automatiquement
  2. Se connecter a l'interface web du controleur restant : https://10.1.250.1 ou https://10.1.250.2
  3. Verifier l'etat : System > Health Summary
  4. Contacter HPE pour remplacement du controleur defaillant
  5. Les VMs continuent de tourner normalement

Panne d'un disque

  1. Pas de panique - le spare rebuild automatiquement
  2. Verifier dans l'interface web : Disks > chercher le disque en "Degraded" ou "Failed"
  3. Le rebuild sur le spare demarre automatiquement (peut prendre plusieurs heures)
  4. Surveiller : pendant le rebuild, le RAID est degrade - une seconde panne disque serait critique
  5. Commander un disque de remplacement HPE (SAS 600GB) en urgence

Panne totale SAN (les 2 controleurs ou perte RAID critique)

  1. Toutes les VMs bureaux sont DOWN - c'est la panne majeure
  2. Les VMs usine (soresxback) ne sont PAS impactees
  3. Plan B : activer les replicas Veeam sur soresxback (usine)
  4. Les replicas des VMs bureaux existent sur soresxback
  5. Basculer via Veeam > Failover
  6. Attention : soresxback devra porter la prod usine ET les VMs bureaux = performances degradees
  7. Contacter HPE en urgence pour intervention sur site

Verification post-incident

  1. Interface web SAN : https://10.1.250.1
  2. System > Health : tout en "OK"
  3. Disks : tous les disques en "Up"
  4. Vdisks : RAID "Optimal" (pas "Degraded")
  5. vCenter : les datastores sont accessibles, les VMs tournent

Contact support

Fournisseur Perimetre Contact Contrat
HPE MSA 2040 SAS - Materiel et firmware A completer A completer

Supervision

NON supervise

SAN01 n'est actuellement pas supervise (couverture 0%). Aucune alerte ne sera declenchee en cas de degradation.

Action corrective recommandee

Mettre en place une supervision SNMP ou via l'API MSA pour detecter : - Panne controleur - Disque en etat Degraded / Failed - Rebuild en cours - Temperature anormale


Historique

Date Evenement Operateur
2026-02-17 Refactoring embed Obsidian (Restauration via fiche reflexe) A2-Cataloger
2026-02-17 Creation de la fiche equipement (POC) Tom

Sources


Voir aussi

  • SORESX1 - Hyperviseur principal (consomme les datastores SAN01)
  • soresx2 - Hyperviseur secondaire (consomme les datastores SAN01)
  • soresxback - Hyperviseur usine (stockage local, non impacte par SAN01)
  • VCSA7 - vCenter gerant le cluster CLU-Soreal
  • carte-dependances-vonnas - Vue globale des dependances du site
  • guide-tout-down - Procedure en cas de panne generalisee