41

22 Christophe Leroux IT Architect Microsoft France

Embed Size (px)

Citation preview

Page 1: 22 Christophe Leroux IT Architect Microsoft France
Page 2: 22 Christophe Leroux IT Architect Microsoft France

22

High Availability

Christophe LerouxIT ArchitectMicrosoft France

Page 3: 22 Christophe Leroux IT Architect Microsoft France

33

Agenda

Exchange 2010 High Availability Vision/GoalsExchange 2010 High Availability FeaturesExchange 2010 High Availability Deep DiveDeploying Exchange 2010 High Availability FeaturesTransitioning to Exchange 2010 High AvailabilityHigh Availability Design Examples

Page 4: 22 Christophe Leroux IT Architect Microsoft France

44

Vision de la Haute disponibilité Exchange 2010

Page 5: 22 Christophe Leroux IT Architect Microsoft France

55

Vision et buts

Vision: délivrer une solution rapide, facile à déployer et à opérer, à cout faible, pouvant s’adapter à l’ensemble des clients.Buts

Délivrer une solution native à Exchange pour adresser la haute disponibilité et la tolérance de siteUtiliser des stockages moins couteux et plus simplesSimplifier l’administration et diminuer les couts de supportAugmenter la disponibilité globaleSupporter Exchange Server 2010 OnlineSupporter de larges boites aux lettres à faible cout

Page 6: 22 Christophe Leroux IT Architect Microsoft France

66

DB1

Front End Server

NodeB(passif)

Outlook OWA, ActiveSync, ou Outlook Anywhere

San Jose

Dallas

Standby Cluster

Besoinnd’un outil tier pour monter un site de secours

Complexité de mise en œuvre d’un site de secours et de process de bascule

Nécessité de connaitre le cluster

DB2

DB3

DB4

DB5

DB6

Failover au niveau du serveur

DB1

DB2

DB3La création du cluster est une opération manuelle

Exchange Server 2003

NodeA(actif)

Page 7: 22 Christophe Leroux IT Architect Microsoft France

77

DB1

Client Access Server

NodeB(passive)

SCROutlook OWA, ActiveSync, ou Outlook Anywhere

San Jose

Dallas

Standby Cluster

Pas d’interface pour gérer le SCR

Complexité de mise en œuvre d’un site de secours et de process de bascule

Nécessité de connaitre le cluster

DB2

DB3

DB4

DB5

DB6

DB1

DB2

DB3

DB4

DB5

DB6

Failover au niveau du serveur

DB1

DB2

DB3Clustered Mailbox Server can’t co-exist with other roles

Exchange Server 2007

NodeA(active) CCR

Page 8: 22 Christophe Leroux IT Architect Microsoft France

88

DB2

DB3

DB2

DB3

DB4

DB4

DB5

Client Access Server

Mailbox Server 1

Mailbox Server 2

Mailbox Server 3

Mailbox Server 6

Mailbox Server 4

Dallas

San Jose

Mailbox Server 5

DB5

DB2

DB3

DB4

DB5DB1

DB1DB1

DB1

Failover géré par Exchange

Failover au niveau des bases

Facilité d’extention sur d’autres sites

Tous les clients se connectent au travers des serveurs CAS

DB3

DB5

DB1

Client

Exchange Server 2010

Page 9: 22 Christophe Leroux IT Architect Microsoft France

99

Fonctionnalités de haute disponibilité d’Exchange 2010

Page 10: 22 Christophe Leroux IT Architect Microsoft France

1010

Haute disponibilité Exchange 2010 Terminologie

Haute disponibilité – Solution qui doit apporter une disponibilité des services et données ainsi qu’une reprise automatique en cas de problèmeDisaster Recovery – Process utilisé pour une reprise

manuelle en cas de problèmeResilience de site – Solution de récupération de désastre

utilisé en cas d’indisponibilité d’un site physique*over (switchover/failover) – un “switchover” est une

activation manuelle d’une ou plusieurs bases de données; un failover est une activation automatique d’une ou plusieurs bases de données en cas de problème

Page 11: 22 Christophe Leroux IT Architect Microsoft France

1111

Haute disponibilité Exchange 2010 Fonctionnalités

Mailbox Resiliency – Nom d’une solution complète de haute disponibilité ou de résilience de site

Database Mobility – Possibilité de répliquer et remonter une base de données sur un autre serveur de boites aux lettresIncremental Deployment – Possibilité de déployer des

fonctionnalité de haute disponibilité ou de résilience de site après l’installation d’ExchangeExchange Third Party Replication API – API Exchange

permettant à des partenaires de développer une réplication compatible DAG en lieu et place de la solution native d’Exchange

Page 12: 22 Christophe Leroux IT Architect Microsoft France

1212

Haute disponibilité Exchange 2010 Fonctionnalités

Database Availability Group – un groupe de serveurs (16 maximum) hébergeant des répliques de bases de données

Mailbox Database Copy – une base de données (EDB + Logs) qui peut être soit active ou passive

RPC Client Access service – Fonctionnalité du rôle CAS permettant à un client MAPI de se connecter

Shadow Redundancy – Fonctionnalité de transport offrant une redondance des messages pour assurer une redondance du transfert

Page 13: 22 Christophe Leroux IT Architect Microsoft France

1313

Concepts basés sur Exchange 2007

Extensible Storage Engine (ESE)Bases de données et fichiers de logs

Continuous ReplicationLog shipping Database seedingStore service/Replication serviceDatabase health et status monitoringDivergenceMontage automatique de base

Concepts de quorum de witnessConcepts des failover et switchover

Page 14: 22 Christophe Leroux IT Architect Microsoft France

1414

Concepts supprimés dans Exchange 2010

Storage GroupsIdentifications des bases de données en fonction des

serveurs auxquelles est sont attachéesNom du serveur faisant parti du nom des bases de donnéesClustered Mailbox Servers

Pre-installation du Windows Failover ClusterLancement des étapes d’installation dans le mode clusterDéplacement d’un réseau CMS entre les serveursStockage partagé

Limite de deux copies pour la HABesoin de deux réseaux

Concepts de public, privé et réseau mixte

Page 15: 22 Christophe Leroux IT Architect Microsoft France

1515

Changement de stratégie HA/Backup

Suppression accidentelle de

données

Panne d’un Data Center

Erreur d’un administrateur

Corruption d’une boite

Rétention de longue durée

Fonctionnalité Exchange 2010

Mailbox Resiliency

Single Item Recovery

Personal Archive + Retention Policies

Lagged Copy

Récupération rapideRedondance de données

Garantie de récupération de données

Redémarrage avec étant antérieur

Autre boite pour données anciennes

Avantage

Récu

péra

tion

rapi

deRé

tenti

on d

’info

rmati

ons

Panne HW/SW

Page 16: 22 Christophe Leroux IT Architect Microsoft France

1616

Concepts avancés de la haute disponibilité Exchange 2010

Page 17: 22 Christophe Leroux IT Architect Microsoft France

1717

Principes de la HA Exchange 2010

Database Availability GroupServeurBases de donnéesCopy de basesActive ManagerRPC Client Access

DAG

copy copy

AM

SVR

copy copy

AM

SVR

DB DB

RPC CAS

RPC CAS

Page 18: 22 Christophe Leroux IT Architect Microsoft France

1818

Database Availability Group (DAG)

Principe élémentaire de haute disponibilité et de résilience de siteUn groupe de 16 serveurs maxi pouvant partager des répliques

de bases de donnéesBasé sur Windows Failover Cluster

Gère les membres ( membre d’un DAG = nœud)Utilise le heartbeat entre les membres du DAGL’ Active Manager stocke les informations dans la base de donnée du cluster

Définit la frontière pour:La réplication des bases de donnéesBase de donnée et serveur *oversActive Manager

Page 19: 22 Christophe Leroux IT Architect Microsoft France

1919

Besoins du DAG

Windows Server 2008 SP2 Enterprise Edition ou Windows Server 2008 R2 Enterprise EditionExchange Server 2010 Standard Edition ou Exchange Server

2010 Enterprise EditionStandard supporte jusqu’à 5 bases par serveurEnterprise supporte jusqu’à 100 bases par serveur

Au moins une carte réseau par membre du DAG

Page 20: 22 Christophe Leroux IT Architect Microsoft France

2020

Active Manager

Composant Exchange qui gère les *oversEst actif sur tous les serveurs du DAGSélectionne la meilleure copie lors d’un failoverEst la source de référence pour savoir où une base de

données est activeStocke les informations dans la base clusterFourni les informations aux autres composants

Exchange (RPC Client Access et Hub Transport)Deux rôles Active Manager : PAM et SAM

Les clients Active Managers tournent sur les CAS et Hub

Page 21: 22 Christophe Leroux IT Architect Microsoft France

2121

Active Manager

Primary Active Manager (PAM)Tourne sur le nœud qui détient le group clusterRécupère les changements de topologiePrend les décisions lors des pannes de serveursSélectionne la meilleur base de donnée lors des bascules

Standby Active Manager (SAM)Tourne sur l’ensemble des nœuds du DAGRépond au demandes pour savoir qui a la copie active d’une base de

données

Les deux rôles sont nécessaires pour disposer d’une redémarrage automatique sur erreur

Si le service de réplication est arrêté, le redémarrage automatique ne fonctionne pas

Page 22: 22 Christophe Leroux IT Architect Microsoft France

2222

Active ManagerSélection de la copie active d’une base de données

Active Manager sélectionne la “meilleure’ copie pouvant devenir active quand une erreur survient sur une base

1. Ignore les serveurs qui ne sont pas joignable ou dont l’activité est temporairement bloquée

2. Trie les copies classé dans l’ordre d’une perte minimal d’informations

3. Supprime les entrées concernant les bases qui ne sont pas éligible à la bascule

4. Sélectionne la base devant devenir active en fonction du tri réalisé

Page 23: 22 Christophe Leroux IT Architect Microsoft France

2323

Catalog HealthyCopy status Healthy, DisconnectedAndHealthy,

DisconnectedAndResynchronizing, orSeedingSource

CopyQueueLength < 10

Catalog CrawlingCopy status Healthy, DisconnectedAndHealthy,

DisconnectedAndResynchronizing, orSeedingSource

CopyQueueLength < 10

Catalog HealthyCopy status Healthy, DisconnectedAndHealthy,

DisconnectedAndResynchronizing, orSeedingSource

Catalog CrawlingCopy status Healthy, DisconnectedAndHealthy,

DisconnectedAndResynchronizing, orSeedingSource

Catalog HealthyCopy status Healthy, DisconnectedAndHealthy,

DisconnectedAndResynchronizing, orSeedingSource

CopyQueueLength < 10ReplayQueueLength < 50

Catalog CrawlingCopy status Healthy, DisconnectedAndHealthy,

DisconnectedAndResynchronizing, orSeedingSource

CopyQueueLength < 10ReplayQueueLength < 50

Catalog HealthyCopy status Healthy, DisconnectedAndHealthy,

DisconnectedAndResynchronizing, orSeedingSource

ReplayQueueLength < 50

Copy status Healthy, DisconnectedAndHealthy,DisconnectedAndResynchronizing, orSeedingSource

ReplayQueueLength < 50

Catalog CrawlingCopy status Healthy, DisconnectedAndHealthy,

DisconnectedAndResynchronizing, orSeedingSource

ReplayQueueLength < 50

Copy status Healthy, DisconnectedAndHealthy,DisconnectedAndResynchronizing, orSeedingSource

Active ManagerSélection de la copie active d’une base de données

Active Manager selectionne la “meilleurs” copie pouvant devenir active

5678910

Page 24: 22 Christophe Leroux IT Architect Microsoft France

2424

Principe de redémarrage automatique

Quand une panne survient au niveau d’une base de données:Active Manager détermines la meilleure copie à activerLe service de réplication du serveur cible essaye de copier les fichiers de log manquant

Si la copie a réussi, la base de données va démarrer sans aucune perte de donnéesSi la copie ne fonctionne pas, la base va démarrer en se basant sur le paramétrage AutoDatabaseMountDial

La base montée va générer de nouveau fichiers de logs (utilisant la même séquence de log)Le service de requête du Transport Dumpster initie une demande de récupération des messages perdusQuand le serveur ou la base initiale est remontée, il détecte une divergence et détermine s’il doit effectuer une resynchronisation incrémentale ou complète

Page 25: 22 Christophe Leroux IT Architect Microsoft France

2525

Cycle de vie d’un DAG

Le DAG est créé initialement comme un objet vide dans l’Active Directory

Un nom est donné au DAG ainsi qu’une ou plusieurs adresses IP (ou configuré pour utiliser DHCP)

Quand le premier serveur MBX est ajouté au DAG:Un cluster Windows est créé avec un quorum “Node Majority” et portant le nom du DAGLe serveur est ajouté à l’objet DAG stocké dans Active Directory Active DirectoryLe nom et l’adresse IP du DAG sont enregistrés dans le DNSLa base de données du DAG est mise à jour avec les informations sur les bases de données et l’état des bases.

Page 26: 22 Christophe Leroux IT Architect Microsoft France

2626

Cycle de vie d’un DAG

Quand d’autres roles MBX sont ajoutés au DAGLe serveur rejoint le cluster portant le nom du DAGLe type de modèle de quorum est automatiquement mis à

jourNode Majority - DAGs avec un nombre impair de membresNode et File Share Majority - DAGs avec un nombre pair de

membresLa ressource “File share witness”, le répertoire et le partage sont

automatiquement créé quand nécessaire

Le serveur est ajouté à l’objet DAG dans Active DirectoryLa base do données du cluster DAG est mise à jour avec les

bases de données configurées et leurs états

Page 27: 22 Christophe Leroux IT Architect Microsoft France

2727

Cycle de vie d’un DAG

Après ajout des serveurs dans le DAG, il faut:Configurer le DAG

Encryption réseauCompression réseau

Configurer les réseaux du DAGSous-réseauxActivation/désactivation du trafic MAPI / réplications

Créer les copies des bases de donnéesLe “Seeding” est réalisé automatiquement

Surveiller l’état des bases de données

Page 28: 22 Christophe Leroux IT Architect Microsoft France

2828

Cycle de vie d’un DAG

Avant de supprimer un serveur d’un DAG, il faut supprimer l’ensemble des copies de bases de donnéesQuand un serveur est supprimé d’un DAG:

Le serveur est supprimé du clusterLe quorum est ajouté en fonction du nombre de noeuds

restantLe serveur est supprimé de l’objet DAG d’Active Directory

Avant de pouvoir supprimer un DAG, il faut supprimer l’ensemble des serveurs qui le compose

Page 29: 22 Christophe Leroux IT Architect Microsoft France

2929

Déploiement des fonctionnalités Exchange 2010 HA

Page 30: 22 Christophe Leroux IT Architect Microsoft France

3030

Déploiement Exchange 2007 et précédents (CCR/SCC)1. Préparation du matériel, installation

de l’OS et mise à jourPour le SCC: configuration du

stockage2. Construction du Cluster windows

Pour le SCC: configuration du stockage

3. Configuration du quorum, du file share witness, et des réseaux public etprivate

4. Lancement du Setup est installation du role mailbox sur le cluster

5. Configuration du rôle mailboxPour le SCC: configuration des

dépendances des ressources disques6. Test des bascules

Déploiement des fonctionnalités Exchange 2010 HADéploiement Exchange 2007 et précédents (CCR/SCC)

Déploiement incrémental d’Exchange 2010

1. Préparation du matériel, installation de l’OS et mise à jour

Pour le SCC: configuration du stockage

2. Construction du Cluster windowsPour le SCC: configuration du

stockage3. Configuration du quorum, du file share

witness, et des réseaux public etprivate

4. Lancement du Setup est installation du role mailbox sur le cluster

5. Configuration du rôle mailboxPour le SCC: configuration des

dépendances des ressources disques6. Test des bascules

1. Préparation du matériel, installation de l’OS et mise à jour

2. Lancement du Setup pour installation du rôle Mailbox

3. Création du DAG est réplication des bases

4. Test des bascules

Page 31: 22 Christophe Leroux IT Architect Microsoft France

3131

Déploiement incrémental d’Exchange 2010

Création du DAGNew-DatabaseAvailabilityGroup -Name DAG1 –WitnessServer EXHUB1 -WitnessDirectory C:\DAG1FSW -DatabaseAvailablityGroupIpAddresses 10.0.0.8

New-DatabaseAvailabilityGroup -Name DAG2 -DatabaseAvailablityGroupIpAddresses 10.0.0.8,192.168.0.8

Ajout du premier serveur dans le DAGAdd-DatabaseAvailbilityGroupServer -Identity DAG1 -MailboxServer EXMBX1

Ajout du second serveur dans le DAGAdd-DatabaseAvailabilityGroupServer -Identity DAG1 -MailboxServer EXMBX2

Ajout d’une copie de base de donnéesAdd-MailboxDatabaseCopy -Identity MBXDB1 -MailboxServer EXMBX3

Page 32: 22 Christophe Leroux IT Architect Microsoft France

3232

Migration vers une solution HA Exchange 2010

Page 33: 22 Christophe Leroux IT Architect Microsoft France

3333

Transition Steps

Vérification des prérequis Exchange 2010Déploiement des serveurs Exchange 2010Utilisation des fonctionnalités de déplacement de boites

aux lettres d’Exchange 2010Migrations non supportées

Mise à jour sur place depuis les versions précédentesImpossibilité d’utiliser le portage de bases de données entre des

serveurs Exchange 2010 et non Exchange 2010Backup et restore depuis les versions précédentes d’Exchange

2010Utilisation de la réplication entre Exchange 2010 et Exchange

2007

Page 34: 22 Christophe Leroux IT Architect Microsoft France

3434

Exemples d’architecture HA sous Exchange Server 2010

Page 35: 22 Christophe Leroux IT Architect Microsoft France

3535

Client AccessHub

TransportMailbox

Client AccessHub

TransportMailbox

Les membres des DAG peuvent héberger d’autres rôles

Répartiteur de charge matériel

DB1

DB2

DB3

DB2

DB1

DB2

DB3

Un DAG deux nœuds doit utiliser un stockage en RAID

Exemple d’architecture HAScenario Branch Office / Petite structure

8 cœurs processeurs recommandés avec un maximum de 64Go RAM

Role UM co-localisé non recommandé

Page 36: 22 Christophe Leroux IT Architect Microsoft France

3636

Un seul site

3 Copies

Database Availability Group

DB1 DB2 DB3

DB5 DB6

DB1 DB2 DB3

DB4 DB5 DB6

DB1 DB2 DB3

DB4 DB5 DB6DB4

MailboxServer 1

MailboxServer 2

MailboxServer 3

3 Noeuds

X

CAS NLB Farm

AD: Dublin

XJBOD

2 serveurs HS-> activation manuelle du 3ème serveur

Dans une configuration à 3 serveurs, le Quorum est perduLes DAGs avec plus de noeuds supportent plus de pannes

Exemple de HADouble secours– Maintenance + panne de base

Page 37: 22 Christophe Leroux IT Architect Microsoft France

3737

• Un seul site• 4 Noeuds• 3 copies• JBOD

Database Availability Group (DAG)

DB2 DB3

DB5DB4

DB7 DB8 DB1

DB2 DB3 DB4

MailboxServer 1

DB5 DB6 DB7

DB8 DB1 DB2

MailboxServer 2

MailboxServer 3

X

CAS NLB Farm

AD: Dublin

DB3 DB4 DB5

DB6 DB7 DB8

MailboxServer 4

DB1 XDB6

• Mise à jour du serveur 1• Panne du serveur 2• Mise à jour du serveur 1

terminée• 2 copies HS

Exemple de HATriple secours– Maintenance + panne de serveur +panne de base

Page 38: 22 Christophe Leroux IT Architect Microsoft France

3838

Exemple de HA6 Serveurs

DB1 DB1

DB1 DB2 DB3 DB4 DB5 DB6

DB7 DB8 DB9 DB10 DB11 DB12

DB13 DB14 DB15 DB16 DB17 DB18

DB19 DB20 DB21 DB22 DB23 DB24

DB25 DB26 DB27 DB28 DB29 DB30

Legend

Active copy Passive copy Spare Disk

DB46 DB47 DB48 DB49 DB50 DB51

DB55 DB56 DB57 DB58 DB59 DB60

DB64 DB65 DB66 DB67 DB68 DB69

DB73 DB74 DB75 DB76 DB77 DB78

DB82 DB83 DB84 DB85 DB86 DB87

Mbx Server 1

24,000 Mailboxes

4,000 Active Mbxs/Svr6 Servers, 3 Copies = double server failure resiliency

8 Cores48 GB RAM

8 Cores48 GB RAM

2GB Mailbox Size.1 IOPS/Mailbox

1TB 7.2k SATA disks

Online Spares (3)

Battery Backed Caching Array Controller

Heavy Profile: 100 Messages/day

JBOD: 48 Disks/node

Database Availability Group (DAG)

Mbx Server 2

DB52 DB53

DB61 DB62

DB70 DB71

DB79 DB80

DB88 DB89

DB31 DB32

DB34 DB35

DB37 DB38

DB40 DB41

DB43 DB44

DB54

DB63

DB72

DB81

DB90

DB33

DB36

DB39

DB42

DB45

MAPI network

Replication network

4,000 Active Mbxs/Svr1st failure: ~5,000 active2nd failure: 6,000 activeSoft active limit: 24

288 disks total30 TB of db space

Page 39: 22 Christophe Leroux IT Architect Microsoft France

3939

Conclusion

Meilleur solution de HA de bout en boutSolution identique pour la HA et le site de secoursPlus facile et plus simple à déployerRéduction du TCO grâce aux changement d’architecture de

stockageSupport de larges boites aux lettres pour un coût inférieur

Page 40: 22 Christophe Leroux IT Architect Microsoft France

4040

Questions / Réponses

Page 41: 22 Christophe Leroux IT Architect Microsoft France

© 2009 Microsoft Corporation. All rights reserved. Microsoft, Windows, Windows Vista and other product names are or may be registered trademarks and/or trademarks in the U.S. and/or other countries.The information herein is for informational purposes only and represents the current view of Microsoft Corporation as of the date of this presentation. Because Microsoft must respond to changing market conditions, it should not be interpreted to be a commitment on the part of Microsoft, and Microsoft cannot guarantee the accuracy of any information provided after the date of this presentation. MICROSOFT MAKES NO WARRANTIES, EXPRESS,

IMPLIED OR STATUTORY, AS TO THE INFORMATION IN THIS PRESENTATION.