View
817
Download
0
Category
Tags:
Preview:
DESCRIPTION
Charla impartida por Igor Lukic en el IV Curso de Verano de Seguridad Informática de la Universidad Europea de Madrid.
Citation preview
YOUR LOGO
Cloud Disaster and Recovery Plan
Igor LukicPritesh Hiralalwww.zendalbackup.com
YOUR LOGOPage 2
AGENDA
Situacion actual de las amenazas / seguridad TI
Checklists & Simulacro
Caso real : Centro de datos Toronto Zendal Backup
Situacion real – Crisis en PymesDemo: Usuarios moviles en la nube
1
2
3
4
5
Analisis Plan de continuididad de infrastructuras TI
YOUR LOGOPage 3
Impacto de la disrupcion de servicios TI
PASADO Menos amenazas conocidas y sacadas al publico, la
dependencia de Internet/informatica era menor, no existia la competividad global, tener servicios parados durante incluso dias no impactaba economicamente significativamente.
PRESENTE Ocurren con mucha frecuecia, desde fallos de
hardware, humanos, amenazas de malware, la caida de uno de los servicios por unas horas puede costar a la empresa cientos de miles de €.
Its all about the money… $$$
YOUR LOGOPage 4
Filtra esto nuestro firewall ?
YOUR LOGOPage 5
YOUR LOGOPage 6
Analisis Plan de continuididad de infrastructuras TI
Consiste de un documento actualizable con las pautas a seguir en caso de diversos succesos de emergencia que afecten al correcto funcionamiento del negocio.
Refleja los distintos scenarios de emergencia que pueden afectarnos
Cita las aplicaciones/datos indispensables para el correcto funcionamiento
Identifica el valor de la informacion para el negocio en orden cronologico segun su importancia, citando su metodo de recuperacion, tiempos de ejecucion
¿ Que es ?
YOUR LOGOPage 7
Fallos Comunes En La Recuperacion de desastres
Imaginemos el impacto de ni siquiera tener el plan de recuperacion
65
60
45
25
15
12
Exceso de confianza
Mal planificado
Plan sin actualizar
Escaso apoyo
Escasa formacion
Documentacionerronea
Fuente: Janco Associates 2011
YOUR LOGOPage 8
Identificacion riesgos de descontinuidad de negocio
Guerras / Protestas / Ataques criminales
Afectan infrastructuras criticas - muy dificiles de prever, es el escenario mas complejo del plan de recuperacion por los siguientes factores: el problema es generico, dificultadad en ser autosuficientes, tiempo de recuperacion alto.
Error Humano
El factor mas comun de ejecutar un plan de recuperacion ante desastres es el fallo humano, este puede consistir en: borrado de base de datos, hurto, accidente laboral.
Pueden llegar a ser devastadores incluyendo la desaparecion fisica de toda la oficina incluyendo daño fisico en todo el equipamiento TI, ejemplos comunes son: fallos electricos ,incendios, huracanes, tsnumanis, fugas nucleares,
Accidentes / Madre Naturaleza
YOUR LOGOPage 9
¿ Por donde empezar?
Identificar y nombrar sucursal que asumira la central en casos de emergencia.
Ejemplos secundarios: habilitar acceso remoto desde casas.
Reunir los departamentos definir los procesos criticos de cada uno.
Ejemplo: Recursos humanos identifica el programa de nominas como aplicación critica.
Definir responsable del Plan de recuperacion y comenzar a su creacion/ejecucion.
Ejemplo: Responsable de seguridad de sistemas.
Identificar procesos / aplicaciones criticas del negocio
YOUR LOGOPage 10
ASUMIR LIMITACIONES / RIESGOS
El factor accidental es grave ha dañado fisicamente toda la sede y hay parada de servicio completa.
Existe acceso fisico/TI pero uno o varios servicios criticos no estan funcionando.
Se produce una perdida no vital en el correcto funcionamiento del negocio: ejemplo: usuario borra accidentalmente ficheros.
ALTO
MEDIO
BAJO
Tiem
po d
e re
cupe
raci
on
Riesgos
YOUR LOGOPage 11
Empezemos desde el nivel “BAJO”
Factor Humano / Hardware
Tiempos de recuperacion rapidos *
Contramedida
El usuario borra una serie de ficheros.
Fallo de hardware no critico, workstation, file server, router..
Se identifica un malware que causa extrema lentitud en la red, provocando impacto negativo a la productividad.
Establecer permisos coherentes por cada usuario, habilitar auditorias, identificar usuarios criticos, disponer de backups redundantes.
Documentar hardware, identificar soporte de garantias o proveedor del mismo, tener en stock hardware critico: controladoras,router,fuentes de alimentacion, pc´s de repuesto.
Implementar medidas de seguridad proactiva, minimizar riesgos de infeccion, establecer politicas.
YOUR LOGOPage 12
Nivel de recuperacion “Medio”
Accidentes / Madre naturaleza
Tiempos de recuperacion medios
Contramedida
Cortes de energia constantes, subidas de tension.
Inundaciones, Terremotos, Huracanes, Incendios,
Situacion de epidemia/pandemia, se limite la salida fisica de las personas.
Implementar UPS de calidad en infrastructura critica TI, generador de emergencia.
Estudiar la zona geografica de nuestra oficina y identificar posibles amenazas naturales según estadisticas, elaborar plan por cada una de ellas.
Habilitar acceso remoto para empleados temporalmente via VPN.
YOUR LOGOPage 13
Nivel de recuperacion “Alto”
Guerras / Criminales / Protestas
Tiempos de recuperacion Altos
Contramedida
Se establece situacion de guerra.
Se ejecuta un ataque de terroristas afectando nuestra localizacion.
Situacion de epidemia/pandemia, se limite la salida fisica de las personas.
Migracion de datos digitales al pais mas neutral del momento, ejemplo: hosting,backups,vps. Habilitar acceso remoto empleados.
Replica de servicios indinspensables en otro pais preferentemente, con configuracion fail-over/cluster, habilitar acceso remoto empleados.
Habilitar acceso remoto para empleados temporalmente via VPN.
YOUR LOGOPage 14
Simplificando el plan de restauracion
Elaborar planes de restauracionIncluir los casos mas comunesMantener la politica, formacion.
Medir tiempo de respuesta con diversos escenarios y conocer nuestras limitaciones.
Reunirnos con la administracion, identificar amenazas y contramedidas, Definir responsabilidades.
Lo peor ha ocurrido, es hora de poner en practica nuestro plan y llevarlo a la practica, sin panico.
Llevandolo a la realidad…
YOUR LOGOPage 15
Plan de mantenimiento – Checklists & Simulacros
Tu plan morira si no lo riegas de constante mejora
Definir Objetivos
Identificar procesos de implementacion en cada escenario.
Documentar un checklist de mantenimiento, designar personal encargado.
Simulaciones de escenarios periodicas de la manera mas real posible, midiendo tiempo de respuesta.
YOUR LOGOPage 16
Ejemplo Checklists en PYME – “Suministro Electrico”
PERSONAL
REVISAR
DOCUMENTAR
SIMULAR
La persona indicada en el plan de continuidad se encargara de ejecutar los checklists de forma periodica (semanal,mensual,anual*)
Utilizar checklist según tarea, ejemplo: revisar baterias UPS, revisar cuadro electrico, revision del generador/cuadro electrico.
Documentara resultados, presentandolos al responsable del proyecto con fecha de reparacion si fuera el caso.
Se elige un dia semanal,mensual,anual * para poner en marcha el sistema de emergencia: ejemplo: generador, UPS´s, y ejecutar el plan de continuidad ante cortes de energia.
YOUR LOGOPage 17
¿ Hablamos el idioma de los jefes?
HAX0R! DDOS! EXPLOITS! IPS! FIREWALLS! SHELL! 0wned!
VLAN SSL IPSEC
FAIL-OVER
CLUSTER
YOUR LOGOPage 18
Hablemos de pasta…
Diariamente se estima la facturacion en 17,000€.
Nuestro sistema carece de ningun plan de recuperacion
Plantilla total 25 personas en oficina.
El corte de luz se produce durante las tormentas electricas que afecta la zona en 1 situaciones a lo largo de 4 años han averiado las UPS, y dejandonos sin luz 48h.
Situacion Actual
17,000 x 2 = 34,000€
Coste plantilla estimado por dia 1250€ x 2 = 2500€
• Reputacion : 2000€
• Total: 38,500€
___________________
0.25 x 38,500€ = 9,625 €
Calculamos Impacto
Se propone la compra de unas UPS con voltaje superior y con mayor capacidad de aguantar subidas de tension.
Coste aproximado: 4,500€
Inversion
Ejemplo : Corte de luz 48 horas …
YOUR LOGOPage 19
Lo peor ha ocurrido, adaptando las 3 C´s
Comunicacion.
Debemos de avisar a las autoridades oportunas, nuestro personal, y al responsable del proyecto del plan de recuperacion de desastres.
Cooperacion Adaptar actitud y elegir bien al lider del plan de recuperacion,
cualidades como determinacion, objetividad y liderazgo son algunas de ellas y asi establecer lazos de cooperacion no de panico.
Cordinacion Todos deben de saber sus cometidos, no repetir las mismas tareas,
tener relacion y simulacros con proveedores externos determinara nuestra velocidad de recuperacion.
Comunicación, Cooperacion, Cordinacion
YOUR LOGOPage 20
Caso 1 – Centro de datos
El Nivel más exijente
Definir Objetivos
Varios TB de datos de clientes que confían en nosotros para la protección de sus datos
Tolerancia a pérdidas = 0
Requisitos de disponibilidad:
24/7
Requisitos de conectividad
Accesible con buen caudal desde varios países
YOUR LOGOPage 21
Posibles vectores de fallo
YOUR LOGOPage 22
Medidas de precaución
• Datos en servidores RAID 10 con discos extras en caliente
• Replicación en tiempo real
• Hardware de calidad• RED Cisco
• Cifrado (Blowfish 448-bits)
• Claves de cifrado• Ni los SysAds tienen
acceso a la clave• Las claves se almacenan
cifradas• Comprobación CRC• Protocolo propio seguro
• Centro de datos “Carrier grade” en Canadá
• Control de acceso y personal de seguridad
• Proveedores de Internet redundantes
• Routers redundantes• Firewall redundantes• Doble fuente de
alimentación cada una con suministro individual
• Generadores diesel• UPSs redundantes• Equipo anti-incendios
Placeholder for your own subheadline
YOUR LOGO
Centro de Datos Profesional
Page 23
YOUR LOGOPage 24
Caso 2 – PYME PEPE S.L.
PYME Española con red de comerciales por todo el pais
Objetivos
Evitar pérdidas por baja de servicio informático
Mantener el control de los datos de la empresa
Requisitos de disponibilidad:
>95%
Requisitos de conectividad
>95%
YOUR LOGOPage 25
Sede de la Empresa
Servidor de correo
Servidor de ficheros
- Acceso Interno desde equipos dentro de la red
Base de datos
-Accesible desde la aplicación ERP o desde el servicio web
-Contabilidad
Servidor Web
Step 1Step 1 Step 2Step 2 Step 3Step 3 WWWWWW
YOUR LOGOPage 26
Medidas de precaución
• Datos en servidores RAID 5
• Plan de Backups• Plan de recuperación• Plan de soporte y
repuesto• Fail-over?
• Acceso Cifrado a portal y servidor web
• Firewall• Antivirus
• Control de acceso físico (llaves)
• Alarma
• Proveedores de Internet redundantes
• Firewall • Antivirus• UPSs
PyME ACME S.L.
YOUR LOGO
Usuarios Móviles
• Informacion desperdigada
• Falta de control
ALTA PROBABILIDAD DE PERDIDA!
¿Cómo ponemos algo de ¿Cómo ponemos algo de orden al caos?orden al caos?
• Se estima que mas del 60% de los datos residen en PC o portatiles externos
• Segun Gartner, cada 53 segundos ocurre un robo de un portatil
YOUR LOGO
Tipos de datos
YOUR LOGO
¿Solución?: Backup online
YOUR LOGO
1. Protección Continua
Backup continuo
Versionado de archivos
YOUR LOGO
Acceso web
Accesible desde cualquier lugar
Compartir
YOUR LOGOPage 32
Consideraciones a tomar
Cifrado.
Cumple con la política de acceso de la empresa?
Donde y como se almacenan los datos?
Tratamiento de los datos
Que datos vamos a almacenar donde?
Cuanto tiempo tardaremos en recuperarlos?.
Tiempo de recuperación
Cuanto me costará el servicio?
Que beneficios me aporta?
Coste/Beneficios
YOUR LOGOPage 33
CONTACTO
Igor Lukic – igor@zendalbackup.com
Twitter - @igorlukic
www.zendalbackup.com
928 26 17 11
1
2
3
4
5
Pritesh Hiralal – pritesh@zendalbackup.com
YOUR LOGO
IGOR LUKIC - @igorlukic
PRITESH HIRALAL @zendalbackup
¿ Preguntas ?
Recommended