Tutorial RAID

Universidad Autnoma Gabriel Ren MorenoFACULTAD: CIENCIAS DE LA COMPUTACION Y TELECOMUNICACIONES

Docente : Ing. Leonardo Vargas Pea

Integrantes: Jim Adonay Calzadilla Carlos Mauricio Gareca Marcos Salvatierra Snchez Carlos Liders Gutierrez U. Rene Camargo Leon Walter Fernando Claros Vega Materia : Gestion y Administracin de Redes

Santa Cruz Bolivia Tutorial RAID: cmo elegir el nivel RAID adecuadoLos grupos RAID pueden parecer ms complejos de lo que realmente son. Esto se debe a que, actualmente, hay aproximadamente 12 tipos o variedades distintas de RAID disponibles en el mercado (y an son ms las que se han desarrollado). Sin embargo, para la gran mayora de pequeas y medianas empresas (PYMEs), slo hay seis niveles RAID realmente relevantes. Elegir el nivel RAID adecuado depender del tipo de datos de las aplicaciones, del nivel de relevancia de esos datos y del nmero de usuarios. Antes de nada, es necesario tener unos conocimientos bsicos sobre lo que puede hacer cada uno de estos seis niveles RAID.RAID 0Una RAID 0 divide o reparte los datos entre todas las unidades del grupo RAID. La ventaja de la RAID 0 es que ofrece un mayor rendimiento de los datos. El inconveniente es que aunque carecer de redundancia mejora el rendimiento, cualquier fallo o avera en uno de los discos conlleva una prdida total de los datos.RAID 0 es la mejor opcin cuando es primordial obtener un mayor rendimiento del almacenamiento, cuando el presupuesto es muy limitado y cuando una posible prdida de los datos no supone mayor problema. Por ejemplo, algunos datos que funcionan bien en este nivel son los archivos temporales de edicin de fotografa o vdeo.RAID 1Una RAID 1 duplica en espejo todos los datos de cada unidad de forma sincronizada a una unidad de duplicacin exacta. Si se produce algn fallo o avera en alguna de las unidades, no se pierde ningn dato. La ventaja de utilizar una RAID 1 es disponer de un mayor rendimiento de lectura multiusuario, puesto que pueden leerse ambos discos al mismo tiempo. La desventaja es que el costo de la unidad de almacenamiento por byte usable se multiplica por dos, puesto que se necesitan dos unidades para almacenar los mismos datos.Elija una RAID 1 para aplicaciones que requieran de una red de seguridad (es decir, cuando no pueda permitirse la posibilidad de que se pierdan o estropeen los datos de la aplicacin) adems de lecturas aleatorias de alto rendimiento. Un buen ejemplo para este tipo de RAID puede ser la base de datos de slo lectura de una tienda de venta al por menor no virtual. Una RAID 1 tambin es una buena eleccin para sistemas de nivel bsico en los que slo estn disponibles dos unidades, como en el caso de un pequeo servidor de archivos.RAID 10 (es decir, RAID 1+0 y RAID 0+1)Una RAID 10 es la combinacin de una RAID 0 y una RAID 1. La ventaja de utilizar una RAID 10 es disponer de la redundancia de la RAID 1 y del nivel de rendimiento de la RAID 0. El rendimiento del sistema durante la reconstruccin de una unidad tambin es sensiblemente superior en comparacin con los niveles RAID basados en paridad (es decir, la RAID 5 y la RAID 6). Esto se debe al hecho de que los datos no necesitan realizar procesos de regeneracin de la informacin de la paridad porque sta se copia de la otra unidad replicada. El inconveniente es el costo, muy superior (normalmente, entre un 60 y un 80% ms caro) al de los niveles RAID con paridad.Hay dos tipos de RAID 10. El primero es la RAID 0+1, en la que se dividen los datos entre mltiples discos y, despus, se duplican en espejo los discos distribuidos en un grupo de discos idntico. La segunda clase es la RAID de nivel 1+0, que duplica en espejo los datos en los casos en los que las rplicas se han distribuido entre distintas unidades.Debera decantarse por las RAID 10 cuando utilice aplicaciones que requieran del alto rendimiento de una RAID 0 y de la incomparable proteccin de los datos que ofrece una RAID 1. Las bases de datos transaccionales en lnea suelen encajar en este perfil.RAID 5La RAID 5 est diseada para ofrecer el nivel de rendimiento de una RAID 0 con una redundancia ms econmica y es el nivel RAID ms habitual en la mayora de empresas. Lo consigue distribuyendo bloques de datos entre distintas unidades y repartiendo la paridad entre ellas. No se dedica ningn disco a la paridad de forma exclusiva. Las ventajas de utilizar una RAID 5 consisten en poder realizar operaciones de lectura y escritura de forma solapada (es decir, en poder hacer un uso ms eficiente de las unidades de disco), lo que acelera los pequeos procesos de escritura en un sistema multiprocesador y facilita una cantidad de almacenamiento usable superior al de la RAID 1 o 10 (dado que la redundancia acarrea una reduccin del almacenamiento de, aproximadamente, el 20%, en vez del 50%). La proteccin de los datos reside en la informacin de la paridad que se utiliza para reconstruir los datos si una unidad del grupo RAID falla o sufre una avera. Entre los inconvenientes, se encuentran: la necesidad de un mnimo de tres (y, normalmente, cinco) discos por grupo RAID, un nivel de rendimiento del sistema de almacenamiento significativamente inferior mientras se lleva a cabo la reconstruccin de una unidad, y la posibilidad de perder totalmente los datos de un grupo RAID si falla una segunda unidad mientras se est realizando la reconstruccin de la primera. Adems, el rendimiento de lectura suele ser inferior al de otras modalidades de RAID porque los datos de la paridad se distribuyen entre cada una de las unidades.Debera decantarse por una RAID 5 para la gran mayora de aplicaciones, siempre y cuando las unidades de disco no sean unidades SATA de gran capacidad. Las unidades SATA tienen ciclos de trabajo ms cortos que las unidades SAS o de canal de fibra, e ndices MTBF inferiores. Y, dado que las unidades SATA tienen una gran capacidad (de 500 a 1000 GB), los tiempos de reconstruccin son muy largos y conllevan una degradacin del rendimiento del controlador. Las unidades SATA de gran capacidad tambin aumentan la probabilidad de que se produzca un fallo o avera en una segunda unidad, lo que ocasionara una pDRida total de los datos.RAID 6La RAID 6 es similar a la RAID 5 e incluye un segundo sistema de paridad distribuido entre las unidades del grupo RAID. La ventaja de utilizar una RAID 6 es que la segunda paridad sirve de proteccin ante una posible prdida de los datos en caso de que falle o se avere una segunda unidad dentro del grupo RAID. Esto hace que las unidades SATA de gran capacidad sean ms viables y econmicas que la RAID 1 o la RAID 10. El inconveniente de utilizar una RAID 6 es que se obtiene un nivel de rendimiento del sistema de almacenamiento mucho menor cuando se est llevando a cabo la reconstruccin de dos unidades de forma simultnea (normalmente, por debajo del 20%).Debera decantarse por una RAID 6 en el caso de unidades SATA de gran capacidad y aplicaciones que puedan tolerar un nivel de rendimiento reducido en ciertas ocasiones. Algunas aplicaciones que encajan en este perfil son los archivos de datos multimedia no dinmicos como los JPEGs y el vdeo en streaming.

RAID 50 (tambin conocida como RAID 5+0 y RAID 0+5)La RAID 50 es la combinacin de una RAID 0 y una RAID 5. Toma grupos RAID 5 y los distribuye como si fueran RAID 0, lo que aumenta el nivel de rendimiento. La ventaja de la RAID 50 es su mayor rendimiento en comparacin con la RAID 5 estndar. Las desventajas son su mayor costo y que tiene menos capacidad usable.Existen dos variedades de RAID 50. La RAID 0+5 utiliza mltiples grupos de RAID 5 distribuidos en un solo grupo RAID. Esto hace que la fiabilidad del grupo RAID aumente, ya que, ahora, puede tolerar que una unidad falle o se avere en uno o en ambos conjuntos de RAID 5 sin que se pierdan los datos. La RAID 5+0, la RAID 50 ms habitual, toma grupos de RAID 5 y los distribuye como si fueran RAID 0. Debera decantarse por la RAID 50 para aplicaciones en las que sea importante el ahorro econmico de las RAID 5 y en las que tambin se necesite un mejor rendimiento.Definicin de los niveles de RAIDRAID 0Caractersticas: El disco despliega los datos a travs de dos o ms unidades de disco con el fin de mejorar el rendimiento de I/O realizando I/O paralelos. Una ensima parte de los datos se encuentra en cada una de las unidades de disco, siendo n el nmero de discos.Aplicaciones: Proporciona alto rendimiento para lecturas y escrituras. Sin embargo, no hay redundancia de datos. La RAID 0 por s sola nicamente se debera utilizar para aplicaciones que puedan tolerar pDRidas de acceso a datos que se pueden obtener desde otras fuentes.RAID 1Caractersticas: Los discos en espejo proporcionan proteccin de datos y un rendimiento de lectura mejorado. La RAID 1 duplica los datos a travs de dos o ms discos, de forma que los discos son idnticos entre s. La RAID 1 utiliza la proteccin n+n multiplicando por dos el nmero de dispositivos necesarios.Aplicaciones: OLTP de lectura intensiva y otros datos transaccionales para alto rendimiento y alta disponibilidad. Otras aplicaciones que se pueden beneficiar de la RAID 1 son el correo electrnico, los sistemas operativos, los ficheros de aplicaciones y los entornos intensivos de acceso aleatorio y de lectura.

RAID 0+1Caractersticas: La distribucin y la duplicacin de los datos para proporcionar alto rendimiento (distribucin) y disponibilidad (duplicacin) usando un nmero de dispositivos n+n. La prdida de una unidad de disco no afecta al rendimiento o a la disponibilidad, como sera el caso con la RAID0 mientras que la distribucin del disco mejora el rendimiento.Aplicaciones: Las aplicaciones OLTP y las intensivas en I/O que requieren alto rendimiento y alta disponibilidad. Esto incluye los registros de transaccin, los ficheros del diario y los ndices de las bases de datos donde el clculo de costos se basa en dlares por I/O, en comparacin con dlares por unidad de almacenamiento.RAID 1+0 (RAID 10)Caractersticas: Parecido al RAID 0+1, duplica y distribuye datos para proporcionar alto rendimiento (distribucin) y alta disponibilidad (duplicacin) usando un nmero de dispositivos n+n. La diferencia reside en distribuir grupos de discos juntos y despus duplicar los grupos de distribucin.Aplicaciones: Las aplicaciones OLTP y las intensivas en I/O que requieren alto rendimiento y alta disponibilidad. Esto incluye los registros de transaccin, los ficheros del diario y los ndices de las bases de datos donde el clculo de costos se basa en dlares por I/O, en comparacin con dlares por unidad de almacenamiento.RAID 3Caractersticas: Distribuye con paridad dedicada a nivel de byte y tiene una nica unidad de disco dedicada que almacena la informacin de paridad usando un mtodo de n+1 en trminos del nmero de dispositivos necesarios.Aplicaciones: Esto proporciona un buen rendimiento para imgenes de video, geofsica, ciencias naturales u otras aplicaciones de procesamiento secuencial. La RAID 3, sin embargo, no se adapta bien a las aplicaciones que requieren operaciones simultneas de entrada/salida de mltiples usuarios o de flujos de entrada/salida.

RAID 4Caractersticas: Igual que la RAID 3, pero con proteccin de paridad a nivel de bloques.Aplicaciones: La utilizacin de la cache de lectura y escritura funciona bien con los entornos de ficheros.RAID 5Caractersticas: La distribucin de discos y la proteccin de paridad rotativa usando un nmero n+1 de componentes proporcionan una buena disponibilidad con un buen rendimiento para mltiples usuarios simultneos y flujos de entrada/salida. Mediante la utilizacin de una unidad de disco conectable en caliente, los datos se pueden reconstruir (reconstruccin de la unidad) para protegerse de un segundo fallo una vez completado.Aplicaciones: Reduce el nmero de componentes requeridos mientras que proporciona una buena disponibilidad, un buen rendimiento para lecturas, el rendimiento de la escrituras se ve afectado si no se utiliza la cache de escritura. Entre las aplicaciones adecuadas para la RAID 5 se encuentran los datos de referencia, las tablas de bases de datos intensivas en lecturas, la comparticin de ficheros generales y las aplicaciones Web.RAID 6Caractersticas: La distribucin del disco con paridad rotativa usando unidades de doble paridad destinadas a reducir el riesgo de disponibilidad de datos durante una reconstruccin de la unidad de disco, concretamente cuando se utilizan unidades de disco SATA y de Canal de fibra de ms capacidad. El problema con la RAID 6 y con cualquier esquema de paridad de mltiples unidades es la sobrecarga del rendimiento al hacer clculos de paridad cuando se escriben datos o se reconstruye a partir de una unidad de disco que ha fallado.Aplicaciones: En general, si est buscando lectura y escritura de alto rendimiento, considere la utilizacin de unidades de disco ms pequeos y evite la RAID 6. Si, por otro lado, lo que busca es almacenar grandes cantidades de datos en las que se puedan llevar a cabo reconstrucciones en segundo plano, la RAID 5 y la RAID 6 pueden se apropiadas si se configuran segn sus necesidades de aplicaciones.

La Gua didctica de la de RAID Una Introduccin a RAID La Necesidad para RAID Datos de listar & Redundancia Los Tipos Diferentes de RAID Tool para la Eficacia del Almacenamiento Cost & Problemas de la Actuacin Fiabilidad en Problemas RAID Tool para la Fiabilidad Glosario ReferenciasUna Introduccin a RAIDel RAID simboliza Serie Redundante de Discos Baratos. el RAID es la organizacin de discos mltiples en una actuacin grande, alta el disco lgico. El disco forma los datos de la raya por los discos mltiples y los accede en paralelo lograr: los datos ms Altos transfieren las proporciones en los accesos de los datos grandes y que I/O ms Alto est en los accesos de los datos pequeos. Datos que tambin rayan los resultados en carga del uniforme que equilibra por todos los discos, eliminando las manchas calientes que por otra parte satura un nmero pequeo de discos, mientras la mayora de discos se sienta ocioso. Pero.... El disco grande forma, sin embargo es muy vulnerable a los fracasos del disco. Una serie del disco con cien los discos ms probablemente son cien veces para fallar que un solo disco. Un MTTF (el malo-tiempo-a-fracaso) 500,000 horas para un solo disco implican un MTTF de 500,000/100 es decir 5000 horas para una serie del disco con cien discos. As.... La solucin al problema de ms bajo fiabilidad en las series del disco es mejorar la disponibilidad del el sistema. Esto puede lograrse empleando la redundancia en la forma de error-corregir los cdigos a tolere los fracasos del disco. Una serie del disco redundante puede retener los datos ahora para el ms tiempo cronometre que un el solo disco indefenso. No confunda entre la fiabilidad y disponibilidad. La fiabilidad es qu bien que un sistema puede trabajar sin cualquier fracaso en sus componentes. Si hay un el fracaso, el sistema no era fiable. La disponibilidad es qu bien que un sistema puede trabajar en tiempos de un fracaso. Si un sistema puede incluso trabajar en la presencia de un fracaso de uno o ms componentes del sistema, se dice que el sistema est disponible. La redundancia mejora la disponibilidad de un sistema, pero no puede mejorar la fiabilidad. La fiabilidad slo puede aumentarse mejorando a tecnologas industriales o el individuo menor usando los componentes en un sistema.Las desventajas debido a la Redundancia Cada vez hay un escriba el funcionamiento, hay un cambio de datos. Este cambio tambin, tiene que ser reflejado en los discos que guardan la informacin redundante. Esto empeora la actuacin de escribe en redundante el disco forma comparado a la actuacin de significativamente escribe en el non las series del disco redundantes. Tambin, guardando la informacin redundante consistente en la presencia de I/O coexistente el funcionamiento y la posibilidad de cadas del sistema pueden ser difciles. La Necesidad para RAIDPuede resumirse la necesidad para RAID en dos puntos dados debajo. Las dos palabras claves son Redundante y Serie. Que Una serie de discos mltiples accedi en paralelo dar el throughput mayor que un solo el disco. El datos Redundante en los discos mltiples proporciona la tolerancia de la falta. Con tal de que el hardware de RAID y software realizan los verdaderos accesos paralelos en los paseos mltiples, habr una mejora de la actuacin encima de un solo disco. Con un solo disco duro, usted no puede protegerse contra los costos de un fracaso del disco, el tiempo, exigido obtener e instalar un disco del reemplazo, reinstale el sistema operativo, restaure los archivos de las cintas auxiliares, y repite toda la entrada de los datos realizada desde que el ltimo apoyo era hecho. Con los discos mltiples y un esquema de redundancia conveniente, su sistema puede quedarse en marcha cuando un el disco falla, e incluso mientras el disco del reemplazo est instalndose y sus datos restauraron. Para crear un ptimo costo-efectivo RAID configuracin, nosotros necesitamos lograr simultneamente las metas siguientes: Maximize el nmero de discos que se acceden en paralelo. Minimize la cantidad de espacio del disco que se usa para los datos redundantes. Minimize el arriba exigi lograr las metas anteriores.Datos de Listar y La redundancia Hay 2 conceptos importantes para ser entendido en el plan y aplicacin de series del disco: 1. los datos rayando, para la actuacin mejorada. 2. la redundancia para la disponibilidad mejorada. Datos de ListarDatos que raya transparentemente distribuye los datos encima de los discos mltiples hacerles aparecer como un solo ayuno, el disco grande. Rayando mejora la actuacin de I/O agregado permitindole a I/Os mltiple ser reparado en paralelo. Hay 2 aspectos a este paralelismo. El Mltiplo de , las demandas independientes pueden repararse en paralelo por los discos separados. Esto disminuye el tiempo del queueing visto por las demandas de I/O. que las Solas, mltiples demandas del bloque pueden ser reparadas por discos mltiples que actan en la co-ordenacin. Esto aumenta la proporcin del traslado eficaz vista por una sola demanda. La actuacin beneficia aumente con el nmero de discos en la serie. Desgraciadamente, un nmero grande de discos baja la fiabilidad global de la serie del disco. La mayora de las organizaciones de serie de disco redundantes puede distinguirse basado en 2 rasgos: 1. el granularity de datos que entrelazan y 2. la manera en que los datos redundante se computa y guard por la serie del disco. Los datos entrelazando o pueden estar bien formado grano o tosco form grano. La multa form grano el disco forma conceptualmente entrelace los datos en las unidades relativamente pequeas para que todo el I/O las demandas, sin tener en cuenta su tamao, acceden todos los discos en la serie del disco. Esto resulta en muy alto los datos transfieren la proporcin para todo el I/O pide pero tiene las desventajas que slo un I/O lgicos piden la lata est en el servicio en cualquier momento dado y todos los discos deban gastar el posicionamiento de tiempo para cada demanda. Las series del disco formadas grano toscas entrelazan los datos en las unidades relativamente grandes para que I/O pequeo pida la necesidad acceda slo un nmero pequeo de discos mientras las demandas grandes pueden acceder todos los discos en la serie del disco. Esto permite mltiple pequeo que pide ser reparado simultneamente mientras todava permitiendo las demandas grandes para ver las proporciones del traslado ms altas se permitidas el lujo de usando los discos mltiples. La redundancia Subsecuentemente el nmero ms grande de discos baja la fiabilidad global de la serie de discos, es importante a la redundancia incorporada en la serie de discos para tolerar los fracasos del disco y permitir para el continuo el funcionamiento del sistema sin cualquier prdida de datos.La incorporacin de redundancia en las series del disco plantea dos problemas: 1. seleccionando el mtodo por computar la informacin redundante. La mayora de las series de los discos redundantes hoy use la paridad, aunque algn uso Hamming o Caa-Solomon los cdigos. 2. seleccionando un mtodo para la distribucin de la informacin redundante por la serie del disco. El mtodo de la distribucin puede ser clasificado en 2 esquemas diferentes: Los Esquemas de que la informacin redundante concentrada sobre un nmero pequeo de discos. Esquemas de que distribuyen la informacin redundante uniformemente por todos los discos. Los tales esquemas son generalmente ms deseables porque ellos evitan manchas calientes y otro equilibrio de carga problemas sufridos por esquemas que no distribuyen la informacin redundante uniformemente. Finalmente, es importante mencionar que seleccionara entre los muchos posibles datos que rayan y los esquemas de redundancia involucran el tradeoffs complejo entre la disponibilidad, actuacin y costo que se ha discutido en las prximas secciones.RAID bsico Las organizaciones Hay que muchos tipos de RAID y algunos del importante se introducen debajo: Non-redundante (RAID Level 0) Una serie del disco non-redundante, o RAID nivelan 0, tiene el costo ms bajo de cualquier organizacin de RAID porque no emplea la redundancia en absoluto. Este esquema ofrece la actuacin mejor desde que nunca necesita para poner al da la informacin redundante. Sorprendentemente, no tiene la actuacin mejor. La redundancia esquemas en que los datos dobles, como reflejar, pueden realizar bien leen selectivamente por las demandas fijando en el disco con el ms corto esperaron busca y los retrasos rotatorios. Sin, la redundancia, cualquier solo fracaso del disco producir la datos-prdida. Las series del disco Non-redundantes son ampliamente usado excelente-computando los ambientes dnde la actuacin y capacidad, en lugar de la fiabilidad, es el primero involucra. Los bloques secuenciales de datos son escrito por los discos mltiples en las rayas, como sigue:

El tamao de un bloque del dato que est conocido como la "anchura de la raya" vara con la aplicacin, pero siempre es por lo menos tan grande como el tamao del sector de un disco. Cuando llega momento para leer atrs este secuencial los datos, todos los discos pueden leerse en paralelo. En un sistema operativo multi-atareando, hay una probabilidad alta que incluso los accesos del disco non-secuenciales guardarn todos los discos que trabajan en paralelo.Reflejado (la CORRERA Nivelado 1) La solucin tradicional, llam reflejando o sombreando, usa los tantos discos dos veces como un redundante la serie del disco. Siempre que los datos se escriba a un disco que el mismo dato tambin se escribe a un redundante el disco, para que hay siempre dos copias de la informacin. Cuando el datos se lee, puede recuperarse del disco con la formacin de colas de espera ms corta, busque y los retrasos rotatorios. Si un disco falla, la otra copia es repare las demandas. Reflejando frecuentemente se usa en las aplicaciones del banco de datos dnde la disponibilidad y tiempo de la transaccin es ms importante que la eficacia del almacenamiento.

Memoria-Style(RAID Nivelado 2) Los sistemas de memoria han proporcionado a la recuperacin de los componentes fallados mucho menos costo que reflejando usando los cdigos de Hamming. Los cdigos de Hamming contienen la paridad para los subconjuntos solapando distintos de componentes. En una versin de este esquema, cuatro discos requieren tres discos redundantes, uno menos, que reflejando. Desde el nmero de discos redundantes es proporcional al leo del nmero total de los discos en el sistema, la eficacia del almacenamiento aumenta como el nmero de aumentos de discos de datos. Si un solo componente falla, algunos de los componentes de paridad tendrn los valores incoherentes, y el el componente fallado es el contenido comn por cada subconjunto incorrecto. La informacin perdida es recuperado leyendo los otros componentes en un subconjunto, incluso el componente de paridad, y poniendo el pedazo perdido a 0 o 1 para crear el valor de paridad apropiado por ese subconjunto. As, los discos redundantes mltiples se necesita identificar el disco fallado, pero nico se necesita recuperar la informacin perdida. En usted es desprevenido de paridad, usted puede pensar en el disco redundante como tener la suma de todos los datos en los otros discos. Cuando un disco falla, usted puede substraer todos los datos en los discos buenos forme el disco de paridad; la informacin restante debe ser la informacin perdida. La paridad simplemente es esta suma modulo 2. Un RAID 2 sistema normalmente tendra los tantos discos de los datos como el palabra tamao de la computadora, tpicamente 32. Adems, RAID 2 exige al uso de discos extras guardar un cdigo error-corregiendo para la redundancia. Con 32 discos de los datos, un RAID 2 sistema requerira 7 discos adicionales para un Hammingcode ECC. Semejante serie de 39 discos era el asunto de una patente americana concedido a la Corporacin de Unisys en 1988, pero ningn producto comercial fue soltado en la vida. Por varios razones, incluso el hecho que las unidades de disco modernas contienen su propio ECC interior, RAID 2 no es un esquema de serie de disco prctico.

La Paridad pedazo-entrelazada (RAIDLevel 3) Uno puede mejorar en memoria-estilo que el disco de ECC forma notando que, el componente de memoria diferente los fracasos, directores del disco pueden identificar fcilmente qu disco ha fallado. As, uno puede usar una sola paridad en lugar de un juego de discos de paridad recupere la informacin perdida. En un pedazo-entrelaz, serie de disco de paridad, el datos se entrelaza pedazo-sabio conceptualmente encima de los discos de los datos, y un solo disco de paridad se agrega para tolerar algn solo fracaso del disco. Cada uno ley que la demanda accede todos los discos de los datos y cada uno escriben todos los discos de los datos y el disco de paridad a los accesos de la demanda. As, slo una demanda puede repararse en un momento. Porque el disco de paridad contiene slo paridad y ningn datos, el disco de paridad, no pueda participar adelante lee, mientras resultando en ligeramente baje ledo la actuacin que para la redundancia esquemas que distribuyen la paridad y datos encima de todos los discos. Pedazo-entrelazado, las series de disco de paridad son frecuentemente usado en aplicaciones que requieren el bandwidth alto pero no las proporciones de I/O altas. Ellos tambin son ms simple al instrumento que RAID nivela 4, 5, y 6. Aqu, el disco de paridad es escrito de la misma manera como la paridad mordi en la Memoria de Acceso de Azar normal (El RAM), dnde es el Exclusivo O de los 8, 16 o 32 pedazos de los datos. En el RAM, la paridad se usa para descubrir los errores de datos de solo-pedazo, pero no puede corregirlos porque no hay informacin disponible a determine qu momento es incorrecto. Con las unidades de disco, sin embargo, nosotros confiamos en el director del disco para informar un datos ley el error. Sabiendo los datos de qu disco est extraando, nosotros podemos reconstruirlo como el Exclusivo O (XOR) de discos de los datos todo restantes ms el disco de paridad.

Como un ejemplo simple, suponga nosotros tenemos 4 discos de los datos y un disco de paridad. Los pedazos de la muestra son:

El pedazo de paridad es el XOR de estos cuatro pedazos de los datos que pueden calcularse sumndolos y escribiendo un 0 si la suma incluso es y un 1 si es impar. Aqu la suma de Disco 0 a travs de Disco 3 est "3", para que la paridad es 1. Ahora si nosotros intentamos leer este datos atrs, y encuentra que Disco 2 da un error ledo, nosotros pueda reconstruir Disco 2 como el XOR de todos los otros discos, incluso la paridad. En el ejemplo, el la suma de Disco 0, 1, 3 y la Paridad es "3", para que los datos en Disco 2 deben ser 1.La Paridad bloque-entrelazada (RAID Level 4) Los bloque-entrelazamos, la serie de disco de paridad es similar a los pedazo-entrelazamos, serie de disco de paridad slo que el datos se entrelaza por los discos de tamao arbitrario en lugar de en momentos. El tamao de estos bloques se llama la unidad rayando. Lea las demandas ms pequeo que el acceso de la unidad rayando slo un solo disco del dato. Escriba las demandas deben poner al da el datos pedido bloquea y tambin debe computar y pone al da el bloque de paridad. Para grande escribe ese bloques del toque en todos los discos, la paridad se computa fcilmente por exclusivo-or'ing el nuevo los datos para cada disco. Para pequeo escriba demandas que ponen al da slo un disco de los datos, la paridad se computa por notando cmo el nuevo datos difiere de los datos viejos y aplicando esas diferencias al bloque de paridad. Pequeo escriba as las demandas requieren I/Os a cuatro disco: uno escribir los nuevos datos, dos leer los datos viejos y vieja paridad por computar la nueva paridad, y uno escribir la nueva paridad. Esto es llamado un leer-modificar-escriba el procedimiento. Porque un bloque-entrelaz, la serie de disco de paridad tiene slo una paridad disco que debe ponerse al da en todos escribe los funcionamientos, el disco de paridad puede volverse un cuello de botella fcilmente. Debido a esta limitacin, la serie de disco de paridad distribuda bloque-entrelazada se prefiere universalmente encima de los bloque-entrelazamos, serie de disco de paridad.

La Distribudo-paridad bloque-entrelazada (RAID Nivele 5) La serie de disco de distribudo-paridad bloque-entrelazada elimina el paridad disco cuello de botella presente en la serie de disco de paridad bloque-entrelazada distribuyendo la paridad uniformemente encima de todos los discos. Un la ventaja adicional, frecuentemente pasada por alto a distribuir la paridad es que tambin distribuye los datos encima de todos los discos en lugar de encima de todos menos uno. Esto permite todos los discos para participar reparando lea los funcionamientos en contraste con los esquemas de redundancia con los discos de paridad especializados en que el disco de paridad no pueda participar reparando lea las demandas. La serie de disco de distribudo-paridad bloque-entrelazada tiene el mejor pequeo lea, grande escriba actuacin de cualquier serie de disco de redundancia. Pequeo escriba las demandas son algo ineficaz compar con los esquemas de redundancia como reflejar sin embargo, debido al necesite realizar leer-modificar-escriba los funcionamientos para poner al da la paridad. sta es la actuacin mayor la debilidad de RAID las 5 series del disco niveladas. El mtodo exacto distribua la paridad en el disco de distribudo-paridad bloque-entrelazado forma la lata afecte la actuacin. La figura siguiente ilustra la distribucin de paridad izquierdo-simtrica.

Cada cuadrado corresponde a una unidad de la raya. Cada columna de los cuadrados corresponden a un disco. P0 computa la paridad encima de la raya unidades 0, 1, 2 y 3,; P1 computa la paridad encima de la raya unidades 4, 5, 6, y 7 etc. (la fuente: Referencia 1) Una propiedad til de la distribucin de paridad izquierdo-simtrica es que siempre que usted cruce el rayando las unidades secuencialmente, usted acceder cada disco una vez antes de acceder cualquier dispositivo del disco. Esta propiedad reduce que el disco choca al reparar las demandas grandes.

La redundancia de P+Q (RAID Level 6) La paridad es un cdigo de redundancia capaz de corregir cualquier solo, mismo-identificando el fracaso. Como el disco grande se consideran las series, los fracasos mltiples son se necesitan los posibles y ms fuertes cdigos. Es ms, cuando un disco falla en la serie del disco paridad-protegido, mientras recuperando los volmenes del disco fallado requiere leyendo los volmenes de todos non-faltados los discos con xito. La probabilidad de encontrar un uncorrectable ledos el error durante la recuperacin pueden ser significantes. As, aplicaciones con ms severo los requisitos de fiabilidad requieren error ms fuerte que corrige los cdigos. Una vez el tal esquema, la redundancia de P+Q llamada, usa Caa-Solomon los cdigos para proteger contra a a dos fracasos del disco que usan el mnimo desnudo de dos series del disco redundantes. El P+Q las series del disco redundantes es estructuralmente muy similar al disco de distribudo-paridad bloque-entrelazado forma y opera en mucho la misma manera. En particular, P+Q que las series del disco redundantes tambin realizan pequeo escriben funcionamientos que usan un leer-modificar-escriba el procedimiento, slo que en lugar de cuatro el disco accede por escriba las demandas, P+Q que las series del disco redundantes requieren seis disco accede debido a la necesidad de poner al da ambos los `P ' y `Q ' la informacin. Los Espejos rayados (RAID Level 10) RAID 10 no se mencion en el 1988 artculo original que defini RAID 1 a travs de RAID 5. El trmino se usa para significar la combinacin de RAID 0 ahora (rayando) y RAID 1 (reflejando). Los Discos son reflejado en los pares para la redundancia y mejor la actuacin, entonces el datos est rayado por el mltiplo los discos para la actuacin mxima. En el diagrama debajo de, Discos 0 & 2 y Discos 1 & se reflejan los 3 pares. Obviamente, RAID 10 usos ms espacio del disco para proporcionar los datos redundantes que RAID 5. Sin embargo, l tambin proporciona una ventaja de la actuacin leyendo de todos los discos en paralelo mientras eliminando el escriba la multa de RAID 5. adems, RAID 10 da bien la actuacin que RAID 5 mientras un paseo fallado el unreplaced de los restos. Bajo RAID 5, cada uno intentado ledo del paseo fallado puede realizarse slo leyendo todos los otros discos. En RAID 10, un disco fallado puede recuperarse por un solo lea de su el par reflejado.

La herramienta para calcular eficacia del almacenamiento dada el nmero de discos y los RAID nivele (la fuente: Referencia 3) Los RAID Sistemas Necesidad Cinta Apoyos Merece la pena. Incluso cuando usted usa una redundancia forme planes gusta reflejar o RAID 5 o RAID 10, usted todava debe hacer los apoyos de la cinta regulares de su el sistema. Hay varias razones por insistir en esto, entre ellos: RAID no lo protege de los fracasos del disco mltiples. Mientras un disco est apagado la lnea para cualquiera razone, su serie del disco no es totalmente redundante. los apoyos de la cinta Regulares le permiten recuperar de prdida de los datos que no se relaciona a un fracaso del disco. Esto incluye errores humanos, errores del hardware, y errores del software.

El costo & Actuacin de problemas Hay tres consideraciones importantes mientras haciendo una seleccin acerca de que el nivel de RAID es ser usado para un viz del sistema. el costo, actuacin y fiabilidad. Hay muchas maneras diferentes de medir estos parmetros para el eg. la actuacin podra medirse como I/Os por segundo por el dlar, bytes por segundo o tiempo de la contestacin. Nosotros tambin podramos comparar los sistemas a el mismo costo, la misma capacidad del usuario total, la misma actuacin o la misma fiabilidad. El mtodo usado grandemente depende de la aplicacin y la razn para comparar. Por ejemplo, en transaccin que procesa las aplicaciones la base primaria para la comparacin sera I/Os por segundo por el dlar mientras en las aplicaciones cientficas nosotros seramos interesados ms en los bytes por segundo por el dlar. En algunos sistemas heterogneos como los servidores del archivo ambos I/O por segundo y bytes por segundo puede ser importante. A veces es importante considerar la fiabilidad como la base para la comparacin. Echando una mirada ms ntima al RAID nivela que nosotros observamos que la mayora de los niveles es similar a nosotros. RAID nivelan 1 y RAID nivelan pueden verse 3 series del disco como un subclass de RAID el 5 disco nivelado las series. Tambin RAID nivelan 2 y RAID nivelan generalmente se encuentran 4 series del disco para ser inferiores a RAID nivele 5 series del disco. Del problema de seleccionar entre RAID nivela 1 a travs de 5 es un subconjunto de el problema ms general de escoger una paridad apropiada el tamao de grupo y la unidad rayando para RAID nivele 5 series del disco. Algunas Comparaciones Dado debajo es una mesa que compara el throughput de varias redundancia forma planes para cuatro tipos de demandas de I/O. Las demandas de I/O son lee bsicamente y escribe qu es dividido en pequeo (lee & escribe) y el grande. Recordando el hecho que nuestro datos se ha extendido encima de los discos mltiples (datos que rayan), un pequeo se refiere a una demanda de I/O de una unidad rayando mientras una demanda de I/O grande se refiere a las demandas de una raya llena (una unidad de la raya de cada disco en un error que corrige el grupo).

G: El nmero de discos en un grupo de correccin de error. La tabla sobre clasifica el rendimiendo mximo por dlar el nivel 0 relativo para RAID nivela 0, 1, 3, 5 y 6.Para los propsitos prcticos nosotros consideramos RAID nivela 2 & 4 inferior a RAID nivele 5 disco las series, para que nosotros no mostramos las comparaciones.El costo de un sistema es directamente proporcional al el nmero de discos que usa en la serie del disco. As la mesa nos muestra eso dado RAID al costo equivalente nivele 0 y RAID nivelan 1 sistemas, los RAID nivelan 1 sistema puede sostener la mitad el nmero de pequeo escribe por segundo que un nivel de RAID que 0 sistema puede sostener. Equivalentemente el costo de pequeo escribe es dos veces como caro en un nivel de RAID 1 sistema como en un nivel de RAID 0 sistema. La mesa tambin muestra eficacia del almacenamiento de cada nivel de RAID.La eficacia del almacenamiento es aproximadamente el lo inverso el costo de cada unidad de pariente de capacidad de usuario a un nivel de RAID 0 sistema. El almacenamiento la eficacia es igual al performance/cost mtrico para grande escribe.

Las figuras sobre el grfico el mtrica del performance/cost de la mesa sobre para RAID 1, 3, 5, nivela y 6 encima de un rango de paridad los tamaos de grupo.El performance/cost de RAID los 1 sistemas nivelados son equivalente al performance/cost de RAID los 5 sistemas nivelados cuando la paridad el tamao de grupo es igual a 2.El performance/cost de RAID los 3 sistemas nivelados siempre son menos de o igualan al performance/cost de RAID los 5 sistemas nivelados. Esto se espera dado que un nivel de RAID 3 sistema es un el subclass de RAID 5 sistemas nivelados derivados restringiendo el tamao de la unidad rayando tal que todas las demandas acceda una raya de paridad de datos exactamente.

Desde la configuracin de RAID los 5 sistemas nivelados no estn sujetos a semejante restriccin, el performance/cost de RAID los 5 sistemas nivelados nunca pueden estar menos de eso de un RAID equivalentes nivelan 3 sistema. Claro las tales generalizaciones son especficas a los modelos de disco las series usaron en los experimentos anteriores. En la realidad, una aplicacin especfica de un nivel de RAID 3 sistema pueda tener el performance/cost bueno que una aplicacin especfica de un nivel de RAID 5 sistema. La pregunta de que RAID nivelan para usar se expresa bien como la configuracin ms general las preguntas acerca del tamao del grupo de paridad y unidad rayando. Para un tamao de grupo de paridad de 2, reflejar es deseable, mientras para una unidad rayando muy pequea RAID nivelan se satisfaran 3. La figura debajo de las parcelas el mtrica del performance/cost de la mesa sobre para RAID nivela 3, 5 & 6.

FiabilidadLa fiabilidad de cualquier sistema de I/O se ha puesto tan importante como su actuacin y costo. Esta parte del la gua didctica: Reviews la fiabilidad bsica proporcionada por una serie de disco de paridad bloque-entrelazada Lists y discute tres factores que pueden determinar la fiabilidad potencial de series del disco. La redundancia en las series del disco es motivada por la necesidad de luchar los fracasos del disco. Dos llave factoriza el MTTF(Mean-Time-a-fracaso) y MTTR(Mean-Time-a-reparacin) es de preocupacin primaria en estimando la fiabilidad de cualquier disco. Seguir son algunos formulae durante el tiempo malo entre los fallos: RAID nivelan 5

La serie del disco con dos disco redundante por el grupo de paridad (el eg: la redundancia de P+Q)

N - nmero total de discos en el sistema G - nmero de discos en el grupo de paridad Los factores la Fiabilidad conmovedora Tres factores que pueden afectar la fiabilidad de series del disco dramticamente son: Sistema cadas no corrige los bit-errores Correlacion a fallas de disco

Cadas del sistemaLas cada del sistema se refiere a cualquier evento como un fracaso de poder, error del operador, la avera del hardware, o cada del software que puede interrumpir un funcionamiento de I/O a una serie del disco. Cosas as choca puede interrumpir escribe los funcionamientos, mientras produciendo estados dnde el datos se pone al da y la paridad no se pone al da o viceversa.En cualquier embale, la paridad es incoherente y no puede usarse en el evento de un fracaso del disco. Pueden aplicarse tcnicas como el hardware redundante y suministros de poder hacer cosas as choca menos frecuente. Las cadas del sistema pueden causar las inconsistencias de paridad en los dos pedazo-entrelazados y pueden bloque-entrelazar el disco forma, pero el problema slo es de preocupacin prctica en las series del disco bloque-entrelazadas. Para, la fiabilidad propone, el sistema choca en las series del disco bloque-entrelazadas es similar a los fracasos del disco en eso ellos pueden producir la prdida de la paridad correcta para rayas durante que se modificaron el la cada.No corrige los bit-errores La mayora no corrige los bit-errores se genera porque el datos es incorrectamente escrito o gradualmente daado como las edades de los medios de comunicacin magnticas. Estos errores slo se descubren cuando nosotros intentamos leer los datos. Nuestra interpretacin de un correctable pedazo error proporciones es que ellos representan la proporcin a que los errores se descubre durante lee del disco durante el funcionamiento normal de la unidad de disco. Un acercamiento con que puede usarse o a menos que la redundancia es intentar proteger contra los errores de bit prediciendo cuando un disco est a punto de fallar. VAXsimPLUS, un producto del DIC, los amonestadores las advertencias emitidas por los discos y notifica a un operador cuando se siente que el disco est a punto de fallar.

Correlacin a fallas de discoCausas: Los factores medioambientales e industriales comnes. Por ejemplo, un accidente podra aumentar la proporcin de fracaso grandemente para todos los discos en una serie del disco para un el periodo corto de tiempo. En general, olas de poder, fracasos de poder y encendiendo los discos simplemente y fuera de puede poner la tensin en los componentes elctricos de todos los discos afectado. Los discos tambin comparten comn apoye el hardware; cuando este hardware falla, puede llevar al mltiplo, los fracasos del disco simultneos. Los discos generalmente ms probablemente son o fallar muy temprano o muy tarde en sus vidas. Fracasar temprano frecuentemente causado por defectos del transente durante que no se puede haber descubierto el fabricante quemadura-en el proceso. Tarde los fracasos ocurren cuando un disco lleva fuera. Los fracasos del disco puestos en correlacin reducen la fiabilidad grandemente de el disco forma hacindolo muy ms probablemente que un fracaso del disco inicial se seguir estrechamente pueden reconstruirse fracasos del disco adicionales antes del disco fallado.Media-Tiempo-de Datos-Perdidos (MTTDL).Seguir son algunos formularios para calcular el Media-Tiempo-de Datos-Perdidos (MTTDL). En un bloque entrelazado la serie del disco paridad-protegido, la prdida de los datos es posible a travs de lo siguiente tres comn las maneras: los fracasos del disco dobles sistema cada seguida por un fracaso del disco falla de disco seguido por un error de bit no corregible durante la reconstruccin Los tres modos de fracaso anteriores son las combinaciones de fracaso ms duras, en eso nosotros, actualmente, no tenemos cualquier tcnica para proteger contra ellos sin sacrificar la actuacin.

RAID Nivel 5

Las Caractersticas de fracaso para la RAID las 5 Series del Disco NiveladasP+Q Arreglo de Disco

Falla caractersticas P+Q Arreglo de Discop(disk) = La probabilidad de leer todos los sectores en un disco (deriv del tamao del disco, el tamao del sector, y BER) La herramienta para Fiabilidad que Usa las Ecuaciones Anteriores.

GlosarioRAIDArreglo de Redundante de Discos Economicos MTTF-- Media-Tiempo-de Datos-PerdidosEl intervalo medio de tiempo que un componente operar antes de fallar. Vea las Funciones de Fracaso debajo. MTTR-- Media-Tiempo-A-reparacin La media cantidad de tiempo necesit reparar un componente, recupera un sistema, o por otra parte restaura repare despus de un fracaso. Vea las Funciones de Fracaso debajo. MTBF--los Malo-Time-entre-fracasos MTBF = MTTR + MTTR MTTDL-- Media-Tiempo-datos-prdida Una fiabilidad mtrico. MTTDL es una funcin de MTTF, MTTR, el nmero total de discos en el sistema, (N), y paridad el tamao de grupo (G).

Funciones de fallos. Cuando una base de tiempo es determinada, pueden expresarse los fracasos de varias maneras: el fracaso cumulativo funcione, la funcin de intensidad de fracaso, la funcin de proporcin de fracaso, y el tiempo malo al fracaso la funcin. El func de fracaso cumulativo - el tion (tambin llam la funcin de valor mala) denota el promedio que los fracasos cumulativos asociaron con cada punto de tiempo. La funcin de intensidad de fracaso representa la proporcin de cambio de la funcin de fracaso cumulativa. La funcin de proporcin de fracaso (o llam la proporcin de riesgo, o la proporcin de ocurrencia de fracasos) se define como la proporcin de fracaso instantnea a un cronometre t, dado que el sistema no ha fallado a a t. El tiempo malo al fracaso (MTTF) la funcin representa el tiempo esperado que el prximo fracaso se observar. (MTTF tambin est conocido como MTBF, el tiempo malo entre los fracasos.) la Nota que las tres medidas anteriores estn estrechamente-relacionadas y podran ser traducido entre si con. Medida de tiempo a reparar y Disponibilidad. Otra cantidad relacionada para cronometrar es el tiempo malo para reparar (MTTR) que representa el tiempo esperado hasta que un sistema se reparara despus de un fracaso es observado. Cuando el MTTF y MTTR para un sistema son moderados, su disponibilidad puede obtenerse. La disponibilidad--es la probabilidad que un sistema est disponible cuando necesit. Tpicamente, es moderado por

ECC--Cdigo de Correccin de Error BERTaza de Bit de Error p(disk)--La probabilidad de leer todos los sectores en un disco (deriv del tamao del disco, el tamao del sector, y BER) G--la paridad el tamao de grupo es decir, nmero de discos en el grupo de paridad N--el nmero total de discos en un sistema de la serie redundante busque tiempo--la Cantidad de tiempo necesit mover la cabeza a la posicin radial correcta del disco. La latencia rotatoria--la Cantidad de tiempo necesit para el sector deseado para rodar bajo la cabeza del disco.Referencias.[1] Peter M. Chen, Edward K. Lee, Garth A. Gibson, Randy H. Katz and David A. Patterson.RAID: High-Performance, Reliable Secondary Storage. ACM Computing Surveys.[2] http://www.consensys.com/html/rzma1_raid_disk_array__overvie.html[3] http://umunhum.stanford.edu/tools/jsdt.html[4] D.A. Patterson and J.L. Hennessy, Computer Architecture: A Quantitative Approach, 2ndedition, Morgan-Kaufmann, 1996.[5] E K Lee, R H Katz,"Performance Consequences of Parity Placement in Disk Arrays"[6] E K Lee, R H Katz, "An Analytic Performance Model of Disk Arrays and its Applicaton"[7] E K Lee, "Software and Performance issues in the Implementation of a RAID prototype"[8] P M chen, G A Gibson, R H Katz, D A Patterson, "An Evaluation of Redundant Array ofDisks using an Amdhal 5890"[9] P M Chen, D A Patterson,"Maximizing Performance in a striped Disk Array"

Documents

Tutorial RAID