Niveles RAID estándar
En almacenamiento de equipo, la niveles RAID estándar comprenden un conjunto básico de RAID configuraciones (matriz redundante de discos independientes) que emplean las técnicas de reparto de los, espejado, o paridad para crear grandes datos fiables tiendas de múltiples computadoras de propósito general unidades de disco duro (Discos duros). Los tipos más comunes son RAID 0 (striping), RAID 1 y sus variantes (mirroring), RAID 5 (paridad distribuida) y RAID 6 (paridad doble). Niveles de RAID y sus formatos de datos asociados están estandarizados por el Storage Networking Industry Association (SNIA) en el estándar de formato de unidad de disco RAID comunes (DDF).[1]
Mientras más niveles RAID pueden proporcionar recuperación de defectos de hardware o errores de lectura y sectores defectuosos (y buena protección contraerrores disco duros), no proporcionan ninguna protección contra pérdida de datos debido a fallas catastróficas (fuego, agua) o errores menores como error de usuario, mal funcionamiento de software, la infección viral. De datos valiosos, RAID es sólo una cuadra del edificio de una mayor prevención de pérdida de datos y el esquema de recuperación, no puede reemplazar un plan de contingencia.
Contenido
- 1 RAID 0
- 1.1 Rendimiento
- 2 RAID 1
- 2.1 Rendimiento
- 3 RAID 2
- 4 RAID 3
- 5 RAID 4
- 6 RAID 5
- 7 RAID 6
- 7.1 Rendimiento
- 7.2 Cálculo de la paridad
- 8 Comparación
- 9 No estándar niveles de RAID y RAID no manejar arquitecturas
- 10 Notas
- 11 Referencias
- 12 Lectura adicional
- 13 Acoplamientos externos
RAID 0
RAID 0 (también conocido como un conjunto de bandas o volumen seccionado) se divide ("rayas") los datos uniformemente a través de dos o más discos, sin paridad información, redundancia, o tolerancia a fallos. Desde RAID 0 no proporciona ninguna tolerancia a fallos o redundancia, la falta de una unidad hará que la matriz completa quebrar; como resultado de tener datos particionados a través de todos los discos, el contrario, la pérdida total de datos. Esta configuración normalmente se implementa con la velocidad como el objetivo previsto.[2][3] RAID 0 se usa normalmente para aumentar el rendimiento, aunque también puede ser utilizado como una forma de crear una lógica volumen de dos o más discos físicos.[4]
Un RAID 0 de configuración puede ser creada con discos de diferentes tamaños, pero el espacio de almacenamiento añadido al conjunto de cada disco se limita al tamaño del disco más pequeño. Por ejemplo, si un disco de 120 GB es a rayas junto con un disco de 320 GB, el tamaño de la matriz será 120 GB x 2 = 240 GB. Sin embargo, algunas implementaciones de RAID permiten la restantes 200 GB ser utilizado para otros fines.
El diagrama en esta sección muestra cómo se distribuyen los datos en la Ax rayas en dos discos, con A1:A2 como la primera banda, A3:A4 como el segundo, etcetera. Una vez que el tamaño de striping es definido durante la creación de un RAID 0 de matriz, debe mantenerse en todo momento. Ya que las rayas se pueden utilizar en paralelo, un n-unidad RAID 0 de matriz aparece como un solo disco grande con una tarifa de datos n veces mayor que la tasa de disco único.
Rendimiento
Un RAID 0 de matriz de n unidades proporciona datos leer y escriben velocidades de transferencia hasta n veces mayor que las tasas de unidad individual, pero con ninguna redundancia de datos. Como resultado, el RAID 0 se utiliza principalmente en aplicaciones que requieren alto rendimiento y son capaces de tolerar la menor fiabilidad, como en Computación Científica[5] o Juegos de ordenador.[6]
Algunos benchmarks de aplicaciones de escritorio Mostrar RAID 0 rendimiento para ser marginalmente mejor que una sola unidad.[7][8] Otro artículo examinaron estas reclamaciones y concluyó que "bandas no siempre aumentan el rendimiento (en ciertas situaciones en realidad será más lenta que una configuración no RAID), pero en la mayoría de las situaciones producirá una mejora significativa en el rendimiento".[9][10] Benchmarks sintéticos muestran diferentes niveles de mejoras de rendimiento cuando se usa múltiples discos duros o SSD en un RAID 0 de configuración, en comparación con el funcionamiento de una unidad de disco. Sin embargo, algunos benchmarks sintéticos también muestran una caída en el rendimiento para la misma comparación.[11][12]
RAID 1
RAID 1 consiste en una copia exacta (o espejo) de un conjunto de datos en dos o más discos; un clásico par espejeado RAID 1 contiene dos discos. Esta configuración no ofrece paridad, striping o expansión de espacio en disco en discos múltiples, ya que los datos se refleja en todos los discos que pertenecen a la matriz, la matriz sólo puede ser tan grande como el disco más pequeño de miembros. Este diseño es útil cuando se lee rendimiento o fiabilidad es más importante que escribir el rendimiento o la capacidad de almacenamiento de datos resultante.[13][14]
La matriz se seguirá funcionando en tanto unidad de al menos un miembro está en funcionamiento.[15]
Rendimiento
Cualquier solicitud de lectura puede ser mantenido y manejado por cualquier unidad de la matriz; así, según la naturaleza de la carga de I/O, desempeño de lectura al azar de una matriz RAID 1 puede ser igual hasta la suma de rendimiento de cada miembro,[a] mientras que los restos de rendimiento de escritura en el nivel de un solo disco. Sin embargo, si se utilizan discos con diferentes velocidades en un arreglo de discos RAID 1, total performance de escritura es igual a la velocidad de los discos más lentos.[14][15]
Benchmarks sintéticos muestran diferentes niveles de mejoras de rendimiento cuando se usa múltiples discos duros o SSD en una configuración RAID 1, en comparación con el funcionamiento de una unidad de disco. Sin embargo, algunos benchmarks sintéticos también muestran una caída en el rendimiento para la misma comparación.[11][12]
RAID 2
RAID 2, que se utiliza raramente en la práctica, rayas de datos en el poco (en lugar de bloque) nivel y utiliza un Código Hamming para corrección de errores. Los discos están sincronizados por el controlador de giro en la misma orientación angular (alcanzan índice al mismo tiempo[aclaración necesitada]), por lo que generalmente no servicio varias solicitudes simultáneamente. Tasas de transferencia muy altas son posibles.[16][17]
Con los discos duros aplicación de corrección de error interno, la complejidad de un código de Hamming externo ofrece poca ventaja sobre paridad para que RAID 2 ha sido raramente aplicada; es el solo original nivel de RAID que no se utiliza actualmente.[16][17]
RAID 3
RAID 3, que se utiliza raramente en la práctica, consiste en bytes-nivel bandas con un dedicado paridad disco. Una de las características de RAID 3 es que generalmente no se de servicios de ti varias solicitudes al mismo tiempo, que ocurre porque cualquier bloque de datos, por definición, se extenderá a través de todos los miembros del conjunto y residirá en el mismo lugar.[aclaración necesitada] Por lo tanto, cualquier ENTRADA-SALIDA operación requiere de actividad en cada disco y generalmente requiere husos sincronizados.
Esto lo hace adecuado para aplicaciones que demandan las más altas tasas de transferencia en tiempo secuencial Lee y escribe, por ejemplo vídeo sin comprimir edición. Aplicaciones que hacen pequeñas lecturas y escrituras desde ubicaciones de disco al azar conseguirá el peor desempeño de este nivel.[17]
El requisito de que todos los discos giran sincrónicamente (en un paralelo) añade consideraciones de diseño a un nivel que no hay ventajas significativas sobre otros niveles RAID, por lo que rápidamente se convirtió en inútil y ahora es obsoleto.[16] RAID 3 y RAID 4 fueron substituidos rápidamente por RAID 5.[18] RAID 3 generalmente fue puesto en ejecución en hardware, y se abordaron los problemas de performance mediante el uso de cachés de disco de gran tamaño.[17]
RAID 4
RAID 4 consiste en bloque-nivel bandas con un dedicado paridad disco. Como resultado de su diseño, RAID 4 proporciona buen rendimiento de lecturas aleatorias, mientras que el rendimiento de las escrituras al azar es bajo debido a la necesidad de escribir todos los datos de paridad en un solo disco.[19]
En el diagrama 1, una solicitud de lectura de block que a1 ser reparado por el disco 0. Un simultáneo Lee solicitud de bloque B1 tendría que esperar, pero una solicitud de lectura para B2 podría realizarlo simultáneamente disco 1.
RAID 5
RAID 5 consiste en bandas de nivel de bloque con paridad distribuida. A diferencia de RAID 4, información de paridad se distribuye entre las unidades. Requiere que todas las unidades pero un estar presente para operar. En caso de falla de una sola unidad, se pueden calcular lecturas posteriores de la paridad distribuida tal que no hay datos se pierde.[5] RAID 5 requiere al menos tres discos.[20]
En comparación con el RAID 4, paridad distribuida de RAID 5 iguala la tensión de un disco de paridad dedicado entre todos los miembros de la RAID. Además, escriba rendimiento se incrementa ya que participan todos los miembros de la RAID en porción de las solicitudes de escritura. Aunque no sea tan eficiente como una configuración no RAID, (porque la paridad todavía debe ser escrita), ya no sólo se trata de un cuello de botella.[21]
RAID 6
RAID 6 extiende RAID 5 agregando otro paridad bloque; así, utiliza bloque-nivel de rayas con dos bloques de paridad distribuidos en todos los discos miembros.[22]
Según la Storage Networking Industry Association (SNIA), la definición de RAID 6 es: "cualquier forma de RAID que puede continuar ejecutar leer y escribir solicitudes en todos los discos virtuales de una matriz RAID en presencia de los dos fallos de disco concurrente. Varios métodos, incluyendo cómputos de datos verificación dual (paridad y Reed-Solomon), datos de verificación de paridad doble ortogonal y diagonal paridad, se han utilizado para implementar RAID nivel 6. "[23]
Rendimiento
RAID 6 no tiene una penalización de rendimiento para las operaciones de lectura, pero tiene una penalización de rendimiento en las operaciones de escritura debido a la sobrecarga asociada con cálculos de paridad. Rendimiento varía grandemente dependiendo de cómo se implementa RAID 6 en arquitectura de almacenamiento del fabricante, software, firmware, o por utilizar firmware y especializada ASICs para los cálculos de paridad intensivo. RAID 6 puede leer a la misma velocidad que el RAID 5 con el mismo número de unidades físicas.[24]
Cálculo de la paridad
Dos diferentes síndromes de necesita ser computado para permitir la pérdida de las dos unidades. Uno de ellos, P puede ser la simple XOR de los datos a través de las rayas, como con RAID 5. Un síndrome independiente, segundo es más complicado y requiere la asistencia de Teoría del campo.
Para hacer frente a esto, la Campo de Galois se introduce con , donde para un adecuado Polinomio irreducible de grado . Un paquete de datos puede ser escrita como en base 2 donde cada es 0 o 1. Esta es elegido corresponde con el elemento en el campo de Galois. Deje que corresponden a las franjas de datos a través de unidades de disco duros codificados como elementos de campo de esta manera (en la práctica probablemente sería ser roto en trozos de tamaño de byte). If es algo generador de del campo y denota además en el campo mientras que concatenación denota multiplicación, entonces y puede ser computado como sigue) denota el número de discos de datos):
Para un informático, una buena manera de pensar en esto es es un operador XOR bit a bit y es la acción de un linear feedback shift register en un paquete de datos. Así, en la fórmula anterior,[25] el cálculo de P es sólo el XOR de cada banda. Esto es porque además en cualquier característica dos reduce el campo finito a la operación de XOR. El cómputo de Q es el XOR de una versión cambiada de puesto de cada banda.
Matemáticamente, la generador de es un elemento del campo que es diferente para cada uno no negativo satisfacción de .
Si una unidad de datos se pierde, los datos se pueden calcularse de P al igual que con RAID 5. Si se pierden unidades de dos datos o una unidad de datos y la unidad que contiene P están perdidos, los datos pueden ser recuperados de P y Q o de Q, respectivamente, utilizando un proceso más complejo. El información puede ser computado usando la teoría de campo; Supongamos y son los valores perdidos con , entonces usando los otros valores de , constantes y se pueden encontrar para que y :
Multiplicando ambos lados de la ecuación para por y la suma a la ecuación anterior da y por lo tanto una solución para , que puede utilizarse para calcular .
El cómputo de Q es intensivo de la CPU en comparación con la simplicidad de P. Por lo tanto, RAID 6 implementado en software tendrá un efecto más significativo sobre el rendimiento del sistema, y una solución de hardware será más compleja.
Comparación
|
En esta sección necesita referencias adicionales para verificación. (De enero de 2015) (Aprender cómo y cuándo quitar este mensaje de plantilla) |
La tabla siguiente proporciona un resumen de algunas consideraciones para niveles RAID estándar. En cada caso:
- Eficacia del espacio matriz se da como una expresión en cuanto al número de unidades, n; Esta expresión designa un valor fraccionario entre cero y uno, que representa la fracción de la suma de las capacidades de las unidades de disco que está disponible para su uso. Por ejemplo, si tres unidades están dispuestas en RAID 3, esto da una eficacia de espacio matriz de 1 − 1 /n = 1 − 1/3 = 2/3 ≈ 67%; así, si cada unidad en este ejemplo tiene una capacidad de 250 GB, entonces la matriz tiene una capacidad total de 750 GB pero la capacidad que es útil para almacenar datos es de sólo 500 GB.
- Tasa de fracaso de la matriz se da como una expresión en cuanto al número de unidades, ny la tasa de fallos de disco, r (que se asume idéntico e independiente para cada unidad). Por ejemplo, si cada uno de los tres discos tiene una tasa de fracaso del 5% en los próximos tres años, y estas unidades están dispuestas en RAID 3, entonces esto da una tasa de fracaso de la matriz en los próximos tres años de:
Nivel | Descripción | Número mínimo de unidades[b] | Eficacia del espacio | Tolerancia a fallos | Tasa de fracaso de la matriz[c] | Rendimiento de lectura | Escribir resultados |
---|---|---|---|---|---|---|---|
RAID 0 | A nivel de bloque reparto de los sin paridad o espejado | 2 | 1 | Ninguno | 1 − (1 − r)n | n× | n× |
RAID 1 | Duplicación sin paridad o bandas | 2 | 1/n | n − 1 fallas de unidades | rn | n×[a][15] | 1×[d][15] |
RAID 2 | Bandas de nivel de bit con Código Hamming para corrección de errores | 3 | 1 − 1/n registro2 (n − 1) | Falta de una unidad[e] | Depende | Depende | Depende |
RAID 3 | Striping con paridad dedicada de nivel de byte | 3 | 1 − 1/n | Falta de una unidad | 1 − (1 − r)n − nr (1 − r)n − 1 | (n − 1)× | (n − 1)×[f] |
RAID 4 | Bandas de nivel de bloque con paridad dedicada | 3 | 1 − 1/n | Falta de una unidad | 1 − (1 − r)n − nr (1 − r)n − 1 | (n − 1)× | (n − 1)×[f][citación necesitada] |
RAID 5 | Bandas de nivel de bloque con paridad distribuida | 3 | 1 − 1/n | Falta de una unidad | 1 − (1 − r)n − nr (1 − r)n − 1 | n×[f] | (n − 1)×[f][citación necesitada] |
RAID 6 | Bandas de nivel de bloque con paridad distribuida doble | 4 | 1 − 2/n | Dos fallas de unidades | 1 − (1 − r)n − nr (1 − r)n − 1 − r2 (1 − r)n − 2 | n×[f] | (n − 2)×[f][citación necesitada] |
No estándar niveles de RAID y RAID no manejar arquitecturas
Alternativas a los diseños anteriores incluyen niveles RAID anidados (que combinan dos o más de los niveles RAID estándar), niveles RAID estándar, y arquitecturas de disco no RAID. Arquitecturas de disco RAID no son contempladas, por similares términos y siglas, en particular JBOD ("sólo un montón de discos"), PALMO DE LA GRANDE, y MAID ("enorme matriz de discos ociosos").
Notas
- ^ a b Máximo teórico, como el rendimiento de disco único en la práctica
- ^ Asume un número mínimo de no degenerar de unidades
- ^ Asume independiente, idéntica tasa de fracaso entre las unidades
- ^ Si se utilizan discos con diferentes velocidades en un arreglo de discos RAID 1, en general es igual a la velocidad del disco más lento rendimiento de escritura.
- ^ RAID 2 puede recuperarse de un fallo o reparar datos corruptos o paridad cuando un poco dañado datos correspondientes y paridad son buenos.
- ^ a b c d e f Asume hardware capaz de realizar asociados cálculos lo suficientemente rápido
Referencias
- ^ "Común"raid"formato disco de datos (DDF). SNIA.org. Storage Networking Industry Association. 2013-04-23.
- ^ «RAID 0 recuperación de datos». DataRecovery.net. 30 / 04 / 2015.
- ^ "comprensión del RAID". CRU-Inc.com. 30 / 04 / 2015.
- ^ «Cómo combinar múltiples discos duros en un volumen de almacenamiento barato y de alta capacidad». LifeHacker.com. 2013-02-26. 30 / 04 / 2015.
- ^ a b Chen, Peter; Lee, Edward; Gibson, Garth; Katz, Randy; Patterson, David (1994). "RAID: fiable de alto rendimiento, almacenamiento de información secundario". ACM Computing encuestas. 26: 145-185. doi:10.1145/176979.176981.
- ^ de Kooter, Sebastiaan (2015-04-13). "shootout de almacenamiento de juegos 2015: SSD, disco duro o RAID 0, que es mejor?". GamePlayInside.com. 2015-09-22.
- ^ «Raptor Western Digital en RAID-0: son dos discos mejor que uno?». AnandTech.com. AnandTech. 01 de julio de 2004. 2007-11-24.
- ^ "Hitachi Deskstar 7K 1000: dos terabytes RAID Redux". AnandTech.com. AnandTech. 23 de abril de 2007. 2007-11-24.
- ^ «RAID 0: bombo o bendición?». Tweakers.net. Servicios en línea de Persgroep. 07 de agosto de 2004. 2008-07-23.
- ^ "¿RAID0 realmente aumenta rendimiento del disco?". HardwareSecrets.com. 01 de noviembre de 2006.
- ^ a b Larabel, Michael (2014-10-22). "Btrfs RAID HDD prueba en Ubuntu Linux 14.10". Phoronix. 2015-09-19.
- ^ a b Larabel, Michael (2014-10-29). "Btrfs 4 × Intel SSD en RAID 0/1/5/6/10". Phoronix. 2015-09-19.
- ^ "Guía de FreeBSD: 19.3. RAID 1: Mirroring ". FreeBSD.org. 2014-03-23. 2014-06-11.
- ^ a b "Qué nivel RAID es adecuado para mí?: RAID 1 (Mirroring)". Adaptec.com. Adaptec. 2014-01-02.
- ^ a b c d "seleccionar el mejor nivel RAID: RAID 1 matrices (Guía de instalación de Sun StorageTek SAS RAID HBA)". Docs.Oracle.com. Oracle Corporation. 2010-12-23. 2014-01-02.
- ^ a b c VADALA, Derek (2003). Gestionar RAID en Linux. Serie de o ' Reilly (ilustrado Ed.). O ' Reilly. p. 6. ISBN 9781565927308.
- ^ a b c d Marcus, Evan; Stern, Hal (2003). Esquemas de alta disponibilidad (2, ilustrada ed.). Juan Wiley e hijos. p. 167. ISBN 9780471430261.
- ^ Meyers, Michael; Jernigan, Scott (2003). A + Guía Mike Meyers de gestión y solución de problemas de PC (ilustrado Ed.). Profesional de la McGraw-Colina. p. 321. ISBN 9780072231465.
- ^ Natarajan, Ramesh (2011-11-21). "RAID 2, RAID 3, RAID 4 y RAID 6 explicado con diagramas". TheGeekStuff.com. 2015-01-02.
- ^ "RAID 5 recuperación de datos FAQ". VantageTech.com. Tecnologías de Vantage. 2014-07-16.
- ^ Koren, Israel. «Organizaciones RAID básica». ECS. UMass.edu. Universidad de Massachusetts. 2014-11-04.
- ^ "Sun StorageTek SAS RAID guía de instalación de HBA, Apéndice F: seleccionando el mejor nivel RAID: RAID 6 matrices". Docs.Oracle.com. 2010-12-23. 2015-08-27.
- ^ "Diccionario del R". SNIA.org. Storage Networking Industry Association. 2007-11-24.
- ^ Fe, E. Rickard (13 de mayo de 2009). "Una comparación de los tipos de RAID de Software".
- ^ Anvin, H. Peter (21 de mayo de 2009). "Las matemáticas de RAID-6" (PDF). Kernel.org. Organización del núcleo de Linux. 4 de noviembre, 2009.
Lectura adicional
- "Aprendiendo sobre RAID". Support.Dell.com. Dell. 2009. archivado de la el original el 2009-02-20. 2016-04-15.
- Matrices redundantes de discos baratos (redadas), Capitulo 38 de la Sistemas operativos: Tres piezas fáciles libro de Remzi H. Arpaci-Dusseau y Andrea C. Arpaci-Dusseau
Acoplamientos externos
- Resumen de IBM sobre niveles de RAID
- RAID 5 explicación de paridad y control de la herramienta
- Calculadora RAID de niveles RAID estándar y otras herramientas RAID
- Guía del usuario del servicio 2.5 Sun StorEdge 3000 configuración familiar: conceptos básicos RAID