¿Qué tipo de RAID debería utilizar para sus servidores? – CloudSavvy IT

disco duro
Elya Vatel / Shutterstock

RAID, o «Matriz redundante de discos económicos», es el proceso de combinar varios discos duros o SSD en paralelo como un volumen lógico, lo que hace que la matriz sea más resistente contra fallas de la unidad. Hay muchos tipos de RAID y discutiremos cuál debe elegir.

¿Qué es RAID?

Digamos que tiene dos discos duros de 1 TB. En una PC normal, probablemente solo los enchufaría y tendría 2 TB de espacio utilizable para trabajar. Sin embargo, en un entorno de servidor, en realidad es mejor tomar el segundo disco y usarlo como respaldo, formando una matriz RAID. Esto se puede hacer en tiempo real con un controlador RAID, que se conecta a las unidades y administra la matriz RAID por usted. También hay software RAID, pero la mayoría de los servidores vendrán con un controlador RAID dedicado.

Sin RAID, no hay redundancia; sin embargo, este no es realmente el problema principal. Los datos nunca deberían perderse con una buena estrategia de copia de seguridad, pero si pierde una unidad, ese servidor puede experimentar un tiempo de inactividad serio mientras se restaura. Esto no es aceptable en un entorno de servidor y es mucho, mucho peor que una pérdida temporal de datos.

Las matrices RAID se pueden reconstruir sin dejar de ser utilizables, y cuando falla una unidad, no tendrá que restaurar desde copias de seguridad. Ésta es la principal ventaja de las matrices RAID. Los servidores están diseñados para que nunca se caigan, incluso para el mantenimiento en muchos casos; literalmente, puede desconectar una unidad de un servidor web de producción y seguirá funcionando, aunque con menor rendimiento.

En muchos sentidos, RAID es mucho mejor que un disco grande. Una unidad grande de 8 TB no es tan resistente como cinco unidades de 2 TB configuradas en RAID 5. Será difícil encontrar un servidor que venga con una sola unidad instalada.

RAID funciona mejor con unidades idénticas. Puede funcionar con varias unidades, pero normalmente estará limitado a la velocidad y el espacio de la unidad más lenta y pequeña, lo que la hace subóptima.

Toda esta discusión realmente solo se aplica si está administrando un servidor usted mismo, como un NAS doméstico que contiene muchos discos duros; en ese caso, el tipo de RAID que elija es muy importante. Si alquila servidores virtuales de AWS o básicamente de cualquier otro proveedor, la empresa de alojamiento generalmente configurará RAID, ya que ese nivel de control se abstrae de usted.

Una nota antes de comenzar: los números utilizados para designar diferentes niveles de RAID no significan realmente nada. RAID 5 no es cinco veces mejor que RAID 1. Hay otros niveles de RAID extraños, como RAID 2, 3 y 4, pero no se usan en la práctica y no vale la pena explicarlos.

JBOD

Wikipedia

Técnicamente, esta no es una configuración RAID, pero vale la pena mencionarla aquí. JBOD técnicamente significa «lote conjunto de discos», pero puede llamarlo «solo un montón de discos», ya que eso es básicamente lo que es. JBOD simplemente concatena los discos en un disco grande. Esto no ofrece ninguna mejora en el rendimiento y no tiene redundancia, pero no le importa en absoluto qué discos van en él.

Muchos controladores RAID ofrecerán un modo JBOD. Probablemente no debería usarlo, a menos que haya obtenido un montón de discos de diferentes tamaños y desee vincularlos.

RAID 0

Los datos en RAID 0 están divididos en varias unidades; por ejemplo, si desea leer un archivo de la matriz RAID, estará leyendo desde varias unidades en paralelo, lo que hace que RAID 0 sea mucho más rápido que cualquier unidad individual.

Sin embargo, no hay duplicación, paridad u otro mecanismo de redundancia, por lo que si falla una sola unidad, perderá todos los datos del matriz completa. Debido a esto, RAID 0 se usa cuando la velocidad importa, la redundancia no es necesaria.

En cierto modo, RAID 0 es muy similar a no tener RAID en absoluto. Le brinda la ventaja de tener todas las unidades en un solo volumen grande, así como velocidades de acceso mucho más altas. Sin embargo, la falla de una sola unidad puede ser catastrófica para los datos de la matriz, por lo que debe Nunca ejecute RAID 0 sin una solución de respaldo, a menos que los datos sean 100% efímeros.

RAID 0 también maximiza la capacidad, ya que no se utiliza espacio para la redundancia. Si tiene dos discos de 1 TB, el tamaño de su arreglo será de 2 TB. Sin embargo, RAID 0 está limitado al tamaño de disco más bajo de la matriz; si intenta RAID 0 una unidad de 2 TB con una unidad de 1 TB, solo tendrá 2 TB de espacio, y 1 TB se desperdiciará por completo.

RAID 0 con SSD es común y más razonable considerando que los SSD tienen tasas de falla más bajas. Esta es una configuración común en los sistemas de escritorio de alta gama, ya que la velocidad es más importante que la redundancia.

RAID 1

RAID 1 es otro tipo básico de RAID. De manera similar a RAID 0, utiliza dos o más discos, pero en lugar de dividir los datos entre ellos, los datos se duplican desde la primera unidad a la segunda (y cualquier unidad adicional en la matriz). Si tiene dos unidades, una de ellas se utilizará por completo como una especie de copia de seguridad en tiempo real, reduciendo a la mitad la capacidad total de almacenamiento en el proceso. Si cualquiera de las unidades da una patada al cubo, puede continuar leyendo desde la otra unidad y reconstruir la matriz reemplazando la unidad defectuosa.

Esto tiene algunos beneficios de rendimiento de lectura, ya que se pueden usar dos unidades, pero como lee los mismos datos de cada unidad, a menudo no es tan bueno como RAID 0. El rendimiento de escritura se limitará a la velocidad de la unidad más lenta.

RAID 1 es su única opción práctica si tiene dos unidades y no puede permitirse una falla en la unidad que saque sus datos. Sin embargo, no es el más eficiente, ya que está reduciendo su capacidad de almacenamiento a la mitad y, por lo tanto, costará el doble que una unidad única comparable.

Sin embargo, la redundancia en una configuración de servidor vale mucho más que el precio de una sola unidad. Si solo necesita una configuración básica de la unidad, elija una matriz RAID 1 simple. La mayoría de los controladores RAID se establecerán de forma predeterminada en RAID 1 cuando se conecten dos unidades.

RAID 5

incursión 5

RAID 5 es donde las cosas comienzan a ponerse interesantes. En lugar de duplicar datos como RAID 1, RAID 5 utiliza un método mucho más eficiente: la paridad.

La paridad es una forma de verificación de errores, como un hash, pero mucho más simple. Se usa comúnmente para asegurarse de que el tráfico de la red no se confunda en los cables. Básicamente, digamos que tiene 7 bits de datos que desea enviar a alguien y desea asegurarse de que lleguen completamente intactos. Si se cambiara un poco la transmisión, no tendrían forma de saberlo. La solución es contar todos los bits positivos; Si hay un número par de unos, la paridad será 0. Si hay un número impar de unos, la paridad será 1. Agrega esto a los datos que está enviando, y cuando la persona del otro extremo los recibe, ellos mismos calculan la paridad. Si ha habido un error y se ha invertido un bit (incluso el bit de paridad en sí), la otra persona lo sabrá y solicitará que se reenvíen los datos. Por supuesto, si hay dos errores en una sola transmisión, este sistema se rompe, pero eso no es tan común.

En lugar de almacenar copias de los datos (que sería como enviar un mensaje dos veces), RAID 5 simplemente almacena un bit de paridad. Puede imaginarlo como RAID 0 con redundancia: requiere un mínimo de tres unidades. Todas las unidades menos una se utilizan como una matriz RAID 0 normal, pero la última unidad se utiliza para la paridad. Si una de las unidades falla, puede realizar el cálculo de paridad a la inversa para recuperar todos los datos en cualquiera de las unidades (aunque esta es una operación prolongada e intensiva).

En la práctica, RAID 5 no usa una unidad dedicada para la paridad, ya que es más rápido dividir los bits de paridad en todas las unidades, pero puede pensarlo de esta manera cuando calcule cuánto espacio le dará una matriz RAID 5. Básicamente, sume todas sus unidades menos una, y ese es el espacio que tendrá. RAID 5 ahorra más espacio con más unidades: tres unidades tienen una eficiencia del 66%, pero 10 unidades tienen una eficiencia del 90%. Esto reduce drásticamente los costos sobre RAID 1.

Sin embargo, RAID 5 no está exento de inconvenientes. Dado que la paridad debe calcularse siempre que se escribe en la unidad, el rendimiento de escritura se reduce. El problema se amplifica cuando se tiene en cuenta el hecho de que invertir un solo bit en una unidad requiere que se lean todas las unidades para volver a calcular la paridad para ese bloque. En la práctica, si RAID 0 ofrece escalado de rendimiento con n unidades, RAID 5 ofrece n - 1 rendimiento para operaciones de escritura. Sin embargo, con una matriz lo suficientemente grande, el problema no es tan grave.

Además, no importa cuántas unidades tenga, solo podrá sobrevivir al fallo de una unidad. Esto no parecería un problema importante, ya que las fallas son poco comunes y es poco probable que experimente dos de ellas al mismo tiempo, pero las reconstrucciones de arreglos pueden ser muy intensivas en sus unidades; básicamente, está leyendo cada bit de datos. de cada uno, en el momento en que son más vulnerables. Entonces, si uno de ellos falla, existe una mayor probabilidad de que otro disco falle también.

RAID 5 debería ser su opción preferida si tiene tres unidades, ya que RAID 1 sería una pérdida de espacio. Si tiene 4 unidades, probablemente sea la mejor opción, pero las otras dos opciones de esta lista también están disponibles para usted.

RAID 6

incursión 6

RAID 6 es como RAID 5, excepto que el «disco de paridad» está reflejado. Esto permite que su matriz sobreviva dos fallos de unidad. Sin embargo, el rendimiento de escritura es peor en n - 2y, por supuesto, tendrá menos espacio.

Realmente no hay mucho más que decir al respecto. Si tiene una gran variedad de unidades (6, 8 o más), es posible que desee considerar RAID 6 por su redundancia adicional. RAID 6 solo cumple la primera parte de la Estrategia de respaldo 3-2-1—Almacene al menos tres copias de sus datos, con dos copias de seguridad en diferentes medios, con al menos una de ellas ubicada fuera del sitio. RAID 6 puede sobrevivir a dos fallos de disco, lo que lo hace funcionalmente igual que RAID 1 con tres discos (menos los tiempos de reconstrucción).

En la práctica, RAID 6 casi nunca experimentará una falla total en la matriz, especialmente si agrega más discos de paridad a la ecuación. Esto, combinado con copias de seguridad y copias en otros centros de datos, es como los servicios de archivo como AWS Glacier y Backblaze logran una durabilidad del 99,999999999%.

RAID 10 (1 + 0)

incursión 10

RAID 10 es técnicamente una forma de RAID anidado, que es otra cosa complicada en sí misma. Básicamente, si tiene cuatro unidades y no desea usar RAID 5 o 6, sus únicas otras opciones son RAID 0 y 1, que tienen sus problemas. En su lugar, divide esas unidades por la mitad, crea dos matrices RAID 1 y luego toma esas matrices y úsalas para crear una matriz RAID 0 grande. RAID 10 requiere al menos cuatro unidades y también requiere un número par de unidades totales.

Esto le brinda todos los beneficios de RAID 1 y RAID 0 sin muchas desventajas: lectura rápida velocidades, velocidades de escritura rápidas, alta redundancia y reconstrucciones fáciles, sin dejar de utilizar la mitad del espacio total de todas sus unidades. RAID 10 es en realidad más Resistente que RAID 1. En el diagrama anterior, el Disco 1 y el Disco 3 podrían fallar, y la matriz aún podría reconstruirse por completo (aunque si tanto el Disco 0 como el Disco 1 fallan, esa matriz es irrecuperable).

RAID 10 es un nivel RAID muy común para servidores. Es muy rápido y puede sobrevivir a una falla de disco como mínimo. El único problema real es el precio, ya que todavía está pagando el doble para mantener copias de todos sus datos, pero para cargas de trabajo generales, RAID 10 supera a casi todas las demás configuraciones RAID en velocidad, perdiendo solo con RAID 0 en rendimiento.

RAID 50/60

incursión 50

RAID 50/60 es básicamente dos matrices RAID 5 o 6 en RAID 0. Esto mejora el rendimiento al igual que RAID 10, y lo más importante es mejorar el rendimiento de escritura, ya que la lectura de las otras unidades al calcular la paridad es más rápida.

Requiere al menos seis unidades (ocho en el caso de RAID 60), y dado que hay matrices RAID 5 separadas, necesitará unidades de paridad adicionales, lo que lo hace menos eficiente en el espacio, pero un poco más resistente. En general, RAID 50 es básicamente una versión más eficaz de RAID 5.

Deja un comentario

En esta web usamos cookies para personalizar tu experiencia de usuario.    Política de cookies
Privacidad