¿Qué es el RAID y para qué sirve?

Actualizado a: 12 de diciembre de 2022

Si deseas conocer qué es una configuración RAID para tus unidades de almacenamiento HDD o SSD, además de las ventajas, desventajas, etc., aquí tienes este artículo en el que te lo explicaremos todo.

Como consejo, no deberías mezclar unidades HDD y SSD en la misma configuración RAID, o podría generar incosistencias graves. Mejor si todos los discos son HDD o todos son SSD.

Contenido

¿Qué es RAID?

RAID son las siglas de Redundant Array of Independent Disks, es decir, una matriz redundante de discos independientes. Aunque se refiere inicialmente a discos duros magnéticos, también se puede aplicar la configuración a unidades SSD. En cualquiera de los dos casos, se refiere a una forma de redundancia de los medios de almacenamiento para aportar mayor fiabilidad y escalabilidad.

Aunque en un PC no es frecuente este tipo de configuración, sí que lo es en servidores, HPC, en NAS, etc.

Como puedes imaginar, existen una enorme cantidad de configuraciones RAID, como las RAID 0, RAID 1, RAID 2, RAID 3, RAID 4, RAID 5, RAID 6 y RAID 10, etc. Algunas son abiertas y otras propietarias. Incluso tienes configuraciones anidadas, es decir, que mezclan dos niveles RAID diferentes uno dentro de otro para combinar sus ventajas.

Las configuraciones RAID se pueden hacer por software o por hardware. Evidentemente si tienen soporte por hardware el rendimiento será superior, aunque no todas las placas base lo admiten.

Cada uno de los niveles de RAID tiene un propósito diferente, como se detalla en las siguientes secciones.

Cómo elegir la configuración RAID adecuada

A la hora de elegir la mejor configuración RAID Para tu equipo, deberías tener en cuenta las siguientes características:

Rentabilidad, ya que puede que necesites más o menos unidades de almacenamiento según la elegida.
Redundancia (confiabilidad o seguridad), ya que no todas tienen el mismo grado de fiabilidad. Algunas hacen copias exactas, otras solo usan paridad para reconstruir la información a partir de ella.
Requisitos de rendimiento (bajo, medio, alto), puesto que cada configuración RAID ofrece unas prestaciones diferentes.
Capacidad de almacenamiento. Por ejemplo, una RAID0 no tiene ningún grado de redundancia, ya que la pérdida o un fallo en una delas unidades supondrá pérdida de datos.

Niveles RAID

Como existen una gran cantidad de niveles RAID, además de muchas configuraciones anidadas que combinan varios de ellos, como he mencionado anteriormente, vamos a mostrar solo las más populares e importantes:

RAID 0

RAID 0 utiliza bandas, es decir, los datos que almacenes se van a dividir en los diferentes discos duros que tengas en la configuración. Por ejemplo, si se usan dos unidades de almacenamiento en la matriz, y una es de 1 TB y otra de 500 GB, tendrás un espacio total de 1.5 TB para almacenar información. Si se pierde una unidad, se perderán los datos que hayan sido almacenados en dicha unidad. Por eso, carecen de redundancia.

Por tanto, si lo que buscas es una tolerancia a fallos, deberías descartar esta configuración RAID. Lo único que te permite es aunar las capacidades de diferentes discos duros como si se tratase de una sola unidad.

Ventajas	Desventajas
Tecnología fácil de implementar	No es tolerante a fallas. Una sola falla en la unidad da como resultado la pérdida completa de datos.
Utilización completa de la capacidad de almacenamiento	No es una opción ideal para sistemas de misión crítica
Buen rendimiento tanto en operaciones de lectura como de escritura.

RAID 1

El nivel 1 de RAID utiliza la duplicación sin paridad, es decir, lo que se almacena en una unidad se copiará en la otra de forma exacta. Este proceso de copia o espejo en las unidades se realiza de forma transparente al usuario. Es decir, tú solo tienes que almacenar el dato como lo harías en un disco duro convencional, pero tendrás siempre un backup.

Es una configuración de al menos dos unidades que contienen una copia exacta o espejo de datos, por lo que necesitará de unidades de la misma capacidad. Es decir, podríamos tener una de 1 TB y otra de 1 TB para aprovechar todo el espacio. En caso de tener una unidad de 1 TB y otra de 500 GB como en el caso anterior, entonces solo se aprovecharán 500 GB de la primera, ya que deben ser exáctas.

Esto significa que todos los datos son redundantes, por lo que si falla el disco 1 o el disco 2, no se perderán los datos, ya que siempre tendrás la otra copia disponible. Bastaría con sustituir la unidad que ha fallado por otra y los datos se volverían a copiar de la unidad que tiene los datos a la nueva unidad agregada para seguir manteniendo una copia exacta en ambas.

Esta matriz es útil cuando el rendimiento de lectura es importante en comparación con el rendimiento de escritura, ya que se podría estar leyendo datos de una u otra unidad simultáneamente. Además, continuará funcionando mientras un disco esté en estado operativo. Si una unidad falla, entonces el controlador usa el disco de datos o el disco espejo para la accesibilidad y continuidad de los datos.

Ventajas	Desventajas
Es una tecnología simple y fácil de implementar	La capacidad de almacenamiento de datos utilizable es solo la mitad de la capacidad total de la unidad porque los datos son redundantes.
Las operaciones de lectura son bastante rápidas.	No permite el intercambio de la unidad fallida cuando está caliente. Esto significa que la unidad defectuosa se puede reemplazar solo después de apagar la computadora a la que está conectada. Entonces, para un servidor que es utilizado por muchos usuarios simultáneamente, esto no es posible en todo momento.
Ofrece alta tolerancia a fallas para configuraciones que tienen dos unidades de disco	Mayor costo, ya que el nivel 1 de RAID requiere el doble de unidades para lograr la capacidad deseada.
En el caso de una falla en la unidad, los datos se pueden copiar a la unidad de reemplazo evitando así la reconstrucción de datos.

RAID 5

En una configuración RAID 5 se combina la creación de bandas a nivel de bloque con la paridad distribuida entre las unidades. Es el nivel RAID más común y seguro, por eso es tan popular en equipos de alta disponibilidad, como los servidores.

RAID 5 requiere un mínimo de 3 unidades y puede funcionar con un máximo de 16 unidades. Los bloques de datos se dividen en bandas en los discos, y en un disco se escribe una suma de verificación de paridad de todos los datos del bloque. Los datos de paridad no se escriben en una unidad fija, sino que se distribuyen entre todas las unidades. Con estos datos, el equipo podría recalcular los datos de otros bloques que se hayan perdido.

Eso significa que este tipo de matriz puede resistir la falla de una unidad sin perder datos. Aunque se puede lograr en el software, se recomienda utilizar un controlador de hardware para RAID 5. La memoria caché adicional se utiliza en estos controladores para mejorar el rendimiento de escritura.

En definitiva, RAID nivel 5 combina almacenamiento con seguridad y rendimiento.

Ventajas	Desventajas
Las transacciones de datos de lectura son rápidas en comparación con las transacciones de datos de escritura que son algo lentas debido al cálculo de la paridad.	Tiene una tecnología compleja.
Los datos permanecen accesibles incluso después de la falla de la unidad y durante el reemplazo de la unidad de disco duro defectuosa porque el controlador de almacenamiento reconstruye los datos en la nueva unidad.	Las unidades fallidas tienen efectos adversos en el rendimiento
	Si una de las unidades, la sustitución y restauración de los datos (o el tiempo de reconstrucción) puede demorarse bastante, según la carga y la velocidad del controlador. Si otro disco se daña o se corrompe a la vez que la otra unidad falla, sus datos se perderán para siempre.

RAID 6

RAID 6 es similar al RAID 5, pero con la ventaja adicional de que la paridad distribuida es doble, es decir, esto te aporta tolerancia a fallas de hasta 2 unidades simultáneamente. Puede llevar horas o días reconstruir esta matriz RAID si una unidad ha fallado, pero jamás se perderán los datos en caso de que no fallen más de dos unidades. Por supuesto, si fallan más de dos se pueden perder algunos datos que serían irrecuperables. Por tanto, es más segura aún que la RAID 5, pero no totalmente infalible. Aunque, a decir verdad, es complicado que más de dos unidades fallen al mismo tiempo.

Por otro lado, la RAID 6 es ideal para aplicaciones donde se necesitan tasas de lectura altas, pero menor cantidad de solicitudes de escritura. Ten en cuenta que con cada escritura se debe crear también la paridad doble, y eso lleva su tiempo.

Ventajas	Desventajas
Las transacciones de lectura de datos son muy rápidas.	Debido a la doble paridad, las transacciones de datos de escritura son lentas.
La accesibilidad de los datos es alta	La reconstrucción de la matriz RAID lleva más tiempo debido a su estructura compleja.
Mayor redundancia en comparación con RAID 5

RAID 10 (RAID 1+0)

RAID 10 es una combinación de RAID 0 y RAID 1, es decir, una de esas configuraciones anidadas de las que he hablado anteriormente. Es decir, tendremos una configuración como la de la imagen anterior.

Eso significa que la duplicación y la creación de bandas se realizan en una única matriz RAID. RAID 10 es anidado o híbrido y, a veces, se identifica como RAID 1+0. Proporciona seguridad y rendimiento al duplicar y fragmentar datos en varias unidades. Requiere un mínimo de 4 unidades para construir una de estas configuraciones.

Puede ser ideal para entornos que requieren un alto rendimiento y alta seguridad de datos, como las bases de datos transaccionales con información confidencial, entre otras aplicaciones.

Ventajas	Desventajas
La combinación de reflejos y rayas lo hace rápido y resistente.	Es caro
La duplicación hace que RAID 10 sea seguro	Escalabilidad limitada

RAID 50 (RAID 5+0)

El nivel RAID 50 combina RAID 5 y RAID 0, es decir, se trata de un sistema híbrido o anidado que a veces también se conoce como RAID 5+0. El esquema de esta configuración lo tienes en el gráfico anterior.

La configuración de RAID 50 requiere un mínimo de 6 unidades. Proporciona un mejor rendimiento de escritura y seguridad, incluido un tiempo de reconstrucción más rápido que RAID 5 en caso de falla del disco. Además, este nivel de RAID ofrece mayor capacidad y rendimiento al dividir los datos en varias unidades.

Puede ser ideal para aplicaciones donde se requiere una alta confiabilidad, alta capacidad, y altas tasas de transferencias de datos, como por ejemplo en HPC.

Ventajas	Desventajas
Proporciona un excelente rendimiento de lectura.	La falla de dos unidades en una configuración RAID 5 hace que toda la matriz RAID 50 quede inutilizable
Mayor protección sin los gastos generales de una matriz RAID 10	Una matriz RAID 50 requiere discos sincronizados para obtener el máximo rendimiento, lo que limita las opciones de disco.
Rendimiento y redundancia de datos mejorados

RAID 60 (RAID 6+0)

RAID 60 es otro tipo de RAID anidado o híbrido (a veces también denominado RAID 6+0) que combina la división en bloques del nivel 0 de RAID con la paridad dual del nivel 6 de RAID. Es similar a RAID 50 pero ofrece una mejor confiabilidad de los datos con menos rendimiento. Este nivel de RAID también admite volúmenes más grandes.

Este tipo de configuración requiere un mínimo de 8 discos duros en conjuntos de 4 discos RAID 6 para funcionar. Por tanto, es ideal para aplicaciones financieras y contables o servidores de bases de datos de alta disponibilidad. Además, debes saber que consume un 50% por sobrecarga.

Ventajas	Desventajas
Alta tasa de transacción de datos de lectura	El consumo de espacio en disco es alto
Alta redundancia	Rendimiento ligeramente inferior en comparación con RAID 50

Comparativa niveles RAID

NIVELES DE RAID	RAID 0	RAID 1	RAID 5	RAID 6	RAID 10	RAID 50	RAID 60
Descripción	rayado	Duplicación	Rayado con paridad	Rayado con doble paridad	Duplicación y creación de bandas	Striping y Paridad Distribuida	Striping y paridad dual
Unidades mínimas	2	2	3	4	4	6	8
Rendimiento de lectura	Alto	Alto	Alto	Alto	Alto	Alto	Alto
Rendimiento de escritura	Alto	Medio	Alto	Alto	Medio	Medio	Medio
Costo	Bajo	Alto	Bajo	Bajo	Alto	Medio	Alto
Protección de Datos	No	Sí	Sí	Sí	Sí	Sí	Sí
Capacidad de uso	1	0.5	67%-94%	50%-80%	0.5	67%-94%	50%-88%
Aplicaciones Típicas	Transmisión en vivo, edición de video	SO, bases de datos de transacciones	Almacenamiento de datos	Aplicaciones financieras y contables, servidores de bases de datos.	Bases de datos rápidas, servidores de aplicaciones	Grandes bases de datos, servidores de archivos y aplicaciones	Servidores con requisitos de gran capacidad

Conclusión

Existen muchos niveles RAID que se pueden configurar, aunque no todos son tan prácticos para un PC de casa, solo si cuentas con un servidor o supercomputador. Según estas tablas, podrás hacerte a la idea de qué RAID elegir para tu caso particular, en principio no hay una mejor que otra, sino que todo depende del uso o aplicación al que lo destines…