Actualizado a: 19 de enero de 2024
JBOD vs. RAID, ¿qué son y en qué se diferencian? En una industria que no deja de evolucionar, comprender este tipo de términos es cada vez más importante. Es por eso que hoy me gustaría hablaros de dos tecnologías, términos, herramientas, etc. —como poco— muy interesantes. Sobre todo si tenemos en cuenta que, de una manera, podemos decir que están relacionados el uno con el otro debido a su significación dentro del mercado del almacenamiento de datos.
No obstante, este proceso es algo más complejo de lo que podría parecer. Sobre todo cuando, aunque tienen ciertas similitudes, son tan distintos el uno del otro. Es por eso que, cuando queremos diferenciar entre dos conceptos tan particulares como JBOD y RAID, lo más importante es entender qué es cada uno. Es por esto mismo que, antes de establecer cuáles son sus diferencias de manera pormenorizada, me gustaría explicaros qué son y cómo funciona cada uno de estos.
De otra manera, sería bastante complicado determinar cuáles son sus diferencias de manera efectiva. Sin embargo, entiendo que muchos de vosotros ya sabréis qué son de manera más o menos aproximada. Es por eso mismo que si queréis ir directos al quid de la cuestión, os recomiendo que vayáis directamente al apartado «JBOD vs. RAID: ¿En qué se diferencian?». En él, sin más, resumiré todo lo que se explique con anterioridad para abordar la cuestión principal.
Y aunque está claro que podría limitarme única y exclusivamente a este apartado, creo que es interesante contar con un contexto previo. Especialmente para aquellos que parten de cero y no tienen demasiada información. De esta manera, creo que podré responder a todas vuestras preguntas, tanto si sois avezados en la materia como si os acabáis de iniciar en ella.
Qué es RAID
Dicho, ¿qué es RAID? De buenas a primeras, podemos decir que es el acrónico de Redundant Array of Independent Disks. En español, esto vendría a significar «matriz de discos independientes redundantes», lo cual ya nos dice bastante sobre qué es. Pese a ello, si nos limitamos a esto, nos quedamos verdaderamente cortos, puesto que hay más. Sobre todo porque, aunque pueda parecer extraño, no todos los sistemas RAID generan redundancia.
Por lo tanto, su nombre no es tan preciso como cabria esperar. ¿Y eso por qué? A grandes rasgos, podemos decir que RAID es un sistema o técnica que implica combinar múltiples discos duros en un solo sistema coherente para mejorar el rendimiento, la redundancia o ambos. En consecuencia, podemos decir que RAID es un término que habla de un conjunto de discos duros agrupados en uno solo para mejorar la transmisión y lectura de datos y/o la seguridad.
Explicándolo de manera algo más sencilla, podríamos decir que la idea detrás del concepto de RAID es crear un único volumen empleando, en el proceso, varios discos duros para que todos estos funcionen de manera unificada. Dentro de esta dinámica, eso sí, podemos diferenciar entre dos configuraciones.
Por un lado, tenemos el Disk mirroning, configuración cuyo principal objetivo es buscar, en efecto, la redundancia de datos. ¿Para qué? Para evitar posibles fallos en la lectura o transmisión de la información disponible. Por el otro, tenemos el disk stripping, configuración que busca, además de esa redundancia, un mejor rendimiento. Es decir, este último quiere potenciar la velocidad en la lectura, transmisión, escritura, etc. de datos e informaciones.
Cómo funciona
Llegados a este punto, ya sabemos que un RAID funciona combinando varios discos duros físicos en una sola unidad lógica o volumen. Esto se puede hacer mediante software o hardware, depende del entorno, y funciona distribuyendo los datos de todas esas unidades físicas mediante un único volumen, válgase la redundancia. De esta manera, podemos decir que el funcionamiento puede variar parcialmente según se ejecute mediante hardware o software.
Pese a ello, empleando una descripción más genérica, podemos decir que un sistema RAID opera distribuyendo datos a través de varias unidades de almacenamiento. Es decir, que permite que se ejecuten varias operaciones de entrada y salida de manera simultánea y equilibrada para mejorar su rendimiento y evitar posibles fallos. Por supuesto, estos datos se pueden leer y escribir al mismo tiempo en los diferentes físicos que conforman la unidad RAID y/o dividirse entre ellos para distribuir la carga de trabajo.
Según el proceso, se potencia el rendimiento o la estabilidad, pudiendo alternar entre uno y otro según su configuración. En lo que respecta a su apariencia, cuando lo miramos a través del directorio de nuestro sistema operativo, aparecerá como uno solo. Por lo tanto, aunque a nivel físico sean varios, a nivel operativo son uno solo.
Sistemas simples y sistemas anidados
Ahora que ya sabemos qué es y cómo funciona un sistema RAID, es necesario entender los diferentes tipos que existen. No obstante, es en este apartado cuando nos tocará cortar por lo sano. ¿Por qué? Pues pirque, en cierto modo, podemos hablar que hay dos tipos de configuraciones más fuera de las que mencionamos originalmente. Hablamos, pues, de las configuraciones simples y anidadas.
Las configuraciones simples son las más comunes de todas y, en general, casi cualquier ordenador relativamente moderno puede usar al menos una o varias de ellas. Pese a ello, no debemos tomarlo como una constante, pues es algo menos estable. El segundo formato de configuración es el anidado, el cual se define por combinar dos configuraciones RAID simples. Lo curioso es que, aunque «necesitamos» saber esto para entender bien qué es un JBOD, no es lo mismo. No al menos de manera tan específica, siendo este el motivo por el cual podemos encontrar numerosas diferencias entre ambos.
¿Qué es JBOD? Tipos de RAID simples
Llegados a este punto, ya sabemos qué es un RAID, cómo funcionan y qué tipos de configuraciones existen. Gracias a esto podemos entender quje es, de manera superficial, que es el JBOD. Sobre todo porque si sabemos que es un RAID, sabemos, más o menos, que es un JBOD. Veámoslo uno por uno.
RAID 0
Es uno de los niveles o formatos más básicos de configuración simple. Como tal, la configuración RAID 0 divide los datos en diferentes bloques. Tras esto, distribuye esa misma información de manera equitativa entre dos o más de los discos duros que conforman el RAID. Una de las principales ventajas de este sistema es que se mejora la velocidad de lectura y escritura debido a que estos se ejecutan de manera simultánea en varios discos. Su principal desventaja es que no tiene redundancia. Por lo tanto, si un disco fallo, se perderán los datos de todos ellos.
RAID 1
Cuando hablamso de RAID 1, hablamos de una configuración que busca duplicar los datos escritos en la unidad en dos o más discos diferentes. Al hacer esto, se genera la llamada redundancia, la cual genera seguridad adicional a la hora de evitar perdidas de datos. Si un disco falla, pero el resto siguen funcionando, no se pierden los datos, puesto que están duplicados en otro. A cambio, el rendimiento no aumenta y, en realidad, puede hasta ser más lento, ya que los datos se escriben (realmente) dos veces.
RAID 2
Este modelo, en realidad, se usa muy poco, y es por eso que no quiero explayarme demasiado en él. A grandes rasgos, es una versión alternativa de RAID 0 que agrega un sistema de corrección de errores.
RAID 3
Otro sistema muy poco común. Las RAID no son esencialmente habituales en diversos estamentos, por lo que son menos conocidas en términos generales. Bueno, pues las configuraciones simples RAID 3 son todavía más raras debido a que organizan la información a nivel de byte y no de bloques. En efecto, RAID 3 es una configuración de almacenamiento en la que los datos se dividen en bytes y se distribuyen en varios discos duros, mientras que un disco adicional almacena información de paridad para detectar y corregir errores. Esta configuración ofrece altas velocidades de lectura secuencial gracias a la distribución de datos a nivel de byte, pero sufre en el rendimiento de escritura debido a la necesidad de calcular y escribir la paridad en un disco separado.
RAID 4
RAID 4 es una configuración de almacenamiento que divide los datos en bloques y los distribuye en varios discos duros, mientras un disco adicional almacena información de paridad. A diferencia de RAID 3, en RAID 4, los datos se dividen en bloques en lugar de bytes, lo que mejora el rendimiento en operaciones de lectura aleatoria al permitir múltiples operaciones simultáneas. La paridad se calcula en función de los datos en bloques, lo que proporciona tolerancia a fallos: si un disco falla, los datos pueden ser reconstruidos utilizando la información de paridad almacenada en el disco dedicado. Sin embargo, debido a que todos los bloques de paridad se almacenan en un solo disco, este se convierte en un cuello de botella para las operaciones de escritura, limitando el rendimiento general de RAID 4.
RAID 5
Esta es una de las configuraciones más habituales, pues se usa con cierta frecuencia en entornos empresariales y profesionales. A grandes rasgos, funciona almacenando y distribuyendo los datos en diferentes bloques mediante un sistema de paridad para garantizar la redundancia, seguridad y estabilidad. Es decir, que puede recuperar y reconstruir datos al dupliubcar la información. Su construcción, no obstante, le permite potenciar el rendimiento, siendo más rápido que otras configuraciones más básicas.
RAID 6
RAID 6 es similar a RAID 5, pero con dos bloques de paridad distribuidos en los discos. Esto significa que puede resistir la falla simultánea de hasta dos discos. La configuración de doble paridad mejora la redundancia y seguridad de los datos, pero también requiere un mayor número de discos para implementarse.
JBOD: Just a Bunch Of Disks, ¿es realmente un tipo de RAID o es otra cosa?
Llegamos, sin duda, a uno de los puntos más interesantes. Como hemos dicho anteriormente, un JBOD es algo parecido a un RAID, aunque la realidad es que, si nos ponemos muy técnicos, no es así. Al menos no del todo. JBOD no es técnicamente una configuración RAID, pero es una forma de combinar varios discos en un solo volumen sin usar redundancia ni paridad. Es decir, cada disco opera de forma independiente. No hay redundancia ni mejoras significativas en el rendimiento.
JBOD se utiliza cuando se necesita simplemente expandir el espacio de almacenamiento sin preocuparse por la redundancia o el rendimiento. Por lo tanto, no podemos decir que JBOD sea un RAID al uso. Se trata de una configuración de almacenamiento que no utiliza las principales características de las RAID. En cierto modo, podemos decir que es un arreglo mediante el cual varios discos duros se agrupan para construir una gran unidad de almacenamiento.
Pese a ello, como ya hemos dicho, cada una de estas unidades funciona de manera independiente. Por lo tanto, los datos que se encuentran en estos se escribirán, leerán, etc. de manera secuencial según la capacidad de los discos. Lo bueno de todo esto es que si uno de los discos falla, solo los datos de ese disco se pierden, mientras que los demás siguen funcionando. JBOD no ofrece redundancia, paridad ni mejora en el rendimiento; simplemente agrupa los discos para crear un espacio de almacenamiento más grande y flexible.
JBOD vs. RAID: ¿En qué se diferencian?
RAID (Redundant Array of Independent Disks) y JBOD (Just a Bunch Of Disks) son dos enfoques diferentes para gestionar múltiples discos en un sistema de almacenamiento. Teniendo esto en cuenta, y valorando todo lo que hemos comentado con anterioridad, podemos citar los siguientes puintos como sus principales diferencias:
RAID (Redundant Array of Independent Disks)
Redundancia y estabilidad frente a los fallos
- RAID. Ofrece configuraciones con redundancia de datos para evitar pérdidas de datos (generalmente) y evitar fallos generales. Dependiendo del tipo, los datos se duplican o se utilizan códigos de paridad para recuperar datos en caso de fallos.
- JBOD. No ofrece redundancia. Si un disco falla en un sistema JBOD, los datos almacenados en ese disco se perderán.
Rendimiento
- RAID. Puede ofrecer mejoras significativas en el rendimiento, especialmente en configuraciones RAID que involucran striping (como RAID 0). Como siempre, depende del tipo, ya que algunas configuraciones no mejoran el rendimiento. Dpende.
- JBOD. No mejora el rendimiento en comparación con un solo disco, ya que cada disco funciona de forma independiente. Tampoco ofrece mejoras de rendimiento entre varios discos, a diferencia de algunos RAID.
Espacio utilizable
- RAID. Determinadas configuraciones de RAID, como RAID 1, producen un espacio utilizable igual al de un solo disco, pero duplicando la información a otros. Es decir, que aunque el espacio real es mayor, el útil no se amplia debido a que se utiliza de manera simultánea con los mismos datls. En otros RAID sí que se amplia el espacio debido a que no hay redundancia.
- JBOD. Utiliza la capacidad completa de cada disco, creando un único gran volumen de almacenamiento.
Implementación
- RAID. Puede ser implementado a través de hardware (utilizando controladores RAID dedicadas) o software (utilizando controladores RAID incorporados en el sistema operativo).
- JBOD. Es gestionado principalmente a través del sistema operativo, y cada disco se ve y se utiliza como una unidad de almacenamiento independiente.
JBOD (Just a Bunch Of Disks)
Independencia de discos
- RAID. Los discos están organizados a través de una configuración específica que define cómo se utilizan y protegen los datos. En determinados formatos no son independientes.
- JBOD. Los discos siempre son independientes y se utilizan como unidades de almacenamiento separadas. Cada disco se puede llenar individualmente sin depender del estado de otros discos.
Simplicidad
- RAID. Las configuraciones de RAID pueden ser complejas de configurar y mantener, especialmente en configuraciones avanzadas como RAID 5 o RAID 6.
- JBOD. Es simple y fácil de implementar. Solo implica conectar discos al sistema y utilizarlos como unidades separadas.
Recuperación de datos
- RAID. Dependiendo del tipo de RAID, la recuperación de datos puede implicar reconstruir la matriz utilizando la redundancia de datos (paridad o duplicación).
- JBOD. Si un disco falla, solo los datos en ese disco se pierden, mientras que los datos en otros discos siguen siendo accesibles.
En resumen, RAID se utiliza para mejorar la redundancia y el rendimiento, mientras que JBOD simplemente agrupa los discos para crear un gran espacio de almacenamiento, sin ofrecer redundancia ni beneficios de rendimiento inherentes a las configuraciones RAID. La elección entre RAID y JBOD depende de los requisitos específicos de almacenamiento y del nivel de protección de datos que se desee.