Qué es RAID y qué nivel elegir para tu homelab
RAID agrupa varios discos físicos en un solo volumen lógico para ganar redundancia o tolerancia a fallos. Conoce cómo funciona cada nivel y cuándo tiene sentido montarlo en casa.
Por qué importa
Redundancia, no magia
RAID protege contra fallo de hardware, no contra borrado accidental ni ransomware. No reemplaza un backup real.
El tamaño importa
Con discos de 8 TB en RAID 5, la probabilidad de encontrar un URE durante la reconstrucción supera el 50%.
Reconstrucción bajo riesgo
Un array degradado reconstruyendo un disco de 4 TB puede tardar más de 24 horas: el período más peligroso de tu array.
Elige según el uso
RAID 1 para simplicidad y espejo limpio; RAID 10 para rendimiento con tolerancia a fallos; RAID 6 si priorizas capacidad con doble paridad.
Cómo distribuye RAID los datos entre discos
RAID no es un protocolo de red ni un estándar de fabricante: es una técnica de gestión de discos que lleva décadas en entornos de servidor y que hoy cualquiera puede montar en casa con un NAS de consumo o con Linux.
La idea central es que el sistema operativo ve un único volumen lógico aunque por debajo haya dos, cuatro o más discos físicos. Lo que varía entre niveles de RAID es cómo se reparten los datos y si existe algún mecanismo para recuperarse de un fallo.
Hay dos mecanismos básicos: striping (dividir los datos en bloques y repartirlos entre discos) y mirroring (duplicar los datos en más de un disco). La paridad es un tercer mecanismo que permite reconstruir un disco perdido a partir del resto, sin duplicar todo el contenido.
RAID 0: rendimiento puro, cero tolerancia a fallos
RAID 0 parte los datos en bloques y los alterna entre dos o más discos. Con dos discos de 4 TB obtienes 8 TB útiles y lecturas y escrituras más rápidas porque ambos discos trabajan en paralelo.
El problema es que si cualquiera de esos discos muere, el array entero muere con él. No hay paridad, no hay espejo: los datos están partidos entre los dos discos y sin uno de los dos son irrecuperables.
Cuándo tiene sentido: caché de render, scratch disk para vídeo, datos que regeneras fácilmente. Para cualquier dato que no puedas permitirte perder, RAID 0 no es una opción razonable.
Ejemplo concreto: un directorio de archivos temporales de Blender o una caché de compilación. Si muere el disco, regeneras. Si guardas ahí tus proyectos finales y muere el disco, regenerar no te sirve de nada.
RAID 1: el espejo que aguanta el golpe
RAID 1 escribe exactamente los mismos datos en dos discos simultáneamente. Si uno falla, el otro sigue funcionando con todos los datos intactos. Desde ahí reemplazas el disco roto, el array se reconstruye y vuelves a tener redundancia.
La contrapartida es que la capacidad útil es el 50% del total: dos discos de 4 TB dan 4 TB, no 8. Las escrituras no ganan velocidad (escribes lo mismo dos veces), pero las lecturas pueden repartirse entre los dos discos según la implementación.
Es el nivel más sencillo de entender y de operar. Para un NAS doméstico con dos bahías, es la opción natural si lo que te importa es no perder datos sin complicarte la vida.
Si tienes un Synology de dos bahías con RAID 1, puedes apagar el NAS, sacar un disco, conectarlo a otro equipo Linux y leer los datos directamente. Eso no pasa con RAID 5 ni con RAID 0.
RAID 5 y RAID 6: paridad y capacidad con un asterisco importante
RAID 5: tres discos, un fallo tolerado
RAID 5 requiere al menos tres discos. Distribuye los datos y un bloque de paridad entre todos los discos del array. La paridad se calcula de forma que si cualquier disco del grupo falla, el sistema puede reconstruir sus datos a partir de los demás.
Con cuatro discos de 4 TB obtienes 12 TB útiles (el equivalente a N-1 discos). Eso es el 75% del total, mejor que el 50% de RAID 1, y con tolerancia a un fallo.
El asterisco: durante la reconstrucción de un disco roto, el sistema tiene que leer todos los datos de todos los discos restantes para recalcular lo que había en el disco perdido. En discos mecánicos de consumo, los URE (Unrecoverable Read Errors) ocurren estadísticamente una vez cada 1014 bits leídos, aproximadamente cada 12,5 TB de lectura. Con discos de 8 TB, la probabilidad de encontrar un URE durante una reconstrucción completa supera el 50%. Si eso ocurre, el array pasa de degradado a irrecuperable.
Para discos de 4 TB o menos, el riesgo es manejable. Para discos de 6, 8 o más TB, RAID 5 empieza a ser una apuesta arriesgada.
Una reconstrucción de un disco de 4 TB en RAID 5 con discos mecánicos puede tardar más de 24 horas. Durante ese tiempo el array está degradado: sin redundancia y bajo carga máxima de lectura. No es el momento ideal para lanzar una migración de datos ni para actualizar el firmware del NAS.
RAID 6: doble paridad para escenarios más exigentes
RAID 6 añade un segundo bloque de paridad, lo que permite tolerar el fallo simultáneo de dos discos. El mínimo son cuatro discos, y la capacidad útil es (N-2) discos: con cuatro de 4 TB obtienes 8 TB útiles.
Pierdes más capacidad que con RAID 5, y las escrituras son más costosas porque el sistema tiene que calcular dos bloques de paridad en vez de uno. A cambio, si durante la reconstrucción de un disco falla otro, el array no cae.
Cuándo tiene sentido RAID 6 frente a RAID 5: cuando los discos tienen más de 4-6 TB, cuando el array tiene cinco o más discos, o cuando el tiempo estimado de reconstrucción supera las 12-16 horas y no puedes asumir que un segundo fallo en ese intervalo sea fatal.
RAID 10: el equilibrio entre rendimiento y redundancia
RAID 10 combina mirroring y striping. Con cuatro discos forma dos pares espejo (RAID 1) y hace striping entre esos pares (RAID 0). Los datos se reparten para ganar velocidad, pero cada bloque existe en dos discos.
La capacidad útil es el 50% del total: cuatro discos de 4 TB dan 8 TB. El rendimiento de escritura es mejor que en RAID 5 o RAID 6 porque no hay que calcular paridad. Y la reconstrucción de un disco es mucho más rápida porque solo tienes que copiar los datos de su espejo, sin recalcular nada.
Puede tolerar el fallo de más de un disco si los que fallan pertenecen a pares distintos. Si fallan los dos discos del mismo par, el array cae. En la práctica, para cuatro discos es un nivel robusto y razonablemente rápido de recuperar.
En un homelab con cuatro discos de 4 TB, RAID 10 te da 8 TB, reconstrucción rápida y buen rendimiento en escrituras aleatorias. RAID 5 te daría 12 TB, pero con mayor exposición durante la reconstrucción. La elección entre ambos depende de si ese 50% extra de capacidad justifica el riesgo adicional para tu caso de uso concreto.
RAID no es un backup: por qué importa no confundirlos
RAID protege contra el fallo de hardware de un disco. Eso es todo. No te protege de:
- Borrado accidental: si eliminas un archivo, RAID lo elimina en todos los discos al instante.
- Ransomware: si un proceso cifra tus archivos, RAID cifra todos los discos al mismo tiempo.
- Fallo del controlador o del NAS: si el sistema que gestiona el array falla, los datos quedan inaccesibles aunque los discos estén perfectos.
- Fallo de más discos de los tolerados: un tercer disco que muere durante la reconstrucción de un array RAID 5 te deja sin datos.
- Bit rot: sin checksums adicionales (como los que ofrece ZFS), un bloque corrupto puede propagarse sin que RAID lo detecte.
La distinción es conceptual y práctica: RAID es disponibilidad, backup es recuperación. Un array RAID te permite seguir funcionando cuando un disco muere. Un backup te permite recuperar lo que existía hace tres días, o la semana pasada.
El esquema que tiene sentido en un homelab es combinar ambos: RAID para que el NAS no caiga cuando un disco falla, más snapshots o copias externas para poder deshacer errores humanos o recuperarse de un cifrado malicioso.
Synology y QNAP implementan RAID por software, gestionado por el propio sistema operativo del NAS. Eso es válido para uso doméstico, pero significa que si el NAS muere por completo (placa base, fuente de alimentación), necesitas otro equipo compatible para leer el array. Un RAID 5 de Synology no lo puedes enchufar directamente a un PC con Windows y leer los datos sin más.
Resumen: qué nivel elegir según tu situación
No hay un nivel universalmente correcto. Depende de cuántos discos tienes, de qué tamaño son y del equilibrio que buscas entre capacidad, rendimiento y redundancia.
- 2 discos, uso doméstico: RAID 1. Sencillo, fiable, fácil de gestionar si algo va mal.
- 3-4 discos, discos de ≤4 TB: RAID 5 es razonable si entiendes el riesgo durante la reconstrucción.
- 4+ discos, discos de >4 TB: RAID 6 o RAID 10. La ventana de vulnerabilidad en RAID 5 es demasiado larga con discos grandes.
- Máquinas virtuales o base de datos en homelab: RAID 10 si el presupuesto lo permite; mejor rendimiento en escrituras aleatorias y reconstrucción más rápida.
- Almacenamiento masivo de archivos fríos: RAID 6 para maximizar capacidad útil con tolerancia a dos fallos simultáneos.
- Datos prescindibles o caché: RAID 0, pero asumiendo que un fallo de disco significa pérdida total.
Lo que aplica en todos los casos: RAID va acompañado de un plan de backup, no lo sustituye. Un array degradado es una llamada de atención, no una situación en la que quedarse tranquilo.
Preguntas frecuentes
Q: ¿Vale RAID para sustituir mis copias de seguridad?
A: RAID y backup son cosas distintas: RAID protege contra el fallo físico de un disco, pero no te salva de un borrado accidental, un ransomware o un fallo del controlador. Si tienes un array RAID y nada más, no tienes backup. Necesitas las dos cosas.
Q: ¿Qué pasa si se rompe un disco durante la reconstrucción?
A: Pierdes todo el array. Durante la reconstrucción el resto de discos trabajan al límite durante horas, y en discos mecánicos de consumo la tasa de error no recuperable (URE) es de 1 por cada 12,5 TB leídos. Con discos de 8 TB en RAID 5, la probabilidad de encontrar un URE antes de terminar la reconstrucción supera el 50%.
Q: ¿Cuánto tarda en reconstruirse un array RAID 5?
A: Depende del tamaño del disco y la carga de trabajo del NAS, pero un disco de 4 TB en discos mecánicos puede superar las 24 horas. Durante ese tiempo el array está degradado y vulnerable: si cae otro disco, pierdes los datos.
Q: ¿Por qué no elegir siempre RAID 5 si aprovecha más capacidad?
A: Porque el riesgo durante la reconstrucción crece con el tamaño del disco. Con discos de más de 4 TB, la probabilidad de un URE fatal es demasiado alta. En esos casos RAID 6 —que tolera dos fallos simultáneos— o RAID 10 son opciones más seguras, aunque sacrificas más capacidad útil.
Q: ¿Qué nivel de RAID tiene más sentido para un NAS doméstico con 4 discos?
A: Depende de lo que priorices. RAID 10 (8 TB útiles de 16 TB totales) ofrece reconstrucción rápida y buena tolerancia a fallos, pero cuesta la mitad de capacidad. RAID 6 (8 TB útiles también) aguanta dos discos muertos a la vez pero reconstruye más lento. RAID 5 da más capacidad (12 TB) pero es el más arriesgado con discos grandes.











Deja una respuesta