Pregunta ¿El exceso de RAID 1 en las unidades Amazon EBS en términos de confiabilidad?


Mi pensamiento detrás de esto es que RAID 1 crea dos o más copias de los datos en múltiples unidades EBS. Sin embargo, ¿no son los discos de Amazon EBS prácticamente a prueba de fallas porque viven en múltiples unidades físicas? Entonces, en términos de confiabilidad, no está ganando mucho al agregar RAID 1. ¿Es esto correcto o mis datos son erróneos? Me doy cuenta de que probablemente aún obtendría beneficios de rendimiento de lectura de RAID 1.


7
2018-03-30 23:16


origen




Respuestas:


Detrás de la abstracción las unidades ya son redundantes. Está bien ejecutarlos en RAID 0 para la velocidad. Lo que es óptimo es usar la funcionalidad de instantáneas para copias de seguridad. En RAID, esto se puede hacer dividiendo el RAID o congelando los volúmenes, tomando instantáneas, y luego devolviendo las unidades al uso normal. Alternativamente, escribir los datos en un solo volumen de EBS e instantáneas que pueden cubrir otros problemas también, como la falla de la instancia que puede dejar las unidades RAID en un estado incoherente, incluso cuando se vuelven a unir.

TL: DR; Usar RAID 1 es una exageración, es mejor prepararse para otras fallas escénicas con copias de seguridad robustas


4
2018-04-05 21:14



Gracias por la respuesta. Olvidé actualizar esto con los resultados de mi investigación. Básicamente, lo que buscaba es que sí, de hecho, hay una tasa de falla anual de 0.5-1% para estas unidades EBS. Por lo tanto, no puede confiar en la redundancia que proporciona Amazon. Sin embargo, tampoco puede confiar en el uso de RAID 1 porque la falla de dos unidades EBS es mucho menos independiente que en un servidor dedicado típico. Como mencionó, la mejor solución (además de las copias de seguridad regulares) es hacer instantáneas frecuentes como se explica aquí forums.aws.amazon.com/thread.jspa?messageID=124224&#124224 - Sameer Parwani


Sí, EBS es tolerante a fallos en el back-end, pero las fallas de EBS ocurren de manera inesperada. Lo que tu no hacer ver es el tipo de falla a la que la mayoría de nosotros estamos acostumbrados: la unidad se descompone y simplemente falla. El error más frecuente es un aumento enorme e impredecible en la latencia que puede hacer que su aplicación no responda. Con los conjuntos RAID1 o RAID 10, simplemente puede fallar la unidad problemática fuera de la matriz y reemplazarla por una nueva sin tiempo de inactividad.

Recuerde ec2pocolypse hace un par de meses, donde un gran porcentaje de los volúmenes de EBS dejó de responder por completo. Aquellos de nosotros que teníamos conjuntos RAID10 pudimos recuperar fácilmente fallando una unidad o forzando la desconexión con la API. Aquellos que no lo hicieron (te estoy mirando, reddit) tuvieron que sufrir a través de solo un tímido semana de tiempo de inactividad.

Si realmente se preocupa por sus datos, nunca debe, bajo ninguna circunstancia, RAID0. Al hacer esto, aumenta su probabilidad de falla y reduce su capacidad de recuperarse de esa falla. La toma de instantáneas es excelente, pero a menos que transmita sus registros binarios (por ejemplo), no puede realizar una recuperación de un punto en el tiempo. Si está en el comercio electrónico, la gente se molesta cuando paga por algo que no termina siendo enviado porque ya no hay ningún registro de ello en la base de datos.

Recientemente escribí sobre RAID10 EBS después de experimentar otro éxito de EBS RAID: http://blog.9minutesnooze.com/raid-10-ebs-data/

La pregunta es ... ¿en quién confías más con tus datos? ¿Amazonas? o usted mismo?


17
2017-07-24 18:51



Además, ¿la duplicación en RAID10 no permite duplicar el rendimiento de lectura? ¿Ya que las lecturas se distribuirán uniformemente a los volúmenes de EBS subyacentes? - Nic Cottrell
Me pregunto si los enormes periodos de latencia se deben a una falla del disco, en la que falla a su instantánea s3 más reciente ...stackoverflow.com/questions/13576363/… - rogerdpack
Entonces, solo para aclarar, ¿recomendaría RAID 1 en el caso de algo como una unidad para datos principalmente de mysql (o alguna otra opción mejor)? (así como instantáneas, etc.) - Ian