Pregunta ¿Son las unidades SSD tan confiables como las unidades mecánicas (2013)?


Las unidades SSD han existido desde hace varios años. Pero el tema de la confiabilidad aún surge.

Supongo que este es un seguimiento de esta pregunta publicada hace 4 años y actualizada por última vez en 2011. Ahora es 2013, ¿ha cambiado mucho? Supongo que estoy buscando alguna evidencia real, más que una simple sensación. Tal vez los estés usando en tu DC. ¿Cuál ha sido tu experiencia?

Fiabilidad de las unidades SSD.


ACTUALIZAR:

Ahora es 2016. Creo que la respuesta es probablemente sí (aunque es una pena que todavía cuesten más por GB).

Este informe da algunas pruebas:

Fiabilidad flash en la producción: lo esperado y lo inesperado

Y algunos datos interesantes sobre las unidades mecánicas (de consumo):

Backblaze: datos y estadísticas del disco duro


159
2018-05-14 04:11


origen


¿Por qué dices que el problema de la fiabilidad sigue apareciendo? - ewwhite
El SSD de la computadora portátil de mi esposa deja de funcionar cada pocos meses y requiere un extraño "encendido, pero no intente arrancar durante veinte minutos". Entonces está bien de nuevo. Nuevas tecnologías, nuevas formas de fallar. - Jaydee
Solo un punto de datos, me temo: obtuve una MacBook Retina Pro en septiembre del año pasado y tuve una falla de SSD en la terminal dentro de los 60 días. La unidad de reemplazo ha estado bien, pero ahora estoy muy preocupada porque el reemplazo de usuario / actualizaciones de estos no es realmente una opción. - Roddy
No quieres un disco confiable de todos modos. Si falla a las 2 pm todos los días, podrá confiar en él para programar su reloj. Lo que quieres es un disco resistente. - Alan B
Los SSD han existido por mucho más largo que "varios años ahora". Más como 40, en realidad, e incluso si te refieres a SSD basados ​​en Flash, estamos hablando de casi 20 años. - alastair


Respuestas:


Esta será una función de su carga de trabajo y la clase de unidad que compre ...

En las implementaciones de mi servidor, no se me ha fallado una SSD especificada correctamente. Esto incluye diferentes tipos de unidades de disco, aplicaciones y cargas de trabajo. 

Recuerda, ¡no todos los SSD son iguales!

Entonces que hace "correctamente especificada" ¿media?

Si su pregunta es sobre el uso de SSD en aplicaciones empresariales y de servidor, ha cambiado bastante en los últimos años desde que pregunta original. Aquí hay algunas cosas para considerar:

  • Identifique su caso de uso: Hay unidades de consumo, unidades de empresa e incluso aplicaciones industriales reforzadas SSD. No compre un disco barato destinado para uso de escritorio y ejecute una base de datos de escritura intensiva en él.

  • Hay muchos factores de forma disponibles: Los SSD de hoy se pueden encontrar en tarjetas PCIe, SATA y SAS 1.8 ", 2.5", 3.5 "y otras variantes.

  • Use RAID para sus servidores: No dependería de una sola unidad mecánica en una situación de servidor. ¿Por qué harías lo mismo con un SSD?

  • Composición de la unidad: Hay unidades SSD basadas en DRAM, así como los tipos de flash MLC, eMLC y SLC. Estos últimos tienen tiempos de vida finitos, pero están bien definidos por el fabricante. p.ej. Verás límites diarios de escritura como 5 TB / dia por 3 años.

  • La aplicación del disco importa: Algunas unidades son para uso general, mientras que otras están optimizadas para lectura o para escritura. Unidades basadas en DRAM como la sTec ZeusRAM y DDRDrive no se desgastará Estos son ideales para entornos de alta escritura y para discos frontales más lentos. Las unidades MLC tienden a ser más grandes y optimizadas para lecturas. Las unidades SLC tienen una vida útil mejor que las unidades MLC, pero MLC empresarial parece ser lo suficientemente bueno para la mayoría de los escenarios.

  • RECORTAR no parece importar Controladores RAID de hardware todavía no parece que lo apoye completamente. Y la mayoría de las veces, uso SSD, estará en una configuración RAID de hardware. No es algo que me preocupe en mis instalaciones. ¿Tal vez deberia?

  • Resistencia:El aprovisionamiento excesivo es común en los SSD de clase servidor. A veces, esto se puede hacer a nivel de firmware, o simplemente mediante la partición de la unidad de la manera correcta. Los algoritmos de nivelación de desgaste también son mejores en todos los ámbitos. Algunas unidades incluso reportan estadísticas de vida útil y resistencia. Por ejemplo, algunos de mis SSD empresariales Sandisk de marca HP muestran 98% life remaining Después de dos años de uso.

  • Los precios han bajado considerablemente: Los SSD alcanzan el precio correcto: relación de rendimiento para muchas aplicaciones. Cuando el rendimiento es realmente necesario, es raro que ahora se establezca un valor predeterminado para las unidades mecánicas.

  • Las reputaciones se han solidificado:  p.ej. Intel es seguro pero no de alto rendimiento. OCZ no es confiable SandforceLas unidades basadas en disco son buenas. sTec / STEC es extremadamente sólido y es el OEM para muchas unidades de arreglo de gama alta. Sandisk/ Pliant es similar. OWC tiene excelentes soluciones SSD con una excelente garantía para servidores de bajo impacto y para la implementación de estaciones de trabajo / computadoras portátiles.

  • La protección de la pérdida de potencia es importante: Mire las unidades con supercapacitores / supercápsulas para manejar escrituras pendientes durante los eventos de energía. Algunas unidades aumentan el rendimiento con cachés integrados o las aprovechan para reducir el desgaste. Las supercápsulas aseguran que esas escrituras se descarguen al almacenamiento estable.

  • Soluciones híbridas: Los proveedores de controladores RAID de hardware ofrecen la capacidad de aumentar las matrices de discos estándar con SSD para acelerar las lecturas / escrituras o servir como caché inteligente. LSI tiene CacheCade y es Hardware / software Nytro ofrendas También existen soluciones de software y de nivel de sistema operativo para hacer cosas como proporcionar caché local en aplicaciones, bases de datos o sistemas de hipervisor. Sistemas de archivos avanzados como ZFS haga un uso muy inteligente de los SSD optimizados para lectura y escritura; ZFS se puede configurar para usar dispositivos separados para el almacenamiento en caché secundario y para el registro de intentos, y los SSD se usan a menudo en esa capacidad incluso para grupos de HDD.

  • El flash de primer nivel ha llegado: Soluciones de flash PCIe como Fusión han madurado hasta el punto en que las organizaciones se sienten cómodas implementando aplicaciones críticas que dependen del mayor rendimiento. Soluciones de dispositivos y SAN como RanSan y Memoria de violín todavía están ahí fuera, con más participantes que entran en ese espacio.

enter image description here


173
2018-05-14 04:52



TRIM es realmente importante en unidades con muy poco aprovisionamiento excesivo, lo que es un caso masculino en unidades de consumo donde los $ / GB son de suma importancia. La mayoría de las unidades empresariales tienen suficiente aprovisionamiento en exceso que TRIM no hace ninguna diferencia. - Mr Alpha
@MisterSmith Mira lo que escribí arriba. Diferentes SSDs tienen características diferentes. Utilice la herramienta adecuada para el trabajo. Si tuviera que tomar un Corsario u otra unidad de nivel de consumidor y utilícela como SSD para un sistema de base de datos de escritura activa o como la ZIL dispositivo de registro para una matriz de almacenamiento ZFS, la quemaría en uno o dos meses. - ewwhite
Excelente post. Uno de mis motivos favoritos: los controladores RAID no siempre son la elección correcta con los SSD. Los controladores RAID se diseñaron para dividir datos y agregar códigos de corrección de errores a través de múltiples discos magnéticos. Controladores SSD ya Raya nativamente los datos y agrega códigos de corrección de errores a través de múltiples bancos de NVRAM. Además, agregar un controlador RAID introduce un SPOF adicional, el propio controlador RAID. El uso de un controlador RAID separado es a menudo La elección correcta, pero algunas veces usando un mejor SSD (tarjetas SATA / SAS de grado superior o incluso tarjetas PCI-E como Fusion-IO) es una mejor elección. - Jesper Mortensen
@rickyduck, En realidad, en un centro de datos, una falla de una sola unidad está protegida por RAID, y significa gastar algunos $$$ para reemplazarla sin tiempo de inactividad; mientras que en una plataforma de juegos, una falla de la unidad única es la pérdida total de datos y la reinstalación del sistema operativo.
@MisterSmith incluso los SSD de escritorio de gama alta son más baratos por GB que los destinados a los usos típicos de centros de datos. Además de controladores más potentes en algunos casos (o simplemente firmware de bajo volumen sintonizado para el rendimiento en lugar del rendimiento de ráfaga), obtienen el mejor destello de la parte superior de la ejecución de producción porque muchas cargas de trabajo del servidor son órdenes de magnitud más intensivas en IO que en computadoras de escritorio unidades y mataría rápidamente una unidad de consumo. - Dan Neely


Todas las computadoras portátiles en mi trabajo tienen un SSD o un híbrido desde 2009. Mi experiencia en SSD en resumen:

  • Lo que llamaré unidades de "1ra Generación", vendidas alrededor de 2009 principalmente:
    • En el primer año murieron aproximadamente 1/4, casi todos por Síndrome de muerte súbita (SSD - Es gracioso, risa). Esto fue muy notable para los usuarios finales, y molesto, pero el drástico la diferencia de velocidad hizo que este patrón de falla constante fuera tolerable.
    • Después de 3 años, todas las unidades han muerto (muerte súbita o desgaste), excepto dos que aún están pateando (en realidad, las unidades L2Arc en un servidor ahora).
  • Las unidades de "2ª generación", vendidas alrededor de 2010-11, son distintas de la generación anterior, ya que sus tasas de Síndrome de muerte súbita se redujeron drásticamente. Sin embargo, el desgaste "problema" continuó.
    • Después del primer año, la mayoría de las unidades todavía funcionaban. Hubo un par de muertes súbitas. Una pareja fracasó por el desgaste.
    • Después de 2 o 3 años, más de la mitad siguen trabajando. La tasa de fracaso del primer año esencialmente ha continuado.
  • Las unidades de "tercera generación", vendidas en 2012+, siguen funcionando.
    • Después del primer año, todo sigue funcionando (golpe en la madera).
    • El disco más antiguo que tengo es de marzo de 2012, por lo que todavía no hay datos de 2-3 años.

SSD Failure (Cumulative)


Actualización de Mayo 2014:
Algunas de las unidades de "segunda generación" han fallado desde entonces, pero aproximadamente un tercio de las unidades originales todavía funcionan. Todas las unidades de "tercera generación" del gráfico anterior aún funcionan (golpee la madera). He escuchado historias similares de otros, pero todavía tienen la misma advertencia sobre muerte en alas rápidas. Los vigilantes mantendrán bien sus datos respaldados.


58
2018-05-14 04:27



Mi experiencia se hace eco de esto. Dicho esto, aún proporcionamos discos duros USB para que los empleados los utilicen como copias de seguridad de la máquina del tiempo (además de nuestro régimen de copia de seguridad externo estándar), para permitir restauraciones rápidas y granulares en caso de una falla o pérdida catastrófica. - EEAA
Dale a la tercera generación otro año o dos. ;) - Andy
También vale la pena señalar que los SSD tienen muchas más probabilidades de sufrir errores de firmware que los HDD; El firmware es más complicado y menos maduro, lo que no es una buena combinación. - alastair
@Andy tiene razón. A partir de 2009, usted dice que la vida media fue de aproximadamente un año. Para el 2010 a 2011, apenas tenemos 3 años para la mitad de ese rango en este momento, donde se indica una vida media de 3 años. Eso solo podría estar basado en observaciones actuales. Si la vida media de las unidades 2012 y 2013 ha mejorado más de 3 años, no se puede saber hasta al menos 2016. (Podríamos intentar extrapolar los fallos iniciales, pero es probable que sean defectos de fabricación aislados, no causados ​​por mucho tiempo). - uso regular a largo plazo. - Andrew Vit
He estado usando 2 x Intel X25M 80Gb G1 desde 2010. Mi trabajo involucra procesos pesados ​​de lectura / escritura. Cada pocos meses, aproximadamente, reinicio la unidad (no tengo que hacerlo) para recuperar el rendimiento, pero por lo demás no hay problemas. Agregué un Samsung 230g de 256Gb el año pasado. No hay problemas hasta ahora! - Antillar Maximus


En mi experiencia, el problema real son los controladores moribundos, no la memoria flash en sí. He instalado alrededor de 10 Samsung SSD (830, 840 [no profesional]) y ninguno de ellos ha tenido ningún problema hasta ahora. Todo lo contrario son las unidades con controladores Sandforce, tuve varios problemas con las unidades de agilidad OCZ, especialmente las que se congelan en intervalos de tiempo irregulares, donde la unidad deja de funcionar hasta que se apaga / enciende en la computadora. Te puedo dar dos consejos:

  1. Si necesita una alta confiabilidad, elija una unidad con MLC, mejor flash SLC. Samsung 840 f.e. tiene flash TLC, y una garantía corta, creo que no sin ninguna razón;)

  2. Elija una unidad con un controlador que se sabe que es estable.


17
2018-05-14 09:39



Me recuerda a los controladores moribundos de la iluminación actual basada en LED. El LED dura mucho tiempo, pero los controladores no parecen hacerlo. - Matt
Quién sabe, pero tal vez es parte de las industrias planeadas obsolescentes :) - klingt.net


www.hardware.fr Uno de los sitios de noticias de hardware más grande de Francia está asociado con www.ldlc.com Uno de los mayores distribuidores franceses en línea. Tienen acceso a sus estadísticas de retorno y han estado publicando informes de tasa de fallos (placas madre, fuentes de alimentación, RAM, tarjetas gráficas, HDD, SSD, ...) dos veces al año desde 2009.

Estas son estadísticas de "muerte temprana", de 6 meses a 1 año de uso. Además, las devoluciones directas al fabricante no se pueden contar, pero la mayoría de las personas regresan al revendedor durante el primer año y no debería afectar las comparaciones entre marcas y modelos.

En términos generales, las tasas de falla de HDD tienen menos variaciones entre marcas y modelos. La regla es mayor capacidad> más platos> mayor tasa de fracaso, pero nada dramático.

La tasa de fallos de SSD es más baja en general, pero algunos modelos de SSD fueron realmente malos, con alrededor del 50% de rendimiento para los infames durante el período que solicitó (2013). Parece haberse detenido ahora que esa infame marca fue comprada.

Algunas marcas de SSD están "optimizando" su firmware solo para obtener resultados un poco más altos en los puntos de referencia y en algún momento terminas con congelamientos, pantallas azules, ... Esto también parece ser un problema menor ahora que en 2013.

Los informes de tasa de fracaso están aquí:
2010
2011 (1)
2011 (2)
2012 (1)
2012 (2)
2013 (1)
2013 (2)
2014 (1)
2014 (2)
2015 (1)
2015 (2)
2016 (1)
2016 (2)


10
2018-05-14 08:11



Aquí hay un enlace a una versión traducida automática del artículo en francés. translate.googleusercontent.com/… - SDwarfs



0
2017-09-05 07:39