Pregunta Malos discos en servidor antiguo


Tengo un servidor Netware 3.12 de la era de 1998 que funciona todo en nuestro campus: libro mayor general, compras, nómina, información del estudiante, calificaciones, lo que sea. El servidor tiene un controlador RAID Adaptec con dos volúmenes:

  1. RAID 1, 2 discos scsi de 17 GB, Seagate ST318417W
  2. RAID 5, 3 discos scsi de 4 GB, 2 Seagate ST34573W y 1 ST34572W.

Actualmente estamos en las primeras etapas de un proyecto para reemplazar este sistema, pero no solo te incorporas a un nuevo sistema como ese y, por lo tanto, necesito mantener este servidor en funcionamiento hasta noviembre de 2011, como mínimo.

Esta semana no tuvimos uno sino que fallaron dos discos duros. Afortunadamente, son de diferentes volúmenes y podemos seguir funcionando por el momento, pero dada la naturaleza cercana de estas fallas, tengo serias dudas de que podré evitar fallas catastróficas de este servidor a través del objetivo de noviembre, tal como está sin Restaurando la redundancia RAID: solo tomará una falla de disco más en cualquier lugar y estoy completamente perdido.

Somos lo suficientemente afortunados de tener "repuestos" de coincidencia exacta en ambas unidades, pero los repuestos están en condición desconocida. Intenté intercambiarlos solo, pero el controlador RAID no es lo suficientemente inteligente como para manejar esto y hace que el sistema no se pueda arrancar.

En cuanto al controlador RAID en sí, hay una utilidad a la que puedo acceder durante la POST a través de un acceso directo Ctrl-A, pero no puedo hacer mucho útil desde allí. Para administrar realmente los volúmenes, primero debo iniciar en Netware, momento en el que puedo usar CI/O Array Management Software Version 2.0 para ver realmente la información del volumen. Sospecho que la forma normal de gestionar las cosas es arrancar desde un disquete especial con el software del controlador, pero ese disquete hace mucho que desapareció.

Pasando por las opciones en el software RAID, pensar la única forma compatible de reemplazar un disco en un volumen RAID existente es agregar físicamente el disco, iniciarlo y configurarlo como "repuesto" para un volumen, forzar el volumen a usar el repuesto para reemplazar un disco inactivo existente (y en este punto solo lo adivino) para que el disco de bajada se convierta en el repuesto, repare el volumen, elimine el repuesto del volumen y luego apague y extraiga el disco. Luego comience de nuevo para el otro disco fallido. Todo esto equivale a mucho tiempo de inactividad, asumiendo que incluso puedo hacer que funcione y que mis piezas de repuesto son buenas.

En cuanto a la búsqueda de repuestos confiables, no tengo ni idea de dónde empezar a buscar una nueva unidad scsi de 4GB, o incluso qué sistema scsi exacto estoy buscando, ya que ha pasado por varias iteraciones diferentes a lo largo del tiempo.

Otra opción es migrar esto a una máquina virtual (hyper-v), pero todos los intentos anteriores que hemos realizado en esta área no han llegado muy lejos. Cuando se instaló esta máquina, me acababa de graduar de la escuela secundaria, por lo que requiere un nivel más bajo de conocimientos sobre redes y aplicaciones que el que nunca había desarrollado, o si lo había olvidado (tampoco soy exactamente un neófito).

Parte de mi problema es que este es un servidor de alto uso, y retirarlo por unos días para resolver las cosas no va a funcionar muy bien.

En cuanto a la pregunta, estoy buscando cualquier cosa que pueda ser útil en esta situación: una recomendación en un lugar para encontrar buenos repuestos de esta era, experiencia personal en la reparación de volúmenes RAID utilizando un controlador similar o la creación de un Hyper-V VM desde un El antiguo servidor de redes, una línea en un disquete con un mejor software para el controlador RAID, una recomendación sobre un buen consultor de Novell en Nebraska que podría corregir las cosas, alguna otra opción que aún no haya considerado, etc.

Actualizar:
Para las copias de seguridad, tenemos copias de seguridad buenas (verificadas recientemente mediante restauración) de solo datos - Nada para el software que realmente ejecuta las cosas.

Actualización 2:
Solo un informe de progreso que actualmente tengo instalado en Netware 3.12 en VMWare Virtual Server 2.0, en gran parte gracias a la guía que encontré aquí:
http://cerbulescubogdan.blogspot.com/2010/11/novell-netware-312-on-vmware.html

Los siguientes pasos son preparar volúmenes netware vacíos para que coincidan con los volúmenes adicionales en mi servidor existente, tomar un volcado de todos los volúmenes de la unidad C: \ y netware en mi servidor existente, y averiguar a partir de esa información qué módulos deben agregarse a netware, instalar mis licencias (todavía tenemos ese disco, si es que es bueno), y pasar los datos.

Tengo la aprobación para bajar el servidor durante una semana después del primer año (lamentablemente no antes), así que, aparte de crear volúmenes vacíos, el resto del trabajo tendrá que esperar hasta entonces.

Actualización final (5 de enero de 2011):
Pude obtener repuestos trabajando en ambas matrices de raid sin pérdida de datos esta semana. Ambos ahora están listados por el controlador como "FALLA TOLLERANTE" (¡yay!). También pude aprovechar el progreso de mi última actualización y ahora tengo un servidor funcional "de repuesto" en VMWare Server 2.0. El repuesto puede ejecutarse y usar nuestro software erp, pero no puedo ponerlo en producción porque todavía no puedo imprimir desde esa caja (y no tengo idea de por qué). Aun así, esta máquina virtual funcionará si no tengo otra opción, y entre ella y las matrices RAID reparadas me siento cómodo viviendo la situación hasta que pueda deshacerme de la máquina en noviembre.

Epílogo (16 de enero de 2012):
El proyecto para reemplazar este servidor con un nuevo sistema se puso en marcha según lo planeado. ¡Hurra por no más redes! Todos los servidores de granizo SQL! El rey esta muerto. ¡Larga vida al rey!

Todavía planeamos mantener el servidor antiguo en funcionamiento durante un tiempo más, hasta que finalice nuestra auditoría posterior al ejercicio fiscal en agosto. Pero si ocurre una falla entre ahora y entonces, nadie se quejaría demasiado.


12
2017-12-08 19:23


origen


¿Cuál es la pregunta? - andyhky
Ver el ultimo párrafo - Joel Coel
Como otros, perdí el interés mucho antes de llegar al párrafo de la pregunta. Si lo desea, puede considerar reformatearlo todo para formular la pregunta i antes o condensarlo. - John Gardeniers
Quiero poner esto en perspectiva (que es posible que ya sepa): su operación ENTERA se basa en una máquina de 12 años que no puede reemplazar durante un año completo. Tienes un problema. - Jeff Ferland
Gracias por la actualización en su proyecto. Me alegra saber que su migración fue exitosa. - Starfish


Respuestas:


Obtenga (y continúe obteniendo, diariamente o con mayor frecuencia) buenas copias de seguridad de los datos de archivos compartidos ahora. Si pierde la máquina, probablemente no podrá encontrar los disquetes necesarios (sip) para restaurarla. Obtenga una copia de la partición de DOS de la que Netware arranca, si es posible, también.

Eso suena como una tarjeta Adaptec AAA-131 RAID (o algo de esa época). Si tengo razón, no vas a encontrar un software de administración mucho mejor porque no existe ninguno (ver http://www.adaptec.com/en-us/downloads/novell_netware/novell_netware/productid=aaa-131&dn=aaa-131.html para las últimas versiones disponibles). Usé muchas de esas tarjetas "en el pasado" y funcionaron bien.

Si es un AAA-131 Ten mucho cuidado al jugar con su configuración. No hay forma de configurar un conjunto RAID limpiando los discos en esas tarjetas. Eso significa, por ejemplo, que si desactiva el cuadro y adjunta algunos discos de prueba y, por ejemplo, borra la configuración y configura un RAID, cuando vuelva a conectar los discos de "producción", no habrá forma de usarlos. Sin la tarjeta formatearlos primero. Sí. Es tan malo

Novell Netware se ejecutará en los hipervisores de VMware. Recomiendo contratar a alguien que tenga una experiencia decente con Novell Netware (hay personas aquí ... te estoy mirando, Sysadmin1138-- que lo tienen) para ayudarte a mover el contenido del servidor a un entorno virtual donde Al menos, puedes seguir adelante.

Si las computadoras de sus clientes son modernas y tienen un cliente de red de Microsoft instalado, es posible que la migración a una máquina basada en Windows Server sea rápida y fácil. Presente la máquina Windows Server con el mismo nombre que el servidor Netware, exponga una estructura de directorios compartida con la misma convención de nomenclatura UNC que la máquina Netware, copie todos los archivos y duplique los permisos en la máquina de destino (a mano). Puede que no sea tan difícil de hacer y podría "organizar" la migración en un laboratorio de prueba de antemano y probar a algunos clientes con ella para decidir qué se debe cambiar desde una perspectiva de entorno de script / usuario.

Probablemente puede obtener algún hardware de repuesto de eBay. Sin embargo, cualquier cosa que compre de esa cosecha también tendrá problemas de confiabilidad.

Si yo fuera tú, obtendría a alguien bueno con Windows Server para ayudarte a organizar una migración fuera de ese cuadro AHORA. Probablemente, se puede hacer un caso a la administración para que gaste algo de dinero y pueda perder todo el contenido de la caja Netware prácticamente en cualquier momento. La caja de reemplazo no necesitaría una potencia masiva (dado lo que está reemplazando), por lo que la licencia y el respaldo del software serían sus mayores costos. Los problemas de migración relacionados con el cliente se podrían minimizar utilizando un consultor que sea bueno con los scripts y pueda planificar los detalles para cambiar la configuración relacionada con el cliente mediante el inicio de sesión y los scripts de inicio.


12
2017-12-08 19:47



El software de administración del campus que ejecutamos en esta máquina requiere el directorio de Novell para su configuración de seguridad, de lo contrario, lo haría solo en un instante. Tendré en cuenta no jugar demasiado con el controlador RAID. - Joel Coel
@Joel Coel: Yeeouch. Eso apesta. Hazlo virtualizado tan rápido como puedas, entonces. Ese antiguo controlador RAID proporcionará un BIOS Int 13 que permitirá que las herramientas de creación de imágenes del disco DOS (como el FANTASMA del ol 'para DOS) funcionen correctamente. Obtendría una imagen sector por sector de todas las particiones Netware y luego conseguiría a alguien que lo ayude a migrarlas a discos virtuales para el hipervisor de su elección. - Evan Anderson
Trabajando en una respuesta ahora. - sysadmin1138♦


Lo sé, porque lo he hecho (Hola Evan), que VMWare tiene un soporte decente para NetWare. Incluso para las cosas realmente viejas (lo que estás corriendo). NetWare de esa versión antigua NOOP es la CPU cuando está inactiva en lugar de HALTAR, por lo que cualquier CPU que se proporcione en una máquina virtual se vinculará. Para esto son las herramientas de VMWare, hacen que no lo hagan. VMWare ha existido desde los años 90 (e incluso ha tenido un puesto en BrainShare durante varios años) y ha tenido que hacerlo, por eso es que tienen soporte. La virtualización de Microsoft es lo suficientemente nueva como para que nunca hayan tenido que virtualizar NetWare, por lo que no funciona allí.

Si este servidor es tan crítico como usted dice, la recuperación de algunas licencias de VMWare debería ser una venta fácil. Como mínimo, busque una licencia de VMWare Workstation, que al menos llevará este servidor a un entorno virtual. VMWare Server es gratis (creo) si realmente tiene que hacerlo. Una vez que el trabajo está terminado, puedes considerar moverlo a algo como ESXi hasta que pueda ser reemplazado más formalmente.

Hay otras opciones, dependiendo de tus habilidades de Linux. Novell ha pasado bastante tiempo obteniendo Xen (no KVM, Xen, aunque ambos usan qemu) para soportar NetWare. Probablemente funcionará con NW3.12, aunque tendrá que asegurarse de usar modo de virtualización completa, no paravirtualización.

Ese servidor es lo suficientemente nuevo como para tener una unidad de CD-ROM, que probablemente será su salvación. Una vez que haya realizado la copia de seguridad, inicie desde un ISO-Linux si lo desea. No podrá acceder a los datos, pero debería ver el disco duro. En ese punto, hacer una completa dd Copia de ambos volúmenes a otro lugar en su red. Estas imágenes de unidad pueden ser utilizadas directamente por qemu como unidades virtuales.

Hay formas de convertir las imágenes generadas por dd en VMware VMDK, pero no las he utilizado yo mismo. Google ellos, están ahí fuera.


10
2017-12-08 20:11



Algunas tarjetas RAID Adaptec antiguas no son compatibles con Linux. El OP se puede atascar usando una utilidad de imágenes de DOS (para aprovechar el BIOS Int13 de la tarjeta). Una buena utilidad dd-to-vmdk que he usado es: sourceforge.net/projects/raw2vmdk - Evan Anderson
Tiene unidad de CD, pero resulta que la unidad no funcionó :( - Joel Coel


Esto no es realmente útil en términos de su pregunta (francamente, usted ya TIENE repuestos, y la única sugerencia útil que tengo para obtener discos antiguos sería "Alimente los números de modelo de la unidad a Google Shopping"), pero antes de tocar cualquier otra cosa deberías realmente ASEGÚRESE DE QUE USTED TIENE UNA BUENA RESPALDO Y SE PUEDE RESTAURAR CON ÉXITO A UNA NUEVA MÁQUINA EN UN ESTADO UTILIZABLE.

Si esta máquina es tan crítica como parece por su descripción, esa debería ser su prioridad cero en este momento. Si no ha realizado una prueba de restauración exitosa en sus copias de seguridad en un tiempo, debe asumir que no valen la pena, y debe asegurarse de que realmente puede recuperarse si esta máquina resuena y se muera.
Si otro disco cae muerto sobre ti y no tienes copias de seguridad utilizables, ese es prácticamente el juego de pelota. Se moverá a su nuevo sistema inmediatamente, esté listo o no.

Sólo mi $ 3.50.


5
2017-12-08 19:43



Convenido. Pon a prueba tu capacidad de restauración. # 1 Primera cosa. Sin una forma de restaurar, es posible que no tenga copias de seguridad. (He estado allí, hecho eso. Apesta. No lo hagas). - minamhere


Otros ya han abordado las copias de seguridad, etc., así que no repetiré nada de eso. Hay un par de cosas que puede hacer para mejorar sus posibilidades de que el sistema continúe funcionando.

Comience por invertir en un filtro de línea de muy buena calidad y colóquelo entre el UPS y el servidor. Esos impulsos viejos ya serán bastante delicados con respecto a las oleadas, los picos e incluso las fluctuaciones de suministro bastante pequeñas.

Veo en su actualización que ya ha instalado las unidades de repuesto, pero esto es lo que yo hubiera recomendado: Antes de probar las unidades de repuesto en el servidor, colóquelas en otra máquina y haga hincapié en la mierda con el software de grabación o, si Usted no puede conseguir eso, ciclos de prueba continuos utilizando el software de prueba de disco regular. Manténgalo actualizado durante al menos unos días antes de declarar confiables las unidades. Las unidades antiguas que han estado en almacenamiento son notoriamente poco confiables y pueden fallar en un abrir y cerrar de ojos.


2
2018-01-05 21:02





Excelentes sugerencias arriba. Intente esto también: en el hardware moderno de repuesto, intente recuperar todo el sistema de su última copia de seguridad completa. Asegúrese de que la máquina de repuesto no esté en la red.

¿Qué es eso, me temo que podrías decir? ¿No tiene copias de seguridad y / o un procedimiento de restauración? Bueno, ¿ahora sabes en qué estás trabajando para la próxima semana?


1
2017-12-08 20:12





Responder solo a dos / tres veces / cuadruplicadamente recomienda hacer una copia de seguridad todos los días hasta que encuentre una solución. Si no puede reemplazar fácilmente las unidades muertas, su única solución es migrar a unidades nuevas. Si eso significa construir un nuevo servidor, o migrar lentamente su servidor existente para usar nuevas unidades en su servidor existente, es la única opción.

Tuvimos 2 de los 3 discos duros que fallaron en una sola noche en una matriz RAID 5 de 7 años. Nuestras copias de seguridad estaban totalmente desactualizadas. 8 días y $ 17,000 más tarde, una empresa de recuperación de datos pudo recuperar todo nuestro servidor de Exchange, pero nadie se mostró satisfecho. (Excepto yo, porque se suponía que debía hacer copias de seguridad todos los días. Sobre el hardware que solicité pero nadie compraría para mí, pero ese hecho se perdió en todos los demás ...)

Lo único bueno de esto fue que el cliente aprobó de inmediato mi solicitud de compra de 6 meses para el hardware de reemplazo. Pero, mierda santa, fueron unos 8 días extremadamente estresantes. Hágase un favor, haga una copia de seguridad ahora y comience a trabajar en un plan de copia de seguridad de contingencia para "comenzar a trabajar en cualquier hardware que pueda encontrar en su oficina".


1
2017-12-09 01:45