Pregunta Sigue teniendo miedo: errores de solicitud de cancelación de adaptador de host después de seguir los pasos recomendados


Recibo el infame error de solicitud de cancelación de adaptador de host con mi nuevo Adaptec RAID Controller bajo E / S alta. He leído varios foros, incluso Adaptecs, la configuración de los valores de / sys / block / sdX / device / timeout en 45 solucionará esto. Sin embargo, estoy ejecutando Ubuntu Server 12.04 que ya tiene este valor en 45 por defecto. También probé la siguiente sugerencia, que era actualizar las biografías de mi mobo a la última, y ​​así lo hice.

No estoy seguro si alguien más se ha topado con este error "aacraid: Host adapter abort request" antes incluso después de seguir estos pasos.

Esto es lo que veo en mi syslog:

kernel: [ 5493.523282] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523309] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523375] aacraid: Host adapter reset request. SCSI hang ?

Heres mi uname -a

Linux server 3.2.0-29-generic #46-Ubuntu SMP Fri Jul 27 17:03:23 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux

Gracias a todos,

Jim


9
2018-01-07 03:28


origen




Respuestas:


En caso de que no hayas resuelto esto todavía, recientemente luché con el mismo problema, que se extendió rápidamente a la matriz colgando cada 5 minutos durante un par de minutos a medida que aumentaba el IO. Ubuntu usa por defecto el programador CFQ, que no es óptimo para el hardware RAID. Cambia el programador a noop con:

echo noop > /sys/block/<blockdevice>/queue/scheduler

Personalmente, estoy atascado con el kernel antiguo, pero también me han dicho que actualizar al último controlador de Aacraid debería solucionar el problema, aunque no puedo verificarlo. Pero aun así, cambie a noop. Dado que sysfs no es permanente, puede configurar el programador en /etc/rc.local o usa el elevator= parámetro de arranque.

Prestaré atención a otros parámetros del kernel, y las configuraciones en Ubuntu son valores predeterminados razonables para el hardware más común, pero la mayoría de los servidores de tiempo necesitan atención especial, independientemente de la distribución en la que se encuentre.


1
2018-06-13 18:26





Si su controlador RAID de Adaptec tiene su propio firmware / BIOS, es posible que deba actualizarlo. Tuvimos problemas durante la E / S alta y obtuvimos "aacraid: Solicitud de anulación del adaptador de host" y vimos una versión de firmware más reciente que la actual que decía "Se solucionó un problema por el cual el firmware podía bloquearse durante una carga de E / S alta". http://download.adaptec.com/pdfs/readme/relnotes_arc_fw-b18937_asm-18837.pdf.

Las notas de la versión anterior enumeran los siguientes modelos de Adaptec: 2045, 2405, 2405Q, 2805, 5085, 5405, 5405Z, 5445, 5445Z, 5805, 5805Q, 5805Z, 5805ZQ, 51245, 51645, 52445).

También tenemos líneas de registro como:

sd 0:0:0:0: timing out command, waited 360s

y

Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK

En la búsqueda en línea para ver a otras personas que tienen un problema similar, encontramos otra línea de tarjetas que tiene los siguientes problemas resueltos por el firmware que podrían ser relevantes:

Los dos anteriores se aplican a los modelos Adaptec 7805, 7805Q, 78165, 71605E, 71605, 71605Q, 71685, 72405, 8805, 8885, 8885Q y 81605ZQ.


1
2017-07-15 21:10



Creo que mi controlador se cuelga cuando use el arcconf utilidad de línea de comando para consultar el estado de la matriz como parte de nuestros scripts de monitoreo de Nagios regulares. Como lo indican las notas de firmware, usando arcconf puede hacer que el controlador se cuelgue. - Stefan Lasiewski