Pregunta La prueba de Joel para trabajos de administrador del sistema


Residencia en “Cuestiones organizativas”: ¿puntos doloridos de TI?  Creo que sería justo decir que los administradores del sistema deben determinar si vale la pena trabajar en un lugar. Hay un conocido similar Prueba de Joel para programadores..

¿Cuáles son las 12 preguntas que los administradores de sistemas deben hacer en una entrevista para ayudarles a decidir si es un buen lugar para trabajar?

Siguiendo las reglas de Joel:

  1. Las preguntas deben ser de plataforma y tecnología agnóstica.
  2. Las preguntas deben provocar una respuesta simple como sí o no

EDITAR: Publique una pregunta a la vez para que podamos ver qué votan los usuarios.


142


origen


Pregunta: ¿deberíamos poner cada pregunta en una respuesta separada para que tengamos las 12 preguntas / respuestas más votadas? - Brian
Creo que esa es probablemente la mejor manera de trabajarlo. - Nick Kavadias
La prueba de Joel usa preguntas de sí / no, así que tal vez deberíamos ceñirnos a esos tipos en lugar de preguntas de "cómo" o "describir". - Doug Luxem
Cierto. Pero las preguntas también pueden formularse de tal manera que "cualquier otra respuesta que no sea x" también sería suficiente. Cada organización hace las cosas de manera diferente, y si bien Joel ha sido lo suficientemente amable como para proporcionar una plantilla, no significa que / todos / seguirán la misma / clase / de plantilla. - Avery Payne
El número 7 no se ajusta a los criterios de la pregunta. Además, la respuesta al número 7 también sería inútil sin un conocimiento previo considerable del trabajo y su entorno. - John Gardeniers


Respuestas:


¿Utiliza un sistema de seguimiento de incidencias / tickets?


101



Y un corolario: ¿apoya el correo electrónico y las conversaciones? El sistema que usamos aquí respondería "sí" a su pregunta, pero está cerca de una pérdida neta. Inevitablemente, llega un informe y el servicio de asistencia no hace las preguntas correctas. Entonces, alguien más entra y hace la recopilación de información secundaria no documentada, soluciona el problema y no hace ningún esfuerzo por documentar nada de esto. Al menos con un hilo de correo electrónico ad-hoc, terminas con un historial de conversación entre comillas. - jldugger
Esto puede ser bueno o malo realmente. Algunos sistemas de tickets terminan impidiendo casi todo el resto del trabajo con mesas de ayuda que aumentan constantemente para obtener el ticket de su reino. - sclarson
Necesita un sistema de incidentes para recopilar estadísticas sobre dónde se encuentran y / o vuelven a ocurrir los problemas reales. Esta es una buena base para reparar sistemas rotos y los informes de la misma ayudan a la administración a ver que es un problema válido con el que tiene que lidiar. - Oskar Duveborn
Hay una diferencia entre problemas e incidentes. Una ocurrencia es un incidente. Una vez que hay un patrón de incidentes, puede convertirse en un problema. - geoffc


¿Realiza copias de seguridad del sistema y realiza restauraciones de prueba con regularidad?


80





  • ¿Cuántas otras personas trabajarán junto a mí en las operaciones diarias?

Esto afecta su capacidad para actuar de una manera muy directa. También afecta su capacidad para tomar unas vacaciones ininterrumpidas ...

  • ¿Quién es el primero en responder a los problemas?

Esta respuesta variará, pero es una buena indicación de cómo la organización puede realmente "organizarse". Las configuraciones grandes deben tener un servicio de asistencia técnica y un sistema de tickets; pequeñas configuraciones deben tener al menos el sistema de venta de boletos, junto con algún tipo de buscapersonas pagado por la compañía para obtener ayuda.

"Sólo tú" no es una respuesta aceptable. Esta es una falta total de organización, y debe ser seguida con una pregunta de "¿Cómo hace un seguimiento de las solicitudes de los usuarios?". Esta debe ser respondido con alguna cosa Aparte de "usted no lo hace".

  • ¿Cuál es su proporción de sistemas existentes a administradores?

Esto no debe ser demasiado alto (por encima de 50: 1) o demasiado bajo (por debajo de 5: 1). Demasiado alto y su carga de trabajo será tan severa que estará pisando agua para mantenerse a flote. Demasiado bajo y usted es una tienda para una sola persona, o existen problemas graves con la capacidad de la tienda para administrar sistemas.

Como siempre, hay excepciones a la regla; instancias en las que se pueden obtener imágenes de más de 200 sistemas de una sola fuente (piense en los extremos de la web), e instancias donde la empresa es muy pequeña (es posible que 20 empleados solo necesiten 2 servidores).

  • ¿Cuál es su proporción de usuarios finales / clientes a administradores?

Esta es una medida de expectativa. Estos son sus "clientes". Cuando hay problemas, esta será la cantidad de "presión" que tendrá para resolver una situación. Una organización de 5000 con solo 2 administradores puede ser un lugar muy, muy estresante si sus sistemas tienen problemas.

  • ¿Cuál es su proporción de usuarios finales / clientes con respecto a los sistemas existentes?

Esta es una medida de la carga de trabajo del servidor. Los índices muy altos pueden ser un signo de sobreutilización o restricciones presupuestarias que atarán sus manos cuando sea el momento de expandirse. La subutilización también puede ser un problema cuando no se la solicita (es decir, tiene sentido que Recursos Humanos tenga su propio servidor, pero un servidor de archivos para solo 5 usuarios "normales" en una organización de 5,000 es una bandera roja); Esto podría requerir cierta "virtualización" para consolidar servidores ...

  • ¿Existe algún proceso para gestionar las actualizaciones de los sistemas existentes, como la aplicación de parches o actualizaciones de firmware?

Esta debería ser cualquier otra respuesta que no sea (a) "No sé", o (b) "No actualizamos".

  • Digamos que un servidor se incendia. En caso de una crisis o calamidad, ¿qué plazo es aceptable como tiempo de inactividad?

Esto debería siempre Se una pregunta razonable. Si el entrevistador se agacha fuera de forma en esta pregunta, entonces no entienden la naturaleza de su trabajo, una pista vital sobre las perspectivas futuras. Si la expectativa es una operación 24/7, está bien, a menos que no tengan la infraestructura para ello, lo que significa estarás cuidando mucho las máquinas. Saber qué es y qué no es aceptable ayuda a darle la propina de sus cartas acerca de sus verdaderas expectativas.

  • Hablando de fuego, ¿tiene instalado un sistema de extinción de incendios para su equipo, y es del tipo adecuado?

Los rociadores de agua son no Una respuesta aceptable. Esta hace pasa, y tu será conseguir que las organizaciones que piensan en meter un bastidor en un armario de escobas sin ventilación y con un rociador contra incendios en lo alto son Una gran idea. Si esto se minimiza, se ignora o se encuentra con hostilidad, levántese, agradezca al entrevistador y no camines, corre ...

  • Describa su proceso de copia de seguridad de datos y el formato de almacenamiento utilizado.

Esta es otra pregunta que debe responderse con otra cosa que no sea "nosotros no" y "no tenemos medios de copia de seguridad".

  • ¿Pruebas tus copias de seguridad regularmente y con qué frecuencia?

El seguimiento de la pregunta anterior. Si no estás realizando pruebas regularmente, solo estás invitando a problemas.

  • ¿Existe un presupuesto conocido y un proceso de compra para desembolsos de capital y compras menores? ¿Me puedes explicar el proceso que usaría para comprar algo?

Si la respuesta es "nosotros (alguien más) lo compraremos cuando lo necesitemos", es una bandera roja. Significa que "no confiamos en que usted compre equipo cuando realmente lo necesite, así que haremos que otra persona lo haga". Siempre debe haber algún tipo de presupuesto.

El proceso para comprar algo debe ser lo suficientemente fácil de explicar en menos de 2 minutos. No debe implicar que más de 2 partes firmen (los números más altos indican una burocracia), y deben tener un tiempo de respuesta medido en días u horas, no en semanas (las compras críticas se retendrán si es demasiado tiempo). Siempre debe haber algún tipo de proceso.

  • ¿Tiene un plan para actualizar y reciclar hardware antiguo, y con qué frecuencia ocurre?

De hecho, he visto empresas que funcionan con minicomputadoras de 18 años que se mantienen vivas mediante contratos de soporte y muchas piezas de repuesto de un proveedor de soporte. Por supuesto, el proveedor de hardware original tiene largo desde que partió ...

Las unidades de escritorio nunca deben actualizarse más rápido que 3 años, o más lento que 5. En las empresas con presupuestos ajustados, extender una computadora de escritorio a 5 años es a veces una respuesta adecuada.

El bit en el reciclaje es una prueba para ver si tienen una actitud "desechable" hacia el hardware antiguo. Es malo en el sentido de que deberías desecharlo adecuadamente a través de un reciclador conocido, pero es bueno en el sentido de que puedes presionar a un equipo viejo en una tarea temporal en caso de que sea necesario. También le dará una idea del tamaño de su "boneyard" (la pila de hardware antiguo que se mantiene alrededor).

Preguntas relacionadas:

https://serverfault.com/questions/44638/how-often-does-tech-refresh-happen


72



Buena respuesta integral. La "actualización y reciclaje" es algo que también sería divertido pedir a los servidores; no quieres ir a una tienda donde pasas la mayor parte del tiempo cuidando de servidores antiguos, ¿verdad? - Maximus Minimus
Hay tantos puntos importantes aquí, ¿hay alguna posibilidad de que lo recorten y vuelvan a publicar como respuestas separadas para que sepamos cómo la comunidad prioriza cada elemento? - Kara Marfia
Extraño ... ¿hay un error SO que permita a los usuarios con 170 representantes realizar ediciones en una respuesta pero no tener la edición visible? serverfault.com/users/9113/joshperry hice una edición de dos líneas en la parte inferior, pero pensé que cuando alguien hacía una edición, podía ver públicamente quién era ... - Avery Payne


¿Tiene un plan de recuperación de desastres y esto incluye TI?

Seguimiento de los grandes comentarios: Si es así, ¿incluye a toda la organización y no solo a TI? ¿Incluye personal y lo pruebas regularmente?

Preguntas relacionadas:

¿Mejores prácticas o recursos para el plan de recuperación de desastres?


49



¿Y saben que DR no es solo un problema de TI? Muchos lugares piensan seriamente en DR solo en términos de TI, y no tienen planes para sus archivos en papel. - Maximus Minimus
Sí, es cierto, aunque también he visto lo contrario con demasiada frecuencia: existen excelentes planes para reubicar a la gerencia ejecutiva y a los trabajadores de negocios centrales en caso de que la oficina se vuelva inutilizable, pero ninguno en absoluto para hacer que la TI funcione, lo que ocurre cuando la sala de servidores se encuentra en la misma oficina de la que se atiende el plan de desastres, es realmente tonta ... pero nuevamente, tenían excelentes rutinas manuales para todo - Lo que les hizo manejar bien los cortes de TI más cortos. - Oskar Duveborn
La respuesta "sí, estamos completamente asegurados" no es una respuesta válida. - Joseph
¿Tiene un plan de DR e incluye personal? Como en donde estaré sentado si el edificio se quema ... - Jeffrey Hulten
¿Lo pruebas regularmente? - romandas


¿Está documentado el entorno actual?

¿Son las políticas y los procedimientos documentados y consistentes?


40



"Si fuera a contratarme mañana, y el resto de mi equipo 'ganara la lotería' (o 'muriera en un extraño accidente') en el almuerzo de mañana, ¿sería suficiente la documentación para gestionar el medio ambiente?" A.K.A. ¿Es correcta la documentación? REALMENTE correcto? -Waldo - gWaldo


¿Las prácticas contables internas evalúan el valor de los servicios que TI brinda a otros departamentos o simplemente se contabiliza como un centro de costos?

(Esta es casi la misma pregunta que la de Stick: "¿Es la TI una prioridad en su organización o es un mal necesario?", Pero se formuló de manera que posiblemente obtenga una respuesta honesta en lugar de la mentira correcta y descaradamente telegrafiada).


37



¡me gusta! un poco demasiado gerencial, pero puedo vivir con eso por ahora - Nick Kavadias
Sí. Me temo que necesita la dirección para especificar la pregunta precisa. No puede hackear un Xeon en lenguaje de máquina 68K, no puede hackear el cerebro de un gerente en inglés. - chaos


Una cosa que considero imprescindible es una máquina de prueba que tiene especificaciones de hardware idénticas a las del servidor en vivo.

"¿En qué medida los entornos de prueba coinciden con la producción?"


36



De manera similar, diría que una de las preguntas debería ser "¿Tiene sistemas de desarrollo, etapa y producción separados con un proceso de control de cambios?" - gharper
Esto debería ser parte de la prueba regular de Joel. No puedo decirle cuántas veces he implementado PROD, solo para encontrar un error que no vimos porque la región de Estrés es ¡Cuatro veces más potente! - tsilb