Skip to main content

Command Palette

Search for a command to run...

Sysadmin Horror Story 💀

¡Feliz Halloween! 🎃

Updated
6 min read
Sysadmin Horror Story 💀

Hace años, estas historias nacieron de la pluma de un sysadmin tratando de adaptar ciertas piezas clásicas de la literatura para asustar a novatos y honrar a veteranos. Hoy, las he desempolvado, traducido y actualizado. Porque los fantasmas de un centro de datos no usan sábanas; usan exit(1) y dejan vacíos tus logs.

Aquí están los tres fantasmas que acechan en cada datacenter, esperando para atormentar al administrador desprevenido:


1. El Espectro del Rollback Inválido (Adaptación de The Pit and the Pendulum)

En un datacenter conocido por su frialdad (cuyo nombre no quiero recordar), en una fría noche de octubre, la pesadilla de todo SysAdmin se hizo realidad: un cluster de producción se derrumbó debido a un error crítico en la base de datos principal de la aplicación.

El SRE senior me pidió, a mí, el administrador novato, que ejecutara el rollback de la base de datos a su último estado estable y restaurarla en un nuevo pod para reactivar el servicio. Siguiendo la documentación de procedimientos, lancé el script automatizado.

El proceso terminó. El nuevo pod se levantó... pero la base de datos estaba corrupta.

Sin preocuparme demasiado, recordé que había otros archivos de backup completos en el almacenamiento S3. Probé uno por uno, una y otra vez. El resultado no cambiaba. El error de corrupción me miraba fijamente en la terminal, imperturbable.

Con un pánico frío que me recorría la espalda, le pregunté al SRE senior qué hacer para exorcizar ese comportamiento.

"¿Recuerdas cuando te mostré, hace unos días, cómo se ejecutaba el script de backup completo?" me respondió el senior, con una calma aterradora. "¿Algo sobre lo vital que era validar la integridad del backup con una simulación de restore en un entorno de pruebas?"

"¡Por supuesto! Me dijiste que debía quedarme un par de horas extra para realizar esa tarea," contesté.

"¡Exacto! Pero preferiste irte temprano sin terminar la validación," sentenció.

"¡Dios mío! ¡Pensé que era opcional!" exclamé.

"Lo era, lo era...", dijo él. Y el servicio siguió caído hasta el amanecer.


La Lección de la Cripta: No importa cuán sofisticada sea tu solución de respaldo (snapshots, S3, multi-region, etc.); el fantasma de la restauración fallida siempre aparecerá si no tienes la disciplina sagrada de validar de forma rutinaria y automática que el backup es restorable. Es mejor automatizar la validación que rezar.


2. La Terminal de la Oscuridad (Adaptación de The Raven de Edgar Allan Poe)

Una noche de guardia, absorto estaba, solitario y cansado, Mirando el panel de control de un viejo monolito. Dando clics al azar en la interfaz gráfica, casi dormitando, cuando de repente llegó un beep Desde un servidor, sonando suavemente, sonando en mi Slack.

"Es solo un warning," murmuré, "sonando en mi Slack... Solo esto y nada más."

Pronto volví a oír un beep algo más fuerte que el anterior. Abriendo Slack con gran desdén, Llegó el mensaje del host de antaño: "La aplicación legada, caída, no responde," y nada más.

Había muchas historias de ese servidor. Increíblemente, casi aterrado, Bajé al datacenter a revisarlo. Me senté a adivinar, ¿cuál sería el KVM para reiniciarlo Sin acceso SSH, con la tarjeta de red fallando y sin monitor conectado?

"El iDRAC tiene problemas"—pensé—"solo esto y nada más."

Entonces, pensando, "En otro rack, vi un servidor similar con un KVM que funcionaba, Tomaré prestado su monitor y teclado, nada malo pasará."

De repente, al desenchufar el KVM, ese servidor también se apagó, y mi Slack volvió a sonar: "¡Ahora son dos! La aplicación legada y su vecino, ¡ambos caídos!," y nada más.

Desconcertado, me senté a llamar a mi mentor SysAdmin: "Quise usar la consola de otro servidor, ¡y ahora ambos están fuera!"

"¿Seguiste mi consejo? No uses la interfaz gráfica ni el KVM si puedes evitarlo. La terminal, siempre la terminal, es mejor."

Por supuesto, recuerdo, era diciembre pasado; Sentí miedo, un horror que nunca había sentido antes; "Es una herramienta del pasado," pensé, "y nada más."

Con gran vergüenza entendí mi error: "Maestro," dije, "en verdad, tu perdón imploro; pero el hecho es que pensé que la GUI era moderna y suficiente. Una interfaz de usuario... y nada más."

"Apréndelo bien, pequeño," me dijo. "En la terminal puedes confiar, es tu amiga y mucho, mucho más. No hay KVM que te falle si dominas la línea de comandos remota (kubectl, ssh, podman run)."


La Lección de la Cripta: La fluidez en la línea de comandos es una habilidad que las nuevas generaciones a menudo abandonan por las cómodas GUI. Pero es el dominio del terminal lo que te da flexibilidad, resiliencia y la capacidad de operar cuando todo lo demás —incluyendo la red o el acceso gráfico— ha fallado. La Terminal es Eterna.


3. El Monstruo del Puente (Adaptación de Troll Bridge de Neil Gaiman)

Yo era un SysAdmin con cuatro años de experiencia cuando mi mentor, un tipo que se burlaba de los novatos con sus sistemas operativos comunitarios, fue desvinculado de la empresa. Me asignaron su cubículo: un pequeño espacio bajo las escaleras de acceso al datacenter. Lo llamaban "El Puente del Troll". También me asignaron sus servidores legados.

Al revisar estos servidores, me di cuenta de que la mayoría tenían scripts en bash que hacían prácticamente todo. Comencé a usar sus métodos, adaptándolos para automatizar mis propios servidores. Mis tareas se hicieron eficientes, dejando un montón de tiempo libre. Mi día pronto se convirtió en navegar por Internet, ver videos divertidos y participar en foros de tecnología no relacionados.

Pasaron un par de años, y mantuve mi trabajo de la misma forma. Cada nuevo servidor o microservicio que llegaba, lo "trollificaba" con scripts antiguos para liberarme y seguir en mis foros. Un día, al compartir uno de mis scripts de aprovisionamiento, un nuevo administrador me dijo que podría simplificarlo drásticamente usando Python y Terraform para infraestructura como código (IaC), lenguajes que se estaban volviendo la nueva tendencia.

"Yo soy un SysAdmin, no un desarrollador," le respondí con desdén. "Yo mantengo las máquinas. El código es de otros."

Desde ese día, me dediqué a ridiculizar a los chicos que me decían que debía programar en los nuevos lenguajes.

"No sabes nada, novato," les respondía, "este trabajo nunca cambiará. El bash es eterno."

Unos años más tarde, mis responsabilidades aumentaron, y mi gerente me pidió modificar el IaC de las aplicaciones en mis servidores. Me pidió, esencialmente, ser un SRE.

"De eso se trata el trabajo ahora," me dijo mi gerente. "Desarrollo y Operaciones (DevOps) se están uniendo. Si no estás dispuesto a aprender Python, Ansible o Terraform para automatizar la infraestructura, traeremos a alguien que sí lo esté."

"Nunca lo haré, no es mi rol," dije.

"Pues bien..." dijo, mirándome con dureza.

He estado aquí desde entonces. Escondido. Esperando. Bajo mi puente.

Observo desde las sombras cómo pasa la gente: subiendo las escaleras, murmurando sobre pipelines de CI/CD, o hablando sobre lo que hacen las nuevas aplicaciones en el cluster. A veces, se detienen bajo mi puente para charlar, compartir código, o hacer planes. Y yo los observo, pero ellos no me ven.

Solo me quedaré aquí, en la oscuridad bajo el puente. Puedo oírlos a todos ustedes, todo lo que dicen sobre sus pods y commits.

Oh sí, puedo oírlos.

Pero no voy a salir.


La Lección de la Cripta: "El SysAdmin perezoso es el mejor SysAdmin" es una frase que solo es cierta si usas el tiempo libre de la automatización para reinventarte. Si usas ese tiempo solo para ser complaciente, caerás en la obsolescencia y te convertirás en el monstruo que habita bajo el puente: irrelevante y olvidado. Los mejores SysAdmins/SREs investigan, aprenden Python, Go, IaC y están siempre un paso adelante.


Conclusión Final: Recuerda: ¡En este Halloween 🎃, el peor terror no es la caída del servidor, sino la caída en la irrelevancia! ¡Felices sustos y un sistema estable! 💀