Por algo será que me llevo regular con mi ex y actual cuñado.
No hay parches que aplicar. -> Y los aplicas en PRO directamente sin saber si funcionan bien, Twitter no cuenta con entornos de DES y PRE? Y cuanto tardas en aplicar un parche? -> Si se parece remotamente a las empresas en las que este cuñado ha trabajado, primero que hay al menos dos entornos entres DES/DEV y PROD (llámalos SIT, UAT, PRE, TE1/2), y segundo hay procesos de testing, sea manual, sea automatizado, sea una mezcla, que unido al proceso interno de control y protocolado hacen que no subas una cosa en un par de horas ni días (salvo que hablemos de un show stopper en prod). Cuánta peña hace falta ahí? En las empresas donde yo, boniatos incluidos, te vas a 10 involucrados para cualquier cosita sin problema.
Ni componentes de software que llegan a su fin de vida. -> Lo mismo de antes, que digo yo que los probaran en los entornos previos o cuando caduca la ultima versión de RedHat lo migran en Producción? -> Y cuántos componentes distintos tienes? Digo, si con 50 ingenieros vas sobrado...
No hay certificados que caduquen -> Cuanto tardas en generar un certificado nuevo? y en colocarlo en la ruta donde estaba el antiguo???? No se, después de pagar ese dinero tendrá un Rundeck por malo que sea digo yo... -> Sí, 50 ingenieros saben todos los certificados que hay, cuándo caducan, dónde generarlos, cual es la ruta... porque está todo bien documentado o es 100% intuitivo. Nunca hay outages
porque a alguien se le olvida cambiar un certificado.
ni hardware que en algún momento haya que reemplazar. ->Remplazar HW, en la nube? Con un 99,9% de disponibilidad??? Pues ya seria mala suerte que se cambiara en todos los servidores la misma pieza a la vez, no? -> Ah, si tiene todo en la nube no puede fallar nada.
No hay API que cambiar. -> Aquí no opino
Balanceo de cargas que ajustar. -> Que balanceo de cargas no se ajusta solo? Si me dices crearlo, montarlo, asignarle los HC, determinar puertos y demás pues todavía puedo entender algo y eso que en Azure se hace en cosa de minutos pero ajustar uno ya creado, no lo entiendo. -> En Azure en unos minutos configuras todo para que el sistema se redimensione dinámicamente? Con qué velocidad?
Porque si no hay nadie que tome en cuenta eventos como, no sé, una guerra, un atentado, una copa mundial, unas elecciones que pueda hacer variar notablemente tu tráfico o tienes un sistema sobredimensionado "por si las moscas" o vas a tener cortes de servicio... salvo que este, repito, sea capaz de adaptarse en minutos al tráfico (o lo prevea alguien).
No hay que solventar bugs, -> Aquí es donde más tiempo se puede llevar, cierto pero damos por hecho que la versión en uso ya ha pasado por estas correcciones. -> Pienso en el backlog de bugs abiertos de cualquier sistema medianamente complejo con el que haya trabajado y sé que NUNCA, jamás tuvimos 0 bugs. Cierto que algunos tras 6 meses los cierras porque ya tira el viejo "not a bug, it's a feature" y la peña no se ha quejado, o porque vas a hacer cambios igual... pero bugs = desarrollo, integración, regresión...
y si además tienes a gente tirando de cables ("el 80% de los microservicios sobran") te van a salir más y más.
no hay que asegurar procesos de limpieza de memoria -> Mal vamos si la versión en curso tiene problemas con el garbage colector o la JVM va camino de un OOM, esto se revisa en PRE y en PRO ya se re escalan los recursos necesarios. -> aún tengo que ver un sistema donde las dimensiones y el uso de PRE como le llamas se asemejen siquiera a Prod. Si tienes los datos, no tienes el tráfico. Si simulas el tráfico, lo más seguro es que ignores factores (como proveedores ISP, firewalls, geoubicación, los chinos haciendo denial of service attack)
Ni hablo de i
mprevistos como Log4j donde de golpe toca dejar todo lo demás y analizar dónde te ves afectado y cómo lo resuelves antes que te toque.
Que si tienes un sistema donde no vas a tener cambios de funcionalidad (como los propone Musk) y super estable lo vas a poder mantener a flote durante un tiempo con un equipo esqueleto? Sí. Pero con 50 personas no atiendes a tus clientes (esos de los a
nuncios que te generan el 90% de los ingresos), ni desarrollas cosas nuevas desde luego... o sí pero las subes a Prod y a los 2 días las vuelves a quitar, como ha pasado con el sistema "paga 8 $ para pretender no ser un bot"