Inicio / SRE: Cinco recomendaciones para los Ingenieros de Confiabilidad de Sitios y sus equipos

SRE: Cinco recomendaciones para los Ingenieros de Confiabilidad de Sitios y sus equipos

Por: Maricela Ochoa | junio 22, 2018


La ingeniería de confiabilidad de sitios (SRE, por sus siglas en inglés) es una disciplina que incorpora aspectos de ingeniería de software y los aplica a problemas de operación IT. Aunque lo cierto es que la definición y sus funciones siempre se traslapan con los roles de, por ejemplo, el sysadmin o el mismo ingeniero de DevOps (otro rol bastante difícil de encasillar).

Pero el aumento en el tamaño de las operaciones y la reciente popularización del web-scale IT está haciendo este rol cada vez más necesario en las empresas. Hay que recordar que el SRE surgió hace algunos añosen Google, como una pieza clave para alcanzar la meta del gigante de internet de organizar las grandes cantidades de información que maneja, y se planteó como una metodología para que un ingeniero controle el proceso de llevar a producción las aplicaciones de la empresa.

¿Cómo aproximarse a este rol y qué deben tener presente, tanto quienes lo ejerzan como quienes estén a la búsqueda de uno para sus equipos? El sitio InformationWeek recopiló algunos consejos que Rob Hirschfeld, CEO de Rack’N, entregó durante la conferencia Interop ITX sobre el complejo mundo del SRE:

  1. Pago equitativo

Hirschfeld dijo que si bien el pago se percibe como indicador para mostrar el nivel de respeto que tiene cada rol dentro de una organización, el hecho de que ese pago sea equitativo puede crear un campo de batalla entre los miembros del equipo (por ejemplo, entre los operadores/SRE y los desarrolladores) cuando el grupo percibe que su trabajo podría ser más valorado y respetado en la empresa.

En un reporte de la firma Catchpoint, se encuestó a 400 SRE acerca de si su equipo de trabajo tenía el respeto que consideraban adecuado en su compañía. Las respuestas variaron por industria: 36% de los SRE que trabajan en el sector de servicios financieros dijeron sentirse respetados, mientras que en la de medios y entretenimiento fueron 52%; en la de ecommerce y retail, 69% y en la de software como servicio (SaaS), 73%.

Para Hirschfeld, la manera más sencilla de que haya un estatus y una situación de equidad es establecer un rango de pagos. El ejecutivo ejemplificó que antes de que existiera la función del SRE, los operadores de Google recibían un pago inferior a los desarrolladores, “lo que los colocaba como una especie de ciudadanos de segunda clase, por lo que se requiere que los líderes de IT establezcan un pago similar”.

  1. Los SRE no pueden ignorar la infraestructura

En un mundo IT sin servidores ni contenedores, es posible que la gente se pregunte ¿para qué el hardware? Pero, los SRE no pueden darse el lujo de pensar que la infraestructura no existe.

“El costo de los desarrolladores haciendo abstracciones de mejora de rendimiento es ahora una carga sobre los hombros de los SRE”, señaló el ejecutivo.

Según el citado reporte de Catchpoint, 65% de los SRE interactúa a diario con infraestructura total o parcialmente en la nube, donde ejecutan código. Por ello, Hirschfeld dijo que es muy importante que se tenga presente la infraestructura con la que se trabaja como parte de la responsabilidad de los SRE: “Puede ser que a futuro no tengas servidores, pero aún hay que considerarlos desde una perspectiva de entrega de productos”.

  1. Las herramientas cuentan

Los SRE confían en las herramientas. Según el reporte de Catchpoint, las más utilizadas son las de selección y disponibilidad, pero depende del presupuesto con el que cuenten cuáles van a utilizar.

52% de los SRE de empresas con menos de 1,000 empleados consideran que tienen acceso a un amplio rango de herramientas, en contraste con 75% de los SRE de empresas de más de 1,000 empleados.
Considerar que se tiene un número limitado de herramientas incita a usar la mitad del tiempo en cuestiones operativas y la otra mitad en crear código, esto puede tentarlos a empezar a construir sus herramientas desde cero.

Aquí, Hirschfeld recomendó evitar que los equipos tengan que construir todo por sí mismos, porque eso aumentaría la complejidad de los ambientes IT (cloud híbrida o multi-cloud) y acabarían haciendo más de lo que deben a nivel técnico, dedicando a ello recursos innecesarios.

“Quieres dedicar 50% de tu tiempo a mejorar la forma en que trabaja el negocio y 50% a la operación del mismo, si dedicas mucho tiempo a programar software, probablemente estés malgastando recursos”, señaló el directivo.

  1. Menos disrupción

En este tema, Hirschfeld lanzó la pregunta acerca de cuándo fue la última vez que se sintieron ansiosos porque no tenían la tecnología más reciente en su campo. ¿A cada momento? Entonces, advirtió sobre la compulsión de la industria por implementar la última tecnología. Hay que tener menos elementos disruptivos y enfocarse en lo que más ayuda realmente al negocio

  1. Establecer métricas

Según el reporte de Catchpoint, la mayoría de los SRE consideran que su trabajo contribuye directamente a los objetivos de negocio de su compañía.

“Cuando se preguntó acerca de las métricas usadas para medir el éxito a nivel individual, por equipos de trabajo y de toda la organización, 30% dijo que las ventas son las que muestran si se alcanzan los objetivos de negocio. Otras formas que reflejan la alineación con la organización citadas fueron la retención, costo y adopción de usuarios”, señala el reporte.

Para Hirschfeld, “las métricas representan una parte de la confiabilidad del ambiente, si no cuantificas tus resultados, no estás cumpliendo con la labor que deberías hacer”, afirmó.

La importancia del SRE

En opinión de Hirschfeld, “la confiabilidad tiene que ver con el hecho de que mejoras el ciclo de producción sin causar una disrupción. En otras palabras, tendencia hacia la invisibilidad”.

Según el ejecutivo, cuando no se recolectan datos para establecer qué cambios se han logrado y qué efecto han tenido, se pierde el tiempo, pues no se muestra el valor de la labor realizada: “Si no demuestras lo efectivo que eres, tu empleo está destinado a desaparecer”.

Por último, consideró que medir el rendimiento de los datos puede ayudar a resolver problemas futuros. En su concepción, la mentalidad del SRE debe aportar información al equipo de desarrollo acerca de lo que hay que mejorar, porque “es mucho más que un socio entre los equipos con pensamiento tradicional”.


Comentarios

Deja un comentario

SUSCRÍBASE A NUESTRA NEWSLETTER

Obtenga acceso a información exclusiva, reportajes, notas de actualidad y el análisis de las tendencias con el mayor rigor periodístico.

Únase hoy a IT MASTERS MAG, puede Registrarse o Iniciar sesión

Para accender a este y más contenido es necesario registrarse o acceder a su cuenta.