Salario negociable
Tek Spikes
Plano, TX, USA
Posición: Ingeniero Senior de Observabilidad Empresa: Tek Spikes Descripción general: Como Ingeniero Senior de Observabilidad en Tek Spikes, será responsable de liderar el desarrollo y la implementación de estrategias sólidas de observabilidad en toda nuestra infraestructura y servicios. Utilizará su experiencia para garantizar la visibilidad en tiempo real y obtener información sobre el rendimiento del sistema, permitiendo una gestión proactiva y una resolución rápida de problemas. Su función incluirá mentorar a miembros del equipo y colaborar con diversas partes interesadas para impulsar mejoras que aumenten la confiabilidad y eficiencia de nuestros sistemas. Principales responsabilidades: Diseñar e implementar marcos integrales de observabilidad, incluyendo funcionalidades de métricas, registro y rastreo en aplicaciones e infraestructura. Utilizar y gestionar herramientas de observabilidad como OpenTelemetry, Prometheus, Grafana y la pila ELK para proporcionar información útil y monitoreo del rendimiento. Liderar iniciativas para optimizar las prácticas de observabilidad, asegurando que las mejores prácticas se sigan de forma consistente en todos los equipos. Colaborar con los equipos de ingeniería de software, DevOps y seguridad para identificar indicadores clave de rendimiento y requisitos de monitoreo. Realizar análisis de rendimiento y solucionar incidentes complejos mediante el análisis de registros, métricas y trazas. Mentorar a ingenieros juniors y realizar sesiones de compartición de conocimientos sobre herramientas y prácticas de observabilidad. Investigar e introducir soluciones innovadoras de observabilidad que mejoren las capacidades de diagnóstico del sistema. Requisitos Calificaciones: - Título universitario o de maestría en Ciencias de la Computación, Ingeniería o campo relacionado. - 5 o más años de experiencia en observabilidad, monitoreo o roles en infraestructura en la nube. - Experiencia en herramientas y marcos de observabilidad como OpenTelemetry, Prometheus, Grafana o Elastic Stack. - Dominio de lenguajes de programación o scripting como Python, Go o Java. - Amplia experiencia con plataformas en la nube (AWS, Azure, GCP), incluyendo sus respectivas soluciones de monitoreo. - Excelentes habilidades para resolver problemas, con capacidad de analizar sistemas complejos y derivar información útil. - Excelentes habilidades de comunicación y colaboración, demostrando la capacidad de trabajar eficazmente en un entorno orientado al trabajo en equipo.