Salario negociable
Tax Analysts
Falls Church, VA, USA
Tax Analysts está buscando un Ingeniero de Confiabilidad del Sitio (SRE) para ayudar a establecer y moldear nuestra práctica de ingeniería de confiabilidad desde cero. Esta es una oportunidad única para unirse a una organización con misión y desempeñar un papel clave en garantizar la confiabilidad, escalabilidad y rendimiento de nuestras aplicaciones empresariales alojadas en AWS. Como parte de un equipo de ingeniería multifuncional, trabajará para mejorar la observabilidad, automatizar procesos operativos y liderar los esfuerzos de respuesta a incidentes y mejora continua. Este puesto es ideal para un ingeniero de nivel intermedio con experiencia en ingeniería de la nube y de software que esté deseoso de profundizar sus conocimientos en ingeniería de confiabilidad del sitio, aprender de personal experimentado y ayudar a construir una cultura de confiabilidad. FUNCIONES Y RESPONSABILIDADES ESENCIALES: Ayudar a definir e implementar indicadores de nivel de servicio (SLI) y objetivos de nivel de servicio (SLO) para aplicaciones basadas en la nube. Crear, configurar y mantener soluciones de monitoreo, alertas y paneles utilizando AWS CloudWatch, X-Ray y herramientas de terceros como DataDome. Utilizar herramientas avanzadas de observabilidad de AWS (por ejemplo, CloudWatch Synthetics, Contributor Insights) para monitorear proactivamente la salud del sistema. Contribuir al desarrollo e implementación de un proceso estructurado de soporte en llamada mientras evoluciona nuestra práctica de confiabilidad. Implementar monitoreo y mantener soluciones de protección del sitio y mitigación de bots, incluyendo DataDome, para defenderse contra ataques automatizados y asegurar la disponibilidad de la aplicación, y analizar el rendimiento durante las revisiones posteriores a incidentes. Investigar incidentes, eventos de seguridad y anomalías operativas, resolverlos, realizar análisis de causas raíz y llevar a cabo el proceso de revisión posterior a incidentes. Identificar tareas operativas repetitivas o manuales ('trabajo tedioso') y diseñar scripts o automatizaciones utilizando AWS Lambda y CloudFormation para mejorar la eficiencia y confiabilidad. Ayudar en el mantenimiento y mejora de las canalizaciones CI/CD y procesos de despliegue automatizados. Trabajar estrechamente con los equipos de desarrollo, control de calidad, nube y DevOps para garantizar que la confiabilidad, escalabilidad y seguridad se integren en los diseños de sistemas y aplicaciones. Contribuir a la documentación de sistemas, procesos, aprendizajes tras incidentes, cumplimiento y mejores prácticas de confiabilidad. Mantenerse actualizado con las tecnologías emergentes de AWS, SRE y observabilidad, y hacer recomendaciones para adoptar nuevas herramientas o enfoques que mejoren la resistencia del sistema y la excelencia operativa. Participar en la evaluación y lanzamiento de nuevos servicios y características de AWS que puedan beneficiar la confiabilidad del sistema o la eficiencia del equipo. Realizar otras tareas relacionadas según se asignen para apoyar los objetivos del equipo y de la organización. CONOCIMIENTOS Y HABILIDADES: Fuertes habilidades analíticas, de solución de problemas y resolución de problemas. Experiencia práctica con AWS CloudWatch (métricas, registros, paneles, alarmas) para monitoreo y alertas proactivos. Familiaridad con AWS X-Ray para rastreo distribuido y solución profunda de problemas en arquitecturas de microservicios. Experiencia utilizando herramientas como CloudWatch Synthetics y Contributor Insights para pruebas canarias y análisis de registros. Conocimiento de AWS CloudTrail para auditoría e investigación de llamadas a API y eventos de seguridad. Experiencia usando AWS Athena para consultas ad-hoc y análisis de registros durante investigaciones de incidentes y revisiones posteriores. Dominio de AWS CloudFormation para aprovisionamiento de infraestructura confiable y repetible. Experiencia automatizando tareas y flujos de trabajo operativos usando AWS Lambda o servicios similares basados en eventos. Comprensión de servicios de AWS como API Gateway, CloudFront y Balanceador de Carga Elástica (ELB) para garantizar disponibilidad, escalabilidad y rendimiento óptimo de sistemas distribuidos. Experiencia trabajando con soluciones de protección del sitio y mitigación de bots (como DataDome o Cloudflare). Conocimientos prácticos de lenguajes de scripting o programación como Python, Bash o Node.js para automatización y herramientas. Excelentes habilidades de comunicación y documentación; capacidad de colaborar eficazmente con equipos multifuncionales. Deseo de aprender y adoptar nuevas herramientas, tecnologías y mejores prácticas en confiabilidad y operaciones en la nube. Requisitos Título universitario en informática, ingeniería o campo relacionado; se considerará experiencia profesional equivalente. 3+ años de experiencia profesional en ingeniería en la nube, DevOps, infraestructura o roles de observabilidad (requerido AWS). Experiencia implementando principios de SRE (experiencia previa en un rol SRE es un plus). Experiencia con monitoreo, respuesta a incidentes o trabajo de confiabilidad en un entorno de producción. Experiencia trabajando en un entorno de desarrollo Ágil, colaborando dentro de equipos multifuncionales. Deseo de ayudar a establecer y mejorar las prácticas de confiabilidad del sitio mientras aprende y aplica mejores prácticas. Beneficios Seguro médico/dental/visual 401K: Vinculación inmediata Asistencia para matrícula Empleador calificado bajo el Programa de Perdón de Préstamos para el Servicio Público (PFSL) Tiempo libre remunerado generoso Oficina amigable con perros Gimnasio privado en las instalaciones Seguro médico, dental y visual Cuenta de Ahorros para la Salud (HSA) Cuenta de Gastos Flexibles (FSA) Programa de Asistencia al Empleado (EAP) Seguro de vida y accidentes Seguro de discapacidad Seguro para mascotas Asistencia para matrícula Reembolso de suscripciones a publicaciones comerciales/noticias Sala de ejercicios Días festivos pagados Vacaciones y licencia por enfermedad Licencia parental Tax Analysts es un empleador que ofrece igualdad de oportunidades laborales.