Tax Analysts
Ingeniero de Confiabilidad del Sitio

Falls Church, VA, USA
Tax Analysts busca un Ingeniero de Confiabilidad del Sitio (SRE) para ayudar a establecer y moldear nuestra práctica de ingeniería de confiabilidad desde cero. Esta es una oportunidad única para unirse a una organización orientada a una misión y desempeñar un papel clave en garantizar la confiabilidad, escalabilidad y rendimiento de nuestras aplicaciones empresariales alojadas en AWS.
Como parte de un equipo de ingeniería multifuncional, trabajarás para mejorar la observabilidad, automatizar procesos operativos y liderar la respuesta a incidentes y los esfuerzos de mejora continua. Este puesto es ideal para un ingeniero de nivel intermedio con experiencia en ingeniería en la nube e ingeniería de software que esté interesado en profundizar sus conocimientos en ingeniería de confiabilidad del sitio, aprender de personal senior y ayudar a construir una cultura de confiabilidad.
FUNCIONES Y RESPONSABILIDADES ESENCIALES:
Ayudar a definir e implementar indicadores de nivel de servicio (SLI) y objetivos de nivel de servicio (SLO) para aplicaciones basadas en la nube.
Crear, configurar y mantener soluciones de monitoreo, alertas y paneles utilizando AWS CloudWatch, X-Ray y herramientas de terceros como DataDome.
Utilizar herramientas avanzadas de observabilidad de AWS (por ejemplo, CloudWatch Synthetics, Contributor Insights) para monitorear proactivamente la salud del sistema.
Contribuir al desarrollo e implementación de un proceso estructurado de soporte en turno rotativo a medida que evoluciona nuestra práctica de confiabilidad.
Implementar monitoreo y mantener soluciones de protección del sitio y mitigación de bots, incluyendo DataDome, para defenderse contra ataques automatizados y garantizar la disponibilidad de la aplicación, así como analizar el rendimiento durante las revisiones posteriores a incidentes.
Investigar incidentes, eventos de seguridad y anomalías operativas, resolverlos, realizar análisis de causas raíz y llevar a cabo el proceso de revisión posterior al incidente.
Identificar tareas operativas repetitivas o manuales ("trabajo tedioso") y diseñar scripts o automatizaciones usando AWS Lambda y CloudFormation para mejorar la eficiencia y confiabilidad.
Ayudar en el mantenimiento y mejora de las canalizaciones CI/CD y procesos de despliegue automatizados.
Trabajar estrechamente con los equipos de desarrollo, control de calidad, nube y DevOps para garantizar que la confiabilidad, escalabilidad y seguridad se integren en los diseños de sistemas y aplicaciones.
Contribuir a la documentación de sistemas, procesos, aprendizajes tras incidentes, cumplimiento y mejores prácticas de confiabilidad.
Mantenerse actualizado con las tecnologías emergentes de AWS, SRE y observabilidad, y hacer recomendaciones para adoptar nuevas herramientas o enfoques que mejoren la resiliencia del sistema y la excelencia operativa.
Participar en la evaluación y despliegue de nuevos servicios y funciones de AWS que puedan beneficiar la confiabilidad del sistema o la eficiencia del equipo.
Realizar otras funciones relacionadas según se asignen para apoyar los objetivos del equipo y de la organización.
CONOCIMIENTOS Y HABILIDADES:
Capacidad analítica, de solución de problemas y resolución de errores sólidas.
Experiencia práctica con AWS CloudWatch (métricas, registros, paneles, alarmas) para monitoreo y alertas proactivas.
Familiaridad con AWS X-Ray para rastreo distribuido y solución profunda de problemas en arquitecturas de microservicios.
Experiencia en el uso de herramientas como CloudWatch Synthetics y Contributor Insights para pruebas canarias y análisis de registros.
Conocimiento de AWS CloudTrail para auditoría e investigación de llamadas a API y eventos de seguridad.
Experiencia en el uso de AWS Athena para consultas ad-hoc y análisis de registros durante investigaciones de incidentes y revisiones posteriores.
Dominio de AWS CloudFormation para el aprovisionamiento confiable y repetible de infraestructura.
Experiencia en la automatización de tareas y flujos de trabajo operativos utilizando AWS Lambda o servicios similares basados en eventos.
Comprensión de servicios de AWS como API Gateway, CloudFront y Balanceador de Carga Elástica (ELB) para garantizar disponibilidad, escalabilidad y rendimiento óptimo de sistemas distribuidos.
Experiencia trabajando con soluciones de protección del sitio y mitigación de bots (como DataDome o Cloudflare).
Conocimientos prácticos de lenguajes de scripting o programación como Python, Bash o Node.js para automatización y herramientas.
Excelentes habilidades de comunicación y documentación; capacidad para colaborar eficazmente con equipos multifuncionales.
Deseo de aprender y adoptar nuevas herramientas, tecnologías y mejores prácticas en confiabilidad y operaciones en la nube.
REQUISITOS
Título universitario en informática, ingeniería o campo relacionado; se considerará experiencia profesional equivalente.
3 o más años de experiencia profesional en roles de ingeniería en la nube, DevOps, infraestructura u observabilidad (requiere AWS).
Experiencia implementando principios de SRE (experiencia previa en un rol SRE es un plus).
Experiencia en monitoreo, respuesta a incidentes o trabajo de confiabilidad en un entorno de producción.
Experiencia trabajando en un entorno de desarrollo ágil, colaborando dentro de equipos multifuncionales.
Deseo de ayudar a establecer y mejorar las prácticas de confiabilidad del sitio mientras se aprenden y aplican las mejores prácticas.
BENEFICIOS
Seguro médico, dental y de visión
401K: Vinculación inmediata
Asistencia para matrícula
Empleador calificado bajo el programa de Perdón de Préstamos para Servicio Público (PFSL)
Tiempo libre remunerado generoso
Oficina amigable con mascotas
Gimnasio privado en las instalaciones
Seguro médico, dental y de visión
Cuenta de ahorro para salud (HSA)
Cuenta de gastos flexibles (FSA)
Programa de asistencia al empleado (EAP)
Seguro de vida y de desgravamen
Seguro de discapacidad
Seguro para mascotas
Asistencia para matrícula
Reembolso de suscripciones a publicaciones profesionales/noticias
Sala de ejercicios
Feriados pagados
Vacaciones y licencia por enfermedad
Licencia parental
Tax Analysts es un empleador que ofrece igualdad de oportunidades laborales.
Salario negociable