Salario negociable
Qode
New York, NY, USA
Estamos buscando un Arquitecto de Infraestructura en la Nube con experiencia en AWS para liderar la arquitectura e implementación de Launch Darkly. Esta persona debe tener experiencia previa en liderar dicha implementación y su despliegue en equipos de aplicaciones a gran escala. Launch Darkly Feature Flags con lanzamientos progresivos, pruebas A/B con cero tiempo de inactividad y automatización completa. Este documento describe los requisitos integrales para socios proveedores con el fin de apoyar iniciativas orientadas a lograr cero tiempo de inactividad, reducir incidentes en producción, mejorar las métricas de tasa de fallos en cambios y permitir una automatización total. El alcance incluye flags de características, pruebas A/B, lanzamientos progresivos y soporte para patrones de despliegue en APIs, EKS, OnPrem, Lambdas y otros servicios de AWS. Alcance Funcional Despliegues con Cero Tiempo de Inactividad Implementar modelos de despliegue azul/verde o canario con conmutación de tráfico sin interrupciones, capacidad de reversión y persistencia de sesiones. Reducción de la Tasa de Fallos en Cambios Integrar seguimiento de causas raíz, reversión automatizada y canalizaciones de validación previas al despliegue. Flags de Características Permitir activación/desactivación en tiempo real, control de acceso seguro y capacidad de auditoría. Debe soportar tanto activadores del lado del servidor como del lado del cliente. Pruebas A/B y Azul/Verde Soportar segmentación de tráfico, métricas en tiempo real, reversión y cumplimiento de privacidad. Lanzamientos Progresivos Automatizar lanzamientos escalonados por región, grupo de usuarios o entorno. Incluir desencadenantes de reversión basados en métricas. Automatización y CI/CD Integración completa con GitHub Actions, ejecutores dinámicos y patrones de ruta dorada para EKS, Lambda y OnPrem. Patrones de Entorno Soporte para APIs, EKS, OnPrem, Lambdas, Kafka, Glue, RDS, S3 y otros servicios de AWS. Observabilidad y Métricas Integración con Grafana, Splunk y métricas DORA (tiempo de entrega, frecuencia de cambios, tasa de fallos, MTTR). Habilitación de Autoservicio y Soporte para Incorporación/Migración de flags de características Empoderar a los equipos con canalizaciones estilo Express Lane, acceso basado en roles y registros de auditoría. Resultados Esperados - Piloto con al menos 5 equipos para noviembre de 2025 - Necesitamos adopción empresarial lista para noviembre con al menos 5 patrones, incluyendo Cloud y OnPrem - Disponibilidad del 99,9 % o superior durante los despliegues - Reducción del 99 % o más en la tasa de fallos en cambios - Automatización completa de canalizaciones de aprovisionamiento, pruebas y despliegue - Automatización completa y gobernanza del ciclo de vida extremo a extremo de la gestión de flags de características Requisitos No Funcionales (NFR) Rendimiento Activación con baja latencia, reversión rápida Seguridad Almacenamiento seguro de artefactos, control de acceso basado en roles (RBAC), registro de auditoría y escaneo de vulnerabilidades Escalabilidad Soporte para despliegues multi-región y multi-inquilino; escalado dinámico de ejecutores Resiliencia Pruebas de caos, inyección de fallos y objetivos de tiempo de recuperación (RTO) Cumplimiento Aplicación de etiquetado, visibilidad de costos y cumplimiento de privacidad para pruebas A/B, BlueGreen y Flags