Salario negociable
Tek Spikes
Plano, TX, USA
Responsabilidades: Estamos buscando un Ingeniero de ML en la Nube AWS para diseñar, implementar y optimizar sistemas de aprendizaje automático nativos de la nube que impulsen nuestra plataforma de automatización predictiva de próxima generación. Combinarás una profunda experiencia en ML con ingeniería práctica en AWS, transformando datos en conocimientos de baja latencia y alto impacto. El candidato ideal domina estadísticas, programación y DevOps, y se desempeña excelentemente al entregar soluciones seguras y eficientes en costos a gran escala. Objetivos de este puesto: Diseñar y poner en producción pipelines de ML en la nube (SageMaker, Step Functions, EKS) que impulsen la hoja de ruta de automatización predictiva Integrar modelos fundamentales mediante APIs de Bedrock y LLM de Anthropic para habilitar capacidades de IA generativa Optimizar y extender bibliotecas / frameworks de ML existentes para cargas de trabajo multi-región y multi-inquilino Colaborar transversalmente con científicos de datos, ingenieros de datos, arquitectos y equipos de seguridad para entregar valor de extremo a extremo Detectar y mitigar la deriva en la distribución de datos para preservar la precisión del modelo en tráfico real Mantenerse actualizado sobre innovaciones en AWS, MLOps e IA generativa; impulsar la mejora continua Responsabilidades: Transformar prototipos de ciencia de datos en servicios seguros y altamente disponibles en AWS; seleccionar y ajustar los algoritmos, imágenes de contenedores y tipos de instancias adecuados Ejecutar pruebas/experimentos automatizados de ML; documentar métricas, costos y resultados de latencia Entrenar, reentrenar y monitorear modelos con SageMaker Pipelines, Model Registry y alarmas de CloudWatch Crear y mantener pipelines de datos optimizados (Glue, Kinesis, Athena, Iceberg) para inferencia online/offline Colaborar con gerentes de producto para refinar objetivos y criterios de éxito de ML; presentar resultados a partes interesadas ejecutivas Extender o contribuir a bibliotecas internas de ML, SDKs y módulos de infraestructura como código (CDK / Terraform) Habilidades y calificaciones: Habilidades técnicas principales: SDK de AWS, SageMaker, Lambda, Step Functions Teoría y práctica de aprendizaje automático (aprendizaje supervisado / aprendizaje profundo) DevOps y CI/CD (Docker, GitHub Actions, Terraform/CDK) Seguridad en la nube (IAM, KMS, VPC, GuardDuty) Fundamentos de redes Java, Springboot, JavaScript/TypeScript y diseño de API (REST, GraphQL) Administración de Linux y scripting Integración de Bedrock y LLM de Anthropic Habilidades secundarias / herramientas: Depuración y perfilado avanzado Estrategias de gestión de nube híbrida Migración de datos a gran escala Excepcional capacidad analítica y resolución de problemas; sólido dominio de probabilidad, estadística y algoritmos Conocimiento de frameworks modernos de ML (PyTorch, TensorFlow, Keras) Comprensión sólida de estructuras de datos, modelado y arquitectura de software Excelentes habilidades de gestión del tiempo, organización y documentación Mentalidad de crecimiento y pasión por el aprendizaje continuo Calificaciones preferidas: Más de 10 años de experiencia en desarrollo de software Más de 3 años en un rol de ingeniería de ML o ML en la nube (enfocado en AWS) Dominio de Python (principal), con conocimientos prácticos de Java o R Excelentes habilidades de comunicación y colaboración; capacidad para explicar temas complejos a colegas no técnicos Trayectoria comprobada de entrega de sistemas de ML en producción o contribución a proyectos de código abierto de ML Título universitario (o superior) en Ciencias de la Computación, Ingeniería de Datos, Matemáticas o campo relacionado Certificación AWS Certified Machine Learning – Specialty y/o AWS Solutions Architect – Associate son altamente valoradas