Tiger Analytics
Arquitecto de ML Ops

Dallas, TX, USA
Tiger Analytics es una firma de consultoría de análisis avanzado. Somos el socio de análisis de confianza para varias empresas de la lista Fortune 100, permitiéndoles generar valor empresarial a partir de los datos. Nuestros consultores aportan una profunda experiencia en Ciencia de Datos, Aprendizaje Automático e Inteligencia Artificial. Nuestro valor empresarial y liderazgo han sido reconocidos por diversas firmas de investigación de mercado, incluyendo Forrester y Gartner.
Estamos buscando ingenieros de aprendizaje automático motivados y apasionados para nuestro equipo.
Descripción del puesto:
Como Ingeniero Senior de ML OPS, se unirá a un equipo de ingenieros de aprendizaje automático experimentados que apoyan, construyen y habilitan capacidades de máquina en toda la organización. Trabajará estrechamente con clientes internos y equipos de infraestructura para construir nuestro banco de trabajo de ciencia de datos de próxima generación y la plataforma y productos de ML. Podrá ampliar aún más sus conocimientos y desarrollar su experiencia en marcos modernos de aprendizaje automático, bibliotecas y tecnologías, trabajando estrechamente con partes interesadas internas para comprender las necesidades empresariales cambiantes. Si tiene facilidad para encontrar soluciones creativas y disfruta trabajar en un entorno práctico y colaborativo, este puesto es ideal para usted.
Requisitos
Lo que hará en el puesto:
Implementar sistemas escalables y confiables aprovechando arquitecturas, tecnologías y plataformas basadas en la nube para manejar inferencias de modelos a gran escala.
Desplegar y gestionar tuberías de aprendizaje automático y datos en entornos de producción.
Trabajar en soluciones de contenerización y orquestación para el despliegue de modelos.
Participar en ciclos de iteración rápida, adaptándose a requisitos de proyectos cambiantes.
Colaborar como parte de un equipo ágil multifuncional para crear y mejorar software que permita aplicaciones de vanguardia de big data y ML.
Aprovechar las mejores prácticas de CI/CD, incluyendo automatización de pruebas y monitoreo, para garantizar el despliegue exitoso de modelos de ML y código de aplicaciones.
Asegurar que todo el código esté bien gestionado para reducir vulnerabilidades, que los modelos estén adecuadamente regulados desde una perspectiva de riesgo, y que el ML siga las mejores prácticas en IA Responsable y Explicable.
Colaborar con científicos de datos, ingenieros de software, ingenieros de datos y otras partes interesadas para desarrollar e implementar mejores prácticas para MLOps, incluyendo tuberías de CI/CD, control de versiones, versionado de modelos, monitoreo, alertas y despliegue automatizado de modelos.
Gestionar y monitorear la infraestructura de aprendizaje automático, asegurando alta disponibilidad y rendimiento.
Implementar soluciones robustas de monitoreo y registro para hacer seguimiento al rendimiento del modelo y la salud del sistema.
Monitorear el rendimiento en tiempo real de los modelos desplegados, analizar los datos de rendimiento e identificar y abordar proactivamente problemas de rendimiento para garantizar un funcionamiento óptimo del modelo.
Diagnosticar y resolver de manera oportuna y eficiente problemas de producción relacionados con el despliegue, rendimiento y escalabilidad de modelos de ML.
Implementar las mejores prácticas de seguridad para sistemas de aprendizaje automático y asegurar el cumplimiento con las regulaciones de protección y privacidad de datos.
Colaborar con ingenieros de plataformas para gestionar eficazmente los recursos de computación en la nube para el despliegue, monitoreo y optimización del rendimiento de modelos de ML.
Desarrollar y mantener documentación, procedimientos operativos estándar y directrices relacionadas con procesos, herramientas y mejores prácticas de MLOps.
Calificaciones básicas:
Título de maestría o doctorado en informática, ingeniería eléctrica, matemáticas o un campo similar.
Generalmente requiere 7 o más años de experiencia práctica desarrollando y aplicando soluciones avanzadas de análisis en un entorno corporativo, con al menos 4 años de experiencia programando en Python.
Al menos 3 años de experiencia diseñando y construyendo soluciones intensivas en datos utilizando computación distribuida.
Al menos 3 años de experiencia en la puesta en producción, monitoreo y mantenimiento de modelos.
Habilidades obligatorias:
Conocimiento de la plataforma Azure, como Azure Machine Learning, Azure Data Factory, Azure Databricks, Azure Kubernetes Service, Azure Monitor, etc.
Demostrada experiencia en la construcción e implementación de soluciones de IA/Aprendizaje Automático a gran escala aprovechando la nube, como AWS, Azure o Google Cloud Platform.
Experiencia en el desarrollo y mantenimiento de APIs (por ejemplo: REST).
Experiencia especificando infraestructura e Infraestructura como Código (por ejemplo: Ansible, Terraform).
Experiencia en el diseño, desarrollo y escalado de tuberías complejas de datos y características que alimentan modelos de ML y evaluación de su rendimiento.
Capacidad para trabajar en toda la pila y moverse fluidamente entre lenguajes de programación y tecnologías de MLOps (por ejemplo: Python, Spark, DataBricks, Github, MLFlow, Airflow).
Dominio de scripts de Unix Shell y programadores de trabajos basados en dependencias.
Comprensión de los requisitos de seguridad y cumplimiento en la infraestructura de ML.
Experiencia con tecnologías de visualización (por ejemplo: RShiny, Streamlit, Python DASH, Tableau, PowerBI).
Conocimiento de estándares, metodologías y mejores prácticas de privacidad de datos.
Beneficios
Existen significativas oportunidades de desarrollo profesional a medida que la empresa crece. El puesto ofrece una oportunidad única de formar parte de un entorno pequeño, de rápido crecimiento, desafiante y emprendedor, con un alto grado de responsabilidad individual.
Salario negociable