Tiger Analytics
Arquitecto de ML Ops

Dallas, TX, USA
Tiger Analytics es una consultora especializada en análisis avanzado. Somos el socio de confianza en análisis para varias empresas de la lista Fortune 100, ayudándolas a generar valor empresarial a partir de los datos. Nuestros consultores aportan una profunda experiencia en Ciencia de Datos, Aprendizaje Automático e Inteligencia Artificial. Nuestro valor empresarial y liderazgo han sido reconocidos por diversas firmas de investigación de mercado, incluyendo Forrester y Gartner.
Estamos buscando ingenieros de aprendizaje automático motivados y apasionados para unirse a nuestro equipo.
Descripción del puesto:
Como Ingeniero Senior de ML OPS, formará parte de un equipo de ingenieros de aprendizaje automático con experiencia que apoya, construye y habilita capacidades de machine learning en toda la organización. Trabajará estrechamente con clientes internos y equipos de infraestructura para desarrollar nuestro entorno de ciencia de datos de próxima generación, así como nuestra plataforma y productos de ML. Tendrá la oportunidad de ampliar sus conocimientos y desarrollar su experiencia en marcos modernos de aprendizaje automático, bibliotecas y tecnologías, trabajando en colaboración con interesados internos para comprender las necesidades empresariales cambiantes. Si tiene facilidad para encontrar soluciones creativas y le gusta trabajar en un entorno práctico y colaborativo, este puesto es ideal para usted.
Requisitos
Qué hará en el puesto:
Implementar sistemas escalables y confiables utilizando arquitecturas, tecnologías y plataformas basadas en la nube para gestionar inferencias de modelos a gran escala.
Desplegar y gestionar pipelines de aprendizaje automático y datos en entornos de producción.
Trabajar en soluciones de contenerización y orquestación para el despliegue de modelos.
Participar en ciclos rápidos de iteración, adaptándose a los requisitos cambiantes del proyecto.
Colaborar como parte de un equipo ágil multifuncional para crear y mejorar software que permita aplicaciones avanzadas de big data y ML.
Aplicar las mejores prácticas de CI/CD, incluyendo automatización de pruebas y monitoreo, para garantizar el despliegue exitoso de modelos de ML y código de aplicaciones.
Asegurar que todo el código esté bien gestionado para reducir vulnerabilidades, que los modelos estén adecuadamente supervisados desde una perspectiva de riesgo, y que el ML siga las mejores prácticas en IA responsable y explicable.
Colaborar con científicos de datos, ingenieros de software, ingenieros de datos y otros interesados para desarrollar e implementar mejores prácticas para MLOps, incluyendo pipelines de CI/CD, control de versiones, versionado de modelos, monitoreo, alertas y despliegue automatizado de modelos.
Gestionar y supervisar la infraestructura de aprendizaje automático, asegurando alta disponibilidad y rendimiento.
Implementar soluciones sólidas de monitoreo y registro para hacer seguimiento al rendimiento del modelo y la salud del sistema.
Monitorear el rendimiento en tiempo real de los modelos desplegados, analizar los datos de rendimiento e identificar y abordar proactivamente los problemas para garantizar un rendimiento óptimo.
Diagnosticar y resolver de manera oportuna y eficiente problemas de producción relacionados con el despliegue, rendimiento y escalabilidad de los modelos de ML.
Aplicar las mejores prácticas de seguridad en sistemas de aprendizaje automático y garantizar el cumplimiento de las regulaciones de protección y privacidad de datos.
Colaborar con ingenieros de plataformas para gestionar eficazmente los recursos de computación en la nube para el despliegue, monitoreo y optimización del rendimiento de los modelos de ML.
Desarrollar y mantener documentación, procedimientos operativos estándar y directrices relacionadas con procesos, herramientas y mejores prácticas de MLOps.
Cualificaciones básicas:
Título de maestría o doctorado en informática, ingeniería eléctrica, matemáticas o un campo similar.
Generalmente se requieren 7 o más años de experiencia práctica desarrollando e implementando soluciones avanzadas de análisis en un entorno corporativo, con al menos 4 años de experiencia programando en Python.
Al menos 3 años de experiencia diseñando y construyendo soluciones intensivas en datos utilizando computación distribuida.
Al menos 3 años de experiencia en la puesta en producción, monitoreo y mantenimiento de modelos.
Conocimientos necesarios:
Conocimiento de la plataforma Azure, como Azure Machine Learning, Azure Data Factory, Azure Databricks, Azure Kubernetes Service, Azure Monitor, etc.
Demostrada experiencia en la construcción y despliegue de soluciones de IA/aprendizaje automático a gran escala utilizando plataformas en la nube como AWS, Azure o Google Cloud Platform.
Experiencia en el desarrollo y mantenimiento de APIs (por ejemplo: REST).
Experiencia en la especificación de infraestructura e Infraestructura como Código (por ejemplo: Ansible, Terraform).
Experiencia en el diseño, desarrollo y escalado de pipelines complejos de datos y características para modelos de ML, y en la evaluación de su rendimiento.
Capacidad para trabajar en toda la pila tecnológica y moverse con facilidad entre lenguajes de programación y tecnologías de MLOps (por ejemplo: Python, Spark, Databricks, GitHub, MLFlow, Airflow).
Dominio de scripting en shell de Unix y programadores de tareas basados en dependencias.
Conocimiento de los requisitos de seguridad y cumplimiento en infraestructuras de ML.
Experiencia con tecnologías de visualización (por ejemplo: RShiny, Streamlit, Python DASH, Tableau, PowerBI).
Familiaridad con estándares, metodologías y mejores prácticas de privacidad de datos.
Beneficios
Existen significativas oportunidades de desarrollo profesional a medida que la empresa crece. El puesto ofrece una oportunidad única para formar parte de un entorno pequeño, de rápido crecimiento, desafiante y emprendedor, con un alto grado de responsabilidad individual.