Tiger Analytics
Dallas, TX, USA
Tiger Analytics es una consultora especializada en análisis avanzado. Somos el socio de confianza en análisis para varias empresas de la lista Fortune 100, ayudándolas a generar valor empresarial a partir de los datos. Nuestros consultores aportan una profunda experiencia en Ciencia de Datos, Aprendizaje Automático e Inteligencia Artificial. Nuestro valor empresarial y liderazgo han sido reconocidos por diversas firmas de investigación de mercado, incluyendo Forrester y Gartner. Estamos buscando ingenieros de aprendizaje automático motivados y apasionados para unirse a nuestro equipo. Descripción del puesto: Como Ingeniero Senior de ML OPS, formará parte de un equipo de ingenieros de aprendizaje automático con experiencia que apoya, construye y habilita capacidades de machine learning en toda la organización. Trabajará estrechamente con clientes internos y equipos de infraestructura para desarrollar nuestro entorno de ciencia de datos de próxima generación, así como nuestra plataforma y productos de ML. Tendrá la oportunidad de ampliar sus conocimientos y desarrollar su experiencia en marcos modernos de aprendizaje automático, bibliotecas y tecnologías, trabajando en colaboración con interesados internos para comprender las necesidades empresariales cambiantes. Si tiene facilidad para encontrar soluciones creativas y le gusta trabajar en un entorno práctico y colaborativo, este puesto es ideal para usted. Requisitos Qué hará en el puesto: Implementar sistemas escalables y confiables utilizando arquitecturas, tecnologías y plataformas basadas en la nube para gestionar inferencias de modelos a gran escala. Desplegar y gestionar pipelines de aprendizaje automático y datos en entornos de producción. Trabajar en soluciones de contenerización y orquestación para el despliegue de modelos. Participar en ciclos rápidos de iteración, adaptándose a los requisitos cambiantes del proyecto. Colaborar como parte de un equipo ágil multifuncional para crear y mejorar software que permita aplicaciones avanzadas de big data y ML. Aplicar las mejores prácticas de CI/CD, incluyendo automatización de pruebas y monitoreo, para garantizar el despliegue exitoso de modelos de ML y código de aplicaciones. Asegurar que todo el código esté bien gestionado para reducir vulnerabilidades, que los modelos estén adecuadamente supervisados desde una perspectiva de riesgo, y que el ML siga las mejores prácticas en IA responsable y explicable. Colaborar con científicos de datos, ingenieros de software, ingenieros de datos y otros interesados para desarrollar e implementar mejores prácticas para MLOps, incluyendo pipelines de CI/CD, control de versiones, versionado de modelos, monitoreo, alertas y despliegue automatizado de modelos. Gestionar y supervisar la infraestructura de aprendizaje automático, asegurando alta disponibilidad y rendimiento. Implementar soluciones sólidas de monitoreo y registro para hacer seguimiento al rendimiento del modelo y la salud del sistema. Monitorear el rendimiento en tiempo real de los modelos desplegados, analizar los datos de rendimiento e identificar y abordar proactivamente los problemas para garantizar un rendimiento óptimo. Diagnosticar y resolver de manera oportuna y eficiente problemas de producción relacionados con el despliegue, rendimiento y escalabilidad de los modelos de ML. Aplicar las mejores prácticas de seguridad en sistemas de aprendizaje automático y garantizar el cumplimiento de las regulaciones de protección y privacidad de datos. Colaborar con ingenieros de plataformas para gestionar eficazmente los recursos de computación en la nube para el despliegue, monitoreo y optimización del rendimiento de los modelos de ML. Desarrollar y mantener documentación, procedimientos operativos estándar y directrices relacionadas con procesos, herramientas y mejores prácticas de MLOps. Cualificaciones básicas: Título de maestría o doctorado en informática, ingeniería eléctrica, matemáticas o un campo similar. Generalmente se requieren 7 o más años de experiencia práctica desarrollando e implementando soluciones avanzadas de análisis en un entorno corporativo, con al menos 4 años de experiencia programando en Python. Al menos 3 años de experiencia diseñando y construyendo soluciones intensivas en datos utilizando computación distribuida. Al menos 3 años de experiencia en la puesta en producción, monitoreo y mantenimiento de modelos. Conocimientos necesarios: Conocimiento de la plataforma Azure, como Azure Machine Learning, Azure Data Factory, Azure Databricks, Azure Kubernetes Service, Azure Monitor, etc. Demostrada experiencia en la construcción y despliegue de soluciones de IA/aprendizaje automático a gran escala utilizando plataformas en la nube como AWS, Azure o Google Cloud Platform. Experiencia en el desarrollo y mantenimiento de APIs (por ejemplo: REST). Experiencia en la especificación de infraestructura e Infraestructura como Código (por ejemplo: Ansible, Terraform). Experiencia en el diseño, desarrollo y escalado de pipelines complejos de datos y características para modelos de ML, y en la evaluación de su rendimiento. Capacidad para trabajar en toda la pila tecnológica y moverse con facilidad entre lenguajes de programación y tecnologías de MLOps (por ejemplo: Python, Spark, Databricks, GitHub, MLFlow, Airflow). Dominio de scripting en shell de Unix y programadores de tareas basados en dependencias. Conocimiento de los requisitos de seguridad y cumplimiento en infraestructuras de ML. Experiencia con tecnologías de visualización (por ejemplo: RShiny, Streamlit, Python DASH, Tableau, PowerBI). Familiaridad con estándares, metodologías y mejores prácticas de privacidad de datos. Beneficios Existen significativas oportunidades de desarrollo profesional a medida que la empresa crece. El puesto ofrece una oportunidad única para formar parte de un entorno pequeño, de rápido crecimiento, desafiante y emprendedor, con un alto grado de responsabilidad individual.