Salario negociable
Tiger Analytics
Dallas, TX, USA
Tiger Analytics es una firma consultora de análisis avanzado en rápido crecimiento. Nuestros consultores tienen una profunda experiencia en Ciencia de Datos, Aprendizaje Automático e Inteligencia Artificial. Somos el socio de análisis de confianza para múltiples empresas de Fortune 500, permitiéndoles generar valor empresarial a partir de los datos. Nuestro valor comercial y liderazgo han sido reconocidos por diversas firmas de investigación de mercado, incluyendo Forrester y Gartner. Estamos buscando talento de primer nivel mientras continuamos construyendo el mejor equipo global de consultoría analítica del mundo. Como Ingeniero Principal de Datos, será responsable de diseñar, construir y mantener tuberías de datos escalables en la infraestructura en la nube de AWS. Trabajará estrechamente con equipos multifuncionales para apoyar iniciativas de análisis de datos, aprendizaje automático e inteligencia empresarial. El candidato ideal tendrá una sólida experiencia con servicios de AWS, Databricks y Apache Airflow. Principales responsabilidades: Diseñar, desarrollar e implementar tuberías de datos completas en la infraestructura en la nube de AWS utilizando servicios como Amazon S3, AWS Glue, AWS Lambda, Amazon Redshift, etc. Implementar flujos de trabajo de procesamiento y transformación de datos utilizando Databricks, Apache Spark y SQL para cumplir con los requisitos de análisis e informes. Crear y mantener flujos de trabajo de orquestación utilizando Apache Airflow para automatizar la ejecución, programación y supervisión de las tuberías de datos. Liderar la migración de sistemas de datos heredados a arquitecturas modernas basadas en la nube. Desarrollar y mantener tuberías CI/CD para flujos de trabajo de datos. Colaborar con científicos de datos, analistas y partes interesadas del negocio para comprender los requisitos de datos y entregar soluciones de datos escalables. Optimizar las tuberías de datos en cuanto a rendimiento, fiabilidad y rentabilidad, aprovechando las mejores prácticas de AWS y tecnologías nativas de la nube. Requisitos Más de 10 años de experiencia construyendo e implementando tuberías de procesamiento de datos a gran escala en un entorno de producción. Experiencia práctica en el diseño y construcción de tuberías de datos en la infraestructura en la nube de AWS. Dominio sólido de servicios de AWS como Amazon S3, AWS Glue, AWS Lambda, Amazon Redshift, etc. Liderar el diseño, desarrollo y optimización de tuberías de datos a gran escala y arquitecturas de data lakehouse utilizando Databricks Diseñar e implementar soluciones de procesamiento por lotes y en tiempo real utilizando Apache Spark en Databricks Experiencia práctica con Apache Airflow para orquestar y programar tuberías de datos. Comprensión sólida de los modelos de datos, principios de diseño de bases de datos y SQL y Spark SQL. Experiencia con sistemas de control de versiones (por ejemplo, Git) y tuberías CI/CD. Excelentes habilidades de comunicación y capacidad para colaborar eficazmente con equipos multifuncionales. Fuertes habilidades para resolver problemas y atención al detalle. Beneficios Este puesto ofrece una excelente oportunidad de desarrollo profesional significativo en un entorno empresarial de rápido crecimiento y desafiante, con un alto grado de responsabilidad individual.