Workable
Ingeniero de Datos Ambientales / Ingeniero de Aprendizaje Automático
Puesto: Ingeniero de Datos Ambientales / Ingeniero de Aprendizaje Automático
Tipo de puesto: Tiempo completo
Reporta a: Jay Weeks, Director de Datos y Ciencias del Suelo
Resumen del puesto
Como Ingeniero de Datos / Ingeniero de Aprendizaje Automático, desempeñará un papel fundamental al cerrar la brecha entre prototipos experimentales y sistemas escalables listos para producción. Dedicará aproximadamente el 50 % de su tiempo a optimizar e implementar tuberías de datos para satisfacer necesidades comerciales a largo plazo, y el otro 50 % a desarrollar modelos avanzados de aprendizaje automático para la cartografía ambiental y la predicción de cambios en métricas ambientales (por ejemplo, reservas de carbono orgánico en el suelo) utilizando datos de series temporales. Este es un puesto práctico en un entorno dinámico de startup, donde colaborará con equipos multifuncionales para ofrecer soluciones impactantes y confiables.
Principales responsabilidades
Desarrollo de tuberías de producción (50 % del tiempo):
Evaluar y refactorizar código de prototipo de fases de I+D en tuberías de producción eficientes y mantenibles.
Diseñar, implementar y mantener flujos de trabajo escalables de ingesta, procesamiento y ETL (Extraer, Transformar, Cargar) mediante infraestructura basada en la nube (por ejemplo, AWS, GCP o Azure).
Garantizar que las tuberías sean robustas, tolerantes a fallos y optimizadas para rendimiento, seguridad y eficiencia de costos.
Integrar sistemas de monitoreo, registro y alertas para apoyar operaciones continuas y una rápida resolución de problemas.
Colaborar con ingenieros de software, científicos, científicos de datos y otras partes interesadas para alinear las tuberías con los objetivos comerciales, posibilitando escalabilidad y fiabilidad a largo plazo.
Desarrollo de modelos (50 % del tiempo):
Construir, entrenar e implementar modelos de aprendizaje automático para cuantificación ambiental (por ejemplo, cartografía digital del suelo, predicción de cambios en reservas de carbono orgánico en el suelo, etc.).
Trabajar con datos de series temporales provenientes de diversas fuentes (por ejemplo, imágenes satelitales, datos de sensores, registros históricos) para desarrollar modelos predictivos usando técnicas como pronóstico de series temporales, análisis geoespacial y aprendizaje profundo.
Realizar ingeniería de características, evaluación de modelos, ajuste de hiperparámetros y validación para asegurar precisión y generalización.
Integrar modelos de ML en entornos de producción, incluyendo desarrollo de API para predicciones en tiempo real y procesamiento por lotes.
Mantenerse actualizado sobre avances en ML para aplicaciones geoespaciales y ambientales, experimentando con nuevos algoritmos y herramientas para mejorar el rendimiento de los modelos.
Funciones generales:
Realizar revisiones de código, redactar documentación y orientar a miembros junior del equipo sobre las mejores prácticas en ingeniería de datos y ML.
Solucionar y depurar problemas tanto en tuberías de datos como en sistemas de ML.
Requisitos obligatorios
Título universitario (licenciatura o maestría) en Informática, Ciencia de Datos, Aprendizaje Automático, Ciencias Ambientales o campo relacionado.
Más de 3 años de experiencia en ingeniería de datos, con trayectoria demostrada en la puesta en producción de código de prototipo en un entorno de startup o acelerado.
Dominio sólido de lenguajes de programación como Python (con bibliotecas como Pandas, NumPy, Scikit-learn) y SQL.
Experiencia con frameworks de ML (por ejemplo, TensorFlow, PyTorch, XGBoost) y análisis de series temporales (por ejemplo, Prophet, redes LSTM, PINNs).
Experiencia práctica con plataformas en la nube, contenedores y tuberías CI/CD.
Conocimiento de procesamiento de datos geoespaciales y conceptos de modelado ambiental, particularmente en ciencias del suelo o agricultura.
Excelentes habilidades para resolver problemas, con capacidad para manejar requisitos ambiguos y cumplir con plazos ajustados.
Habilidades deseables
Experiencia en cartografía digital del suelo, modelos de predicción de reservas de carbono, estadística avanzada y/o calibración/inferencia de modelos bayesianos.
Conocimiento de tecnologías de big data (por ejemplo, Spark, Kafka) para manejar grandes conjuntos de datos de series temporales.
Formación en prácticas DevOps e infraestructura como código (por ejemplo, Terraform).
Pasión por la sostenibilidad y el impacto ambiental.
Beneficios:
Plan de seguro médico con deducible de $0 y copago de $0
Planes de seguros dental y de visión
Opción de cuenta de gastos flexibles.
Política abierta de días libres pagados más 9 días festivos pagados por año según se indican en nuestro Manual de la Empresa
Participación en nuestro plan de ahorro 401(k)
Cobertura de vida y AD&D pagada por la empresa
Materiales educativos y gastos para apoyar oportunidades de educación continua
Acerca de Grassroots Carbon
Grassroots Carbon es la principal empresa de restauración de pastizales y almacenamiento de carbono en el suelo que se asocia con propietarios de tierras para implementar y escalar prácticas de manejo regenerativo del terreno. Además de mejorar la salud del suelo, promover la biodiversidad y mejorar la calidad del agua, estas prácticas regenerativas tienen un enorme potencial para combatir el cambio climático al capturar grandes cantidades de CO2 atmosférico en el suelo. Grassroots Carbon se enorgullece de haber colaborado con ganaderos en 1,6 millones de acres distribuidos en 21 estados para implementar prácticas que restauran pastizales, mejoran los hábitats de aves, fortalecen la salud del suelo y promueven la reducción de carbono orgánico en el suelo a través de suelos sanos. Basándose en principios de rigor científico, calidad y transparencia, Grassroots Carbon ha establecido fuertes alianzas con Audubon Conservation Ranching, Texas Agricultural Land Trust, Understand Ag y el Soil Carbon Solutions Center de la Universidad Estatal de Colorado, generando créditos de reducción de carbono en el suelo de alta calidad para corporaciones líderes como Nestle, Microsoft, Shopify, Marathon Oil, H-E-B, Olipop y Urban Villages, ayudándoles a compensar su impacto de carbono y alcanzar sus metas de sostenibilidad.
*Grassroots Carbon se enorgullece de ser una empresa del portafolio de Soilworks Natural Capital*
Acerca de Soilworks Natural Capital:
Grassroots Carbon se enorgullece de ser una empresa del portafolio de Soilworks Natural Capital, que brinda servicios compartidos a nuestra empresa en rápido crecimiento. Soilworks es un fondo de capital privado que invierte en, incubadora y adquiere empresas para ayudar a acelerar el movimiento de Agricultura Regenerativa y tiene como misión demostrar que el pastoreo regenerativo es la forma más rentable de hacer ganadería. Los principios de Soilworks incluyen alimentos mejores y más saludables, restauración de la diversidad vegetal y animal, regeneración del suelo para almacenar agua y carbono, y la creación de granjas familiares más rentables. Soilworks fue fundado por los cofundadores de Scaleworks, un fondo de capital de riesgo tecnológico con sede en San Antonio, Texas.
Nos enorgullece fomentar un entorno laboral libre de discriminación. Creemos firmemente que la diversidad de experiencias, perspectivas y antecedentes conduce a un entorno mejor para nuestros empleados y a una mejor experiencia para nuestros usuarios y clientes. Somos un empleador que ofrece igualdad de oportunidades y no discriminamos por características protegidas. Todos los candidatos recibirán la misma consideración.
*No se ofrece patrocinio de visa para este puesto*

San Antonio, TX, USA
Salario negociable