





Worth AI, líder en la industria de software informático, busca un Ingeniero Principal de Datos talentoso y experimentado para unirse a su innovador equipo. En Worth AI, nuestra misión es revolucionar la toma de decisiones con el poder de la inteligencia artificial, fomentando al mismo tiempo un entorno de colaboración y adaptabilidad, con el objetivo de tener un impacto significativo en el panorama tecnológico. Nuestros valores de equipo incluyen responsabilidad extrema, ser un solo equipo y crear seguidores entusiastas tanto entre nuestros empleados como entre nuestros clientes. Worth busca un Ingeniero Principal de Datos para asumir la responsabilidad de la arquitectura y plataforma de datos a nivel corporativo. Diseñe y escale tuberías confiables por lotes/transmisión, establezca calidad de datos y gobernanza, y habilite análisis/ML con sistemas seguros y rentables. Colabore con equipos de ingeniería, producto, analítica y seguridad para transformar necesidades comerciales en productos de datos duraderos. Responsabilidades Lo que harás: Arquitectura y Estrategia Definir la arquitectura de datos de extremo a extremo (lago/lakehouse/almacén, por lotes/transmisión, CDC, metadatos). Establecer estándares para esquemas, contratos, orquestación, capas de almacenamiento y modelos semánticos/métricas. Publicar hojas de ruta, ADRs/RFCs y estados objetivo de referencia; guiar decisiones de desarrollar frente a adquirir. Plataforma y Tuberías Diseñar y construir tuberías ELT/ETL y de eventos escalables y observables. Establecer patrones de ingesta (CDC, archivos, API, bus de mensajes) y políticas de evolución de esquemas. Proporcionar herramientas de autoservicio para analistas/científicos (dbt, notebooks, catálogos, almacenes de características). Garantizar la fiabilidad del flujo de trabajo (idempotencia, reintentos, rellenado retrospectivo, SLA). Calidad de Datos y Gobernanza Definir niveles de SLA/SLO de conjuntos de datos, actualidad, linaje y certificación de datos. Hacer cumplir contratos y pruebas de validación; implementar detección de anomalías y manuales de incidentes. Colaborar con gobernanza en catalogación, manejo de información personal (PII), retención y políticas de acceso. Fiabilidad, Rendimiento y Costo Liderar la planificación de capacidad, particionado/agrupamiento y optimización de consultas. Introducir prácticas tipo SRE para datos (presupuestos de errores, análisis postmortem). Impulsar FinOps para almacenamiento/procesamiento; monitorear y reducir costos por TB/consulta/tarea. Seguridad y Cumplimiento Implementar cifrado, tokenización y seguridad a nivel de fila/columna; gestionar secretos y auditorías. Alinear con SOC 2 y regulaciones de privacidad (por ejemplo, GDPR/CCPA; HIPAA si aplica). Habilitación de ML y Analítica Entregar conjuntos de datos/características documentados y versionados para BI y ML. Operacionalizar flujos de datos para entrenamiento/producción, señales de deriva y gobernanza del almacén de características. Construir y mantener la capa semántica y consistencia métrica para experimentación/BI. Liderazgo y Colaboración Brindar liderazgo técnico a través de grupos; mentoría a ingenieros senior/staff. Realizar revisiones de diseño y promover consenso en compensaciones complejas. Traducir objetivos comerciales en productos de datos junto con líderes de producto/análisis. Requisitos 10+ años en ingeniería de datos (incluyendo 3+ años como staff/principal o alcance equivalente). Demostrada experiencia liderando iniciativas de arquitectura y plataforma de datos a nivel corporativo. Amplia experiencia con al menos una nube (AWS) y un almacén moderno o lakehouse (por ejemplo, Snowflake, Redshift, Databricks). Fuerte dominio de SQL y un lenguaje de programación (Python o Scala/Java). Orquestación (Airflow/Dagster/Prefect), transformaciones (dbt o equivalente) y transmisión (Kafka/Kinesis/PubSub). Modelado de datos (3NF, estrella, data vault) y capas semánticas/métricas. Pruebas de calidad de datos, linaje y observabilidad en entornos productivos. Buenas prácticas de seguridad: RBAC/ABAC, cifrado, gestión de claves, auditabilidad. Deseable Almacenes de características y operaciones de datos para ML; frameworks de experimentación. Optimización de costos a gran escala; arquitecturas multi-inquilino. Herramientas de gobernanza (DataHub/Collibra/Alation), OpenLineage y frameworks de pruebas (Great Expectations/Deequ). Exposición a cumplimiento (SOC 2, GDPR/CCPA; HIPAA/PCI cuando sea relevante). Características de modelos obtenidas de datos complejos de terceros (KYB/KYC, agencias de crédito, APIs de detección de fraude) Beneficios Plan de atención médica (médico, dental y visual) Plan de jubilación (401k, IRA) Seguro de vida Tiempo libre pagado ilimitado 9 días festivos pagados Licencia familiar Trabajo desde casa Comida y bocadillos gratis (¡acceso a membresía en espacios de coworking Industrious!) Recursos de bienestar


