Workable
Director de Software
Quadric ha creado una innovadora arquitectura de unidad de procesamiento neuronal de propósito general (GPNPU). El software y hardware co-optimizados de Quadric están diseñados para ejecutar cargas de trabajo de inferencia de redes neuronales (NN) en una amplia variedad de dispositivos perimetrales y de extremo, que van desde sistemas de sensores inteligentes con batería hasta sistemas automotrices de alto rendimiento o vehículos autónomos. A diferencia de otras NPUs o aceleradores de redes neuronales en la industria actual que solo pueden acelerar una parte de un grafo de aprendizaje automático, el GPNPU de Quadric ejecuta tanto código de grafo de NN como código convencional de DSP y control en C++.
Lo que valoramos:
Integridad, Humildad, Felicidad
Lo que esperamos:
Iniciativa, Colaboración, Finalización
Rol:
Reportando directamente al VP de Ingeniería, usted será responsable de todo el equipo de software y de la ejecución del SDK Chimera de Quadric (https://quadric.io/sdk/). Únase a nosotros en nuestra visión compartida de lanzar optimización de modelos y compiladores de clase mundial para la inferencia de IA donde más importa: en la planta de fabricación, en el vehículo, en dispositivos de consumo y en entornos empresariales.
Responsabilidades
Ser responsable de la entrega completa de la pila de software: SDK, compilador de grafos, bibliotecas de kernels y herramientas para desarrolladores.
Establecer la dirección técnica y una hoja de ruta con múltiples lanzamientos para el compilador, kernels y SDK; alinearse con silicio y arquitectura.
Ser responsable de la pila de optimización de inferencia (Cuantización -> Compilación -> Rendimiento acelerado) en la arquitectura Chimera para modelos de visión, LLMs, VLMs, etc.
Crear y supervisar planes de ejecución, hitos e indicadores clave de desempeño (KPI), como cobertura de operadores, latencia/rendimiento, diferencias de precisión y tiempos de compilación.
Gestionar y mentorizar una organización de ingeniería (gestores e ingenieros individuales), expandir el equipo y desarrollar líderes.
Participar directamente en diseños críticos, revisiones y código, especialmente en torno al diseño de IR, generación de código y kernels.
Colaborar con clientes y equipos de campo para desbloquear pruebas de concepto (POC), priorizar la hoja de ruta y asegurar implementaciones productivas.
Establecer estándares de calidad e ingeniería de lanzamientos (CI/CD, pruebas, benchmarking, compilaciones reproducibles, documentación y ejemplos).
Requisitos
Trayectoria demostrada en el lanzamiento de una pila de SDK + compilador para un acelerador de ML, GPU o NPU.
Más de 5 años de experiencia gestionando equipos que desarrollan compiladores/sistemas de ML, incluyendo más de 10 años liderando equipos multidisciplinarios de unos 30 o más ingenieros.
Excelentes habilidades de comunicación y gestión de partes interesadas; comodidad al manejar escalaciones de clientes y ciclos de retroalimentación del campo.
Liderazgo de programas basado en datos: hojas de ruta/OKR, gestión de dependencias y riesgos, planificación presupuestaria y de personal, y reportes ejecutivos.
Éxito demostrado en contratar, capacitar y gestionar el desempeño de gestores e ingenieros senior; formador de cultura.
Capacidad para traducir objetivos del producto en planes de compilador e indicadores KPI.
Conocimientos sobre compiladores de grafos y desarrollo de kernels: MLIR/TVM/StableHLO/HLO, LLVM, programación, generación de código.
Familiaridad con técnicas de cuantización: PTQ/QAT, esquemas por tensor/per canal, simétricos/asimétricos, conjuntos de datos de calibración, compensaciones entre precisión y rendimiento.
Sólidos fundamentos en C++ y Python; análisis de rendimiento, vectorización, jerarquías de memoria y concurrencia.
Deseable: Experiencia integrando backends de PyTorch (Dynamo/FX/Inductor/ONNX) y exportación de modelos.
Beneficios
Ofrecemos salarios competitivos y participación accionaria significativa
Plan de atención médica (médico, dental y visual)
Plan de jubilación (401k, IRA)
Seguro de vida (básico, voluntario y por accidente)
Tiempo libre remunerado (vacaciones, enfermedad y días festivos)
Licencia familiar (maternidad, paternidad)
Fundada en 2016 y ubicada en el centro de Burlingame, California, Quadric está construyendo el primer supercomputador del mundo diseñado para las necesidades en tiempo real de los dispositivos perimetrales. Quadric tiene como objetivo empoderar a desarrolladores de todos los sectores con superpoderes para crear la tecnología del mañana, hoy mismo. La empresa fue cofundada por tecnólogos procedentes del MIT y la Universidad Carnegie Mellon, que anteriormente fueron cofundadores técnicos de la empresa de computación Bitcoin 21.
Quadric se enorgullece de ser un lugar de trabajo con igualdad de oportunidades y un empleador de acción afirmativa. Estamos comprometidos con la igualdad de oportunidades laborales independientemente de raza, religión, sexo, origen nacional, orientación sexual, edad, ciudadanía, estado civil o discapacidad.

Burlingame, CA, USA
Salario negociable