




Quadric ha creado una innovadora arquitectura de unidad de procesamiento neuronal de propósito general (GPNPU). El software y hardware co-optimizados de Quadric están diseñados para ejecutar cargas de trabajo de inferencia de redes neuronales (NN) en una amplia variedad de dispositivos de borde y terminales, que van desde sistemas de sensores inteligentes con batería hasta sistemas automotrices de alto rendimiento o sistemas para vehículos autónomos. A diferencia de otras NPUs o aceleradores de redes neuronales en la industria actual que solo pueden acelerar una parte de un grafo de aprendizaje automático, el GPNPU de Quadric ejecuta tanto el código del grafo de NN como el código convencional de DSP y control en C++. Lo que valoramos: Integridad, Humildad, Felicidad Lo que esperamos: Iniciativa, Colaboración, Conclusión Rol: Se unirá al equipo de ciencia de datos centrado en la optimización de modelos, investigará, prototipará y validará técnicas de baja precisión que hagan que las redes neuronales sean más ligeras y rápidas en el GPNPU Chimera. Sus análisis establecerán las recetas de cuantización que se incluirán en el SDK de Chimera e influirán en futuras características de hardware. Responsabilidades: Diseñar experimentos estadísticamente rigurosos para comparar PTQ, QAT, poda y esquemas de precisión mixta en modelos de visión, lenguaje y multimodales. Crear conjuntos de datos de calibración; desarrollar cuadernos/dashboards en Python para rastrear los equilibrios entre precisión, latencia, consumo de energía y memoria. Realizar análisis de errores a nivel de capa y de token para guiar las decisiones sobre formatos numéricos. Colaborar con el equipo del compilador para convertir sus hallazgos en flujos de SDK listos para usar y configuraciones de referencia. Publicar documentos técnicos internos, puntos de referencia externos y presentar resultados a clientes y en eventos del sector. Monitorear la literatura académica sobre compresión e inferencia eficiente; traducir ideas prometedoras en prototipos reproducibles. Requisitos Maestría o doctorado en CS, EE, Matemáticas Aplicadas o áreas similares, con 5 o más años de experiencia en optimización de modelos de ML o investigación basada en ciencia de datos. Profundo conocimiento de aritmética de punto fijo, teoría de cuantización y calibración estadística. Dominio de Python, PyTorch o TensorFlow, NumPy/Pandas/SciPy, y herramientas de visualización de datos (Matplotlib/Plotly). Experiencia práctica con al menos una herramienta de cuantización (PyTorch FX/PTQ/QAT, TF-Lite, ONNX-Runtime, TVM, MLIR Quant). Conocimientos funcionales de CNNs, Transformers y arquitecturas DNN Beneficios Ofrecemos salarios competitivos y participación accionaria significativa Plan de salud (médico, dental y visual) Plan de jubilación (401k, IRA) Seguro de vida (básico, voluntario y por accidente) Tiempo libre remunerado (vacaciones, enfermedad y días festivos) Licencia familiar (maternidad, paternidad) Trabajo desde casa Comida y bocadillos gratuitos Fundada en 2016 y con sede en el centro de Burlingame, California, Quadric está construyendo el primer supercomputador del mundo diseñado para las necesidades en tiempo real de los dispositivos de borde. Quadric tiene como objetivo dotar a los desarrolladores de todos los sectores con superpoderes para crear la tecnología del mañana, hoy mismo. La empresa fue cofundada por tecnólogos del MIT y de la Universidad Carnegie Mellon, que anteriormente fueron cofundadores técnicos de la empresa de computación Bitcoin 21. Quadric se enorgullece de ser un lugar de trabajo con igualdad de oportunidades y un empleador de acción afirmativa. Estamos comprometidos con la igualdad de oportunidades laborales independientemente de raza, religión, sexo, origen nacional, orientación sexual, edad, ciudadanía, estado civil o discapacidad.


