Salario negociable
AION
Seattle, WA, USA
Sobre aion aion está construyendo la próxima generación de plataforma en la nube de IA mediante la transformación del futuro de la computación de alto rendimiento (HPC) a través de su nube de IA descentralizada. Diseñada específicamente para rendimiento bare-metal, aion democratiza el acceso al poder computacional para entrenamiento de IA, ajuste fino, inferencia, etiquetado de datos y ciclo de vida completo de IA/ML. Dirigida por fundadores con trayectoria destacada y salidas previas exitosas, aion cuenta con financiamiento sólido de importantes capitalistas de riesgo y asociaciones estratégicas globales. Con sede principal en EE. UU. y presencia global, la empresa está formando su equipo central inicial en India, Londres y San Francisco. Quién eres tú Eres un ingeniero de sistemas de ML apasionado por construir infraestructuras de inferencia de alto rendimiento. No necesitas ser experto en todo, este campo evoluciona demasiado rápido para eso, pero tienes bases sólidas y curiosidad para profundizar en desafíos de optimización. Te desenvuelves bien en entornos iniciales donde aprenderás técnicas de vanguardia mientras construyes sistemas productivos. Piensas sistemáticamente sobre cuellos de botella de rendimiento y te entusiasma ampliar los límites de lo posible en la infraestructura de IA. Requisitos Responsabilidades clave Aprender e implementar técnicas de optimización de inferencia de ML, incluyendo gestión de caché KV, agrupamiento dinámico y cuantización, bajo supervisión. Contribuir a proyectos de optimización de GPU usando CUDA, con aprendizaje práctico de desarrollo de kernels Triton y ajuste de rendimiento. Crear marcos de referencia y evaluación de modelos para evaluar el rendimiento entre diferentes modelos y estrategias de optimización. Investigar y experimentar con modelos de código abierto populares (DeepSeek R1, Qwen 3, variantes de Llama) para identificar oportunidades de optimización. Implementar herramientas de análisis costo-rendimiento para comprender los compromisos entre velocidad, calidad y uso de recursos. Explorar implementaciones de sistemas agentes y flujos de razonamiento multi-paso para capacidades futuras de la plataforma. Documentar aprendizajes y crear guías técnicas para compartir conocimientos internamente y educar a clientes. Habilidades y experiencia Persona proactiva con fuerte disposición para experimentar y aprender junto con el equipo. Prácticas previas o proyectos en infraestructura de ML, contribuciones usando PyTorch/u otros frameworks de ML, logros en programación competitiva, experiencia investigadora en sistemas de ML, familiaridad con sistemas agentes o técnicas de razonamiento. Habilidades sólidas en codificación e implementación en Python y C++, demostrando capacidad para escribir código eficiente y de calidad productiva. Experiencia leyendo y contribuyendo a bases de código grandes, con pruebas de contribuciones de código abierto (perfil de GitHub requerido). Evidencia de trabajo técnico mediante proyectos como Google Summer of Code, victorias en hackathones, programación competitiva o contribuciones significativas de código abierto. Conocimientos básicos de fundamentos de aprendizaje profundo, incluyendo redes neuronales, transformadores y conceptos básicos de entrenamiento/inferencia. Comprensión básica de PyTorch, incluyendo desarrollo de modelos y operaciones con tensores. Conocimientos fundamentales de computación en GPU o fuerte disposición para aprender programación CUDA. Conocimientos prácticos de al menos un framework de inferencia (vLLM, TensorRT-LLM, Hugging Face) mediante cursos o proyectos personales. Entendimiento de conceptos de sistemas distribuidos y principios de optimización de rendimiento. Beneficios Únete desde el inicio a una startup de IA orientada a una misión que revoluciona la infraestructura computacional. Aprende de ingenieros de clase mundial y obtén experiencia práctica con técnicas avanzadas de optimización de inferencia. Trabaja con un equipo de alto nivel, distribuido globalmente y respaldado por importantes capitalistas de riesgo. Gran oportunidad de aprendizaje y crecimiento en uno de los ámbitos más dinámicos de la infraestructura de IA. Compensación competitiva para prácticas con posibilidad de conversión a tiempo completo. Entorno de trabajo ágil y flexible, con espacio para asumir responsabilidades y generar impacto. Si tienes alguna pregunta sobre el puesto, contacta al gerente de contratación en LinkedIn o X.