Salario negociable
Isotron AI
San Francisco, CA, USA
Acerca del puesto Somos una startup en etapa inicial y en modo sigilo desarrollando una nueva clase de plataforma para medios generativos. Nuestra misión es habilitar el futuro de las aplicaciones generativas en tiempo real: estamos construyendo las herramientas y la infraestructura fundamentales que hacen finalmente posibles categorías completamente nuevas de experiencias y aplicaciones generativas. Somos un equipo pequeño y enfocado compuesto por exfundadores de YC y unicornios e ingenieros sénior con amplia experiencia en 3D, video generativo, plataformas para desarrolladores y herramientas creativas. Contamos con el respaldo de inversores de primer nivel y ángeles destacados, y estamos construyendo una nueva base técnica diseñada específicamente para la próxima era de los medios generativos. Estamos operando al límite de lo técnicamente posible: inferencia de alto rendimiento y orquestación en tiempo real de modelos multimodales. Como uno de nuestros ingenieros fundadores, desempeñarás un papel clave al diseñar la plataforma principal, influir en las decisiones de diseño del sistema y asumir la responsabilidad de infraestructuras críticas desde el primer día. Si te entusiasma diseñar y construir infraestructura de alto rendimiento que empodere a la próxima generación de desarrolladores y desbloquee categorías completamente nuevas de productos, nos encantaría hablar contigo. Acerca del puesto Estamos buscando un Ingeniero Fundador de Aprendizaje Automático para construir la infraestructura principal que impulse la inferencia de alto rendimiento para modelos de medios generativos, incluyendo arquitecturas difusoras y transformadoras. Serás fundamental para diseñar sistemas de baja latencia y alto rendimiento que sirvan modelos de vanguardia en tiempo real. Como líder técnico inicial, darás forma tanto a nuestros sistemas como a nuestra cultura desde el primer día. Qué harás Diseñar e implementar el motor de inferencia para modelos generativos basados en transformadores difusores Optimizar la ejecución del modelo en toda la pila: memoria, cómputo y red Impulsar la ingeniería de rendimiento para minimizar la latencia y maximizar el rendimiento Trabajar estrechamente con investigación para llevar a producción nuevas técnicas generativas y variantes de modelos Construir las herramientas, servicios y monitoreo que hagan estos sistemas robustos y escalables Establecer el estándar técnico y ayudar a definir la cultura de ingeniería como miembro inicial del equipo Requisitos Lo que debes tener 3+ años de experiencia construyendo infraestructura de ML o sistemas de alto rendimiento Dominio profundo de PyTorch y Python orientado a producción Sólido conocimiento de sistemas GPU (CUDA, jerarquías de memoria, planificación, etc.) Experiencia optimizando inferencia para modelos generativos (por ejemplo, difusores, transformadores) Deseable: Conocimientos en Triton, CUDA, TensorRT o técnicas de paralelismo de modelos Mentalidad de startup: asumes responsabilidad, avanzas rápido y resuelves problemas complejos de extremo a extremo Calificaciones mínimas Habilidades sólidas en Python + PyTorch Experiencia comprobada optimizando inferencia para modelos generativos Conocimiento profundo de sistemas, especialmente ajuste de rendimiento GPU Alta iniciativa y disposición para construir desde cero Beneficios Salario competitivo en SF y participación accionaria para miembros fundadores