$200,000-275,000/año
MLabs
San Francisco, CA, USA
Ubicación: San Francisco, CA Tipo de empleo: Tiempo completo Presencial: 5 días/semana en persona Acerca del puesto Nuestro cliente es un laboratorio de investigación que proporciona datos posteriores al entrenamiento y entornos de RL a laboratorios de modelos fundamentales y empresas líderes de IA aplicada. Han obtenido financiamiento significativo de VC de primer nivel y están creciendo rápidamente. Como Ingeniero Senior de Investigación, liderará investigaciones de vanguardia en la intersección entre infraestructura escalable y marcos modernos de aprendizaje por refuerzo (RL). Esta es una oportunidad para unirse a un equipo en etapa inicial con alta autonomía y exposición directa a proyectos utilizados y validados en producción por laboratorios líderes. Responsabilidades Diseñar e implementar recetas de RL escalables para modelos específicos de tareas posteriores al entrenamiento. Desarrollar entornos modulares, funciones de recompensa y estructuras de evaluadores para tareas internas y dirigidas a clientes. Impulsar la investigación para habilitar el RL como servicio y publicar entornos de código abierto y datos de entrenamiento. Construir canalizaciones de generación y curación de datos para apoyar el post-entrenamiento de vanguardia. Colaborar con equipos de producto para ofrecer una interfaz fácil de usar que permita a usuarios no técnicos generar datos. Requisitos 4-7 años de experiencia en una función de investigación en IA/LLM (excluyendo la experiencia durante la licenciatura). Maestría o doctorado en Ciencias de la Computación o campo relacionado. Dominio de herramientas fundamentales como PyTorch y técnicas modernas de post-entrenamiento. Experiencia en evaluaciones e ingeniería de recompensas. Publicaciones en revistas destacadas (ICLR, NeurIPS, ICML, etc.). Beneficios Salario: $200k - $275k (según calidad y experiencia). Participación accionaria: 0.5% - 2%. Disponibilidad de patrocinio de visa. Debido al alto volumen de solicitudes que anticipamos, lamentamos no poder brindar comentarios individuales a todos los candidatos. Si no recibe noticias nuestras dentro de las 4 semanas posteriores a su solicitud, asuma que en esta ocasión no ha sido seleccionado. Apreciamos sinceramente su interés y le deseamos lo mejor en su búsqueda de empleo. Compromiso con la Igualdad y Accesibilidad: En MLabs, estamos comprometidos a ofrecer igualdad de oportunidades a todos los candidatos. Garantizamos ausencia de discriminación, anuncios de trabajo accesibles y provisión de información en formatos accesibles. Nuestro objetivo es fomentar un entorno de trabajo diverso e inclusivo con iguales oportunidades para todos. Si necesita ajustes razonables en cualquier parte del proceso de contratación o desea ver el anuncio de trabajo en un formato accesible, háganoslo saber lo antes posible enviando un correo electrónico a human-resources@mlabs.city. MLabs Ltd recopila y procesa la información personal que usted proporciona, como sus datos de contacto, historial laboral, currículum y otros datos relevantes únicamente con fines de reclutamiento. Esta información se gestiona de forma segura conforme a la Política de Privacidad y Política de Seguridad de la Información de MLabs Ltd, y en cumplimiento con las leyes aplicables de protección de datos. Sus datos podrán compartirse únicamente con clientes y socios de confianza cuando sea necesario para fines de reclutamiento. Puede solicitar la eliminación de sus datos o retirar su consentimiento en cualquier momento contactando a legal@mlabs.city.