Ingeniero en Aprendizaje por Refuerzo

Workable

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Boston, 02108, MA, EE. UU.

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Únase a un equipo de IA de clase mundial que impulsa los modelos de lenguaje grande y la generación de código, integrando producción e investigación en IA avanzada para lograr un impacto real. Aspectos destacados: 1. Trabajo pionero en modelos de lenguaje grande y generación de código 2. Participar en investigaciones de vanguardia mediante proyectos de código abierto 3. Aplicar inteligencia artificial avanzada para resolver desafíos prácticos y significativos En Code Metal AI, formará parte de un equipo de clase mundial compuesto por talento procedente del MIT, OpenAI y otras empresas líderes, centrado en trabajos pioneros con modelos de lenguaje grande (LLM) y generación de código. Nuestros proyectos involucran directamente a importantes fabricantes de chips, aplicando IA avanzada para resolver desafíos prácticos y significativos con impacto real. Este puesto integra dos áreas fundamentales: Producción Construir y mantener sistemas robustos de entrenamiento distribuido utilizando PyTorch (se requieren al menos 2 años de experiencia). Diseñar e implementar tuberías escalables de curación de datos y garantía de calidad para asegurar conjuntos de datos de entrenamiento de máxima calidad. Desarrollar herramientas de orquestación que gestionen flujos de trabajo complejos en el entrenamiento y la evaluación de modelos de IA a gran escala. Investigación Impulsar la innovación mediante el desarrollo de marcos de evaluación y soluciones de aprendizaje por refuerzo, incluyendo avances recientes en Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF). Participar en investigaciones de vanguardia mediante proyectos de código abierto y posibles publicaciones, aplicando RLHF a Modelos de Lenguaje Grande (LLM), preferiblemente centrados en tareas de generación de código. Requisitos Al menos 2 años de experiencia en entrenamiento distribuido, preferiblemente con PyTorch. Sólida formación en aprendizaje por refuerzo; se valora especialmente la experiencia reciente en RLHF. Capacidad comprobada para construir tuberías de curación de datos y garantía de calidad. Experiencia en el desarrollo de marcos de evaluación. Preferiblemente, experiencia tanto en tuberías de datos como en orquestación. Elegible para obtener la autorización de seguridad TS/SCI. Deseable: Contribuciones a proyectos de IA o ML de código abierto. Publicaciones o experiencia investigadora demostrable en campos relacionados. Experiencia práctica aplicando RLHF a LLM, especialmente para generación de código. Experiencia en generación sintética de datos a gran escala. Beneficios Plan de atención médica con cobertura del 100 % de las primas, incluyendo atención médica, dental y visual. Plan 401k con coincidencia del 5 %. Tiempo libre remunerado (vacaciones ilimitadas, además de días de enfermedad y festivos públicos). Modalidad laboral híbrida flexible. Asistencia para reubicación a empleados calificados.

Fuentea: workable Ver publicación original

Workable · HR

Compañía

Workable

Workable · HR

Empleos similares

Ingeniero en Aprendizaje por Refuerzo

Descripción

Compañía

Empleos similares

Ingenieros de Inteligencia Artificial (IA)

Coordinador de Operaciones Ejecutivas y Scrum (Apoyo a Proyectos) (Charlotte)

Ingeniero Senior Web3 (Mercados de Predicción / Criptomonedas)

Contratación de matrona

Se busca cocinero (hombre)

Contratación de ayudante electricista