Investigador/Ingeniero de Aprendizaje Automático (Modelos Fundamentales)

$100,000/año

Workable

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Palo Alto, 94301, CA, EE.UU.

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Pathway busca ingenieros de I+D con una sólida formación en investigación de aprendizaje automático para desarrollar modelos fundamentales basados en mecanismos de atención para sistemas LiveAI™. Aspectos destacados: 1. Únase a un entorno laboral intelectualmente estimulante. 2. Inicie nuevos desafíos de "IA en vivo" con secuencias largas y datos cambiantes. 3. Contribuya a una startup de IA en etapa inicial centrada en investigaciones con impacto. Acerca de Pathway Pathway está construyendo sistemas LiveAI™ que piensan y aprenden en tiempo real, tal como lo hacen los seres humanos. Nuestra misión es comprender profundamente cómo y por qué funcionan los modelos de lenguaje de gran tamaño (LLM), cambiando fundamentalmente la forma en que los modelos piensan. El equipo está integrado por figuras destacadas de la inteligencia artificial. El director técnico (CTO) de Pathway, Jan Chorowski, coautoró artículos con Geoff Hinton y Yoshua Bengio, y fue una de las primeras personas en aplicar mecanismos de atención al procesamiento del habla. Nuestro director científico (CSO), Adrian Kosowski, obtuvo su doctorado en Ciencias de la Computación Teórica a la edad de 20 años y realizó contribuciones significativas en numerosos campos científicos, incluidos la IA y la información cuántica. También se desempeñó como profesor y entrenador de programadores competitivos en la École Polytechnique. El equipo también incluye a numerosos científicos y programadores competitivos de primer nivel mundial, junto con experimentados ejecutivos de Silicon Valley. Pathway cuenta con un sólido respaldo de inversores. Hasta la fecha, hemos recaudado más de 15 millones de dólares estadounidenses; nuestra última ronda reportada fue la de semilla. Nuestras oficinas están ubicadas en Palo Alto, California, así como en París, Francia, y Wrocław, Polonia. La oportunidad Esta es una posición de I+D en modelos basados en mecanismos de atención. Actualmente buscamos uno o dos ingenieros de I+D con un historial sólido en investigación de modelos de aprendizaje automático. Se trata de un proyecto fundamental extremadamente ambicioso. Este proyecto específico cuenta con un presupuesto flexible de GPU, garantizado como mínimo en el rango de siete dígitos. Sus responsabilidades serán: realizar entrenamiento de modelos (distribuido). ayudar a mejorar o adaptar arquitecturas de modelos según los resultados experimentales. diseñar nuevas tareas y experimentos. opcionalmente: supervisar las actividades de los miembros del equipo involucrados en la preparación de datos. Los resultados de su trabajo desempeñarán un papel crucial en el éxito del proyecto. Requisitos Carta de presentación ¡Siempre es un placer saludarle! Si pudiera dejarnos 2-3 líneas, ¡se lo agradeceríamos mucho! Se espera que cumpla al menos uno de los siguientes criterios: Ha publicado al menos un artículo en NeurIPS, ICLR o ICML, siendo autor principal o habiendo realizado contribuciones conceptuales y de código significativas. Ha contribuido de forma significativa a un esfuerzo de entrenamiento de LLM que tuvo repercusión mediática (superó un benchmark de Hugging Face, fue el modelo líder en su categoría, etc.), preferiblemente utilizando múltiples GPU. Ha trabajado durante al menos 6 meses en un centro líder de investigación en aprendizaje automático (por ejemplo: Google Brain / DeepMind, Apple, Meta, Anthropic, NVIDIA, MILA). Fue finalista mundial de la ICPC o medallista en la Olimpiada Internacional de Informática (IOI), Olimpiada Internacional de Matemáticas (IMO) u Olimpiada Internacional de Física (IPhO) en la escuela secundaria. Usted es un investigador de aprendizaje profundo con experiencia comprobada en modelos de lenguaje y/o aprendizaje por refuerzo (RL) (también se aceptan candidatos con antecedentes en visión por computadora o robótica con ML). alguien interesado en mejorar arquitecturas fundamentales y crear nuevos benchmarks. experimentado en experimentos prácticos y entrenamiento de modelos (PyTorch, JAX o TensorFlow). quien posee un buen conocimiento de la arquitectura de GPU, diseño de memoria y comunicación. quien posee un buen conocimiento de algoritmos sobre grafos. quien tiene cierta familiaridad con monitoreo de modelos, git, sistemas de compilación y CI/CD. respetuoso con los demás fluido en inglés Puntos adicionales Conocimiento de los enfoques utilizados en el entrenamiento distribuido. Familiaridad con Triton. Trayectoria exitosa en concursos de algoritmos y ciencia de datos. Presentación de un portafolio de código. Por qué debería postularse Únase a un entorno laboral intelectualmente estimulante. Sea pionero: tendrá la oportunidad de trabajar con un nuevo tipo de desafíos de "IA en vivo" relacionados con secuencias largas y datos cambiantes. Forme parte de una startup de IA en etapa inicial que cree en la investigación con impacto y en cambios fundamentales. Beneficios Tipo de contrato: jornada completa, indefinido Fecha deseable de incorporación: inmediata. Las posiciones permanecen abiertas hasta cubrirse; por favor, postúlese de inmediato. Remuneración: salario anual de seis dígitos según perfil y ubicación + Plan de Opciones Accionarias para Empleados. Ubicación: trabajo remoto. Posibilidad de trabajar o reunirse con otros miembros del equipo en cualquiera de nuestras oficinas: Palo Alto, California; París, Francia o Wrocław, Polonia. Se considerarán candidatos ubicados en cualquier país de la UE, Reino Unido, Estados Unidos y Canadá. Si cumple con nuestros requisitos generales pero le faltan algunas experiencias, no dude en contactarnos.

Fuentea: workable Ver publicación original

Workable · HR

Compañía

Workable

Workable · HR

Empleos similares

Investigador/Ingeniero de Aprendizaje Automático (Modelos Fundamentales)

Descripción

Compañía

Empleos similares

Desarrollador Java - Walnut Creek, CA - Tarifa abierta

Ingeniero de Software Senior en Planet Labs PBC (SOMA / South Beach)

Especialista en Marketing

Se buscan albañiles para trabajos de remodelación

Cuidadora de niños en el Área de la Bahía de San Francisco, EE. UU.

Ingeniero de Aprendizaje Automático, Tiempo de Ejecución y Optimización de ML