$100,000
Pathway
Palo Alto, CA, USA
Sobre Pathway Pathway está desarrollando sistemas LiveAI™ que piensan y aprenden en tiempo real, tal como lo hacen los seres humanos. Nuestra misión es comprender profundamente cómo y por qué funcionan los LLM, cambiando fundamentalmente la forma en que los modelos piensan. El equipo está formado por destacadas figuras de la inteligencia artificial. El CTO de Pathway, Jan Chorowski, ha sido coautor de artículos con Geoff Hinton y Yoshua Bengio, y fue una de las primeras personas en aplicar el mecanismo de atención al reconocimiento de voz. Nuestro CSO, Adrian Kosowski, obtuvo su doctorado en Ciencias de la Computación Teórica a la edad de 20 años y ha realizado importantes contribuciones en diversos campos científicos, incluyendo IA e información cuántica. También se desempeñó como profesor y entrenador de programadores competitivos en École Polytechnique. El equipo también incluye a numerosos científicos de primer nivel mundial y programadores competitivos, junto con experimentados ejecutivos de Silicon Valley. Pathway cuenta con un fuerte respaldo de inversores. Hasta la fecha, hemos recaudado más de 15 millones de dólares; nuestra última ronda reportada fue la ronda inicial (seed). Nuestras oficinas están ubicadas en Palo Alto, California, así como en París, Francia y Wroclaw, Polonia. La oportunidad Se trata de un puesto de investigación y desarrollo en modelos basados en mecanismos de atención. Actualmente estamos buscando uno o dos ingenieros de I+D con un historial sólido en investigación de modelos de aprendizaje automático. Este es un proyecto fundamental extremadamente ambicioso. Existe un presupuesto flexible para GPU asociado a este proyecto específico, garantizado como mínimo en un rango de seis cifras. Usted realizará entrenamiento de modelos (distribuido). ayudará a mejorar y adaptar arquitecturas de modelos basadas en los resultados de experimentos. diseñará nuevas tareas y experimentos. opcionalmente: supervisará las actividades de miembros del equipo involucrados en la preparación de datos. Los resultados de su trabajo desempeñarán un papel crucial en el éxito del proyecto. Requisitos Carta de presentación ¡Siempre es un placer saludar! Si pudiera dejarnos 2 o 3 líneas, lo agradeceríamos mucho. Se espera que cumpla al menos uno de los siguientes criterios: Ha publicado al menos un artículo en NeurIPS, ICLR o ICML, siendo autor principal o habiendo realizado contribuciones conceptuales y de código significativas. Ha contribuido de forma importante a un esfuerzo de entrenamiento de un LLM que tuvo relevancia mediática (encabezó un benchmark de Huggingface, modelo líder en su categoría, etc.), preferiblemente utilizando múltiples GPU. Ha trabajado al menos 6 meses en un centro líder de investigación en aprendizaje automático (por ejemplo: Google Brain / Deepmind, Apple, Meta, Anthropic, Nvidia, MILA). Fue finalista en la Final Mundial de la ICPC, o ganador de una medalla en la IOI, IMO o IPhO durante la escuela secundaria. Usted es un investigador en aprendizaje profundo, con experiencia en Modelos de Lenguaje y/o RL (también se aceptan candidatos con experiencia en visión por computadora o robótica). interesado en mejorar arquitecturas fundamentales y crear nuevos benchmarks. con experiencia práctica en experimentación y entrenamiento de modelos (PyTorch, Jax o Tensorflow). con buen conocimiento de la arquitectura de GPU, diseño de memoria y comunicación. con buen conocimiento de algoritmos de grafos. con cierta familiaridad en monitoreo de modelos, git, sistemas de compilación y CI/CD. respetuoso con los demás. fluido en inglés. Puntos adicionales Conocimiento de técnicas utilizadas en entrenamiento distribuido. Familiaridad con Triton. Historial exitoso en concursos de algoritmos y ciencia de datos. Presentar un portafolio de código. Por qué debería postular Únase a un entorno de trabajo intelectualmente estimulante. Sea un pionero: trabajará con un nuevo tipo de desafíos de "IA en vivo" relacionados con secuencias largas y datos cambiantes. Forme parte de una startup de IA en etapas iniciales que cree en la investigación con impacto y en cambios fundamentales. Beneficios Tipo de contrato: Tiempo completo, indefinido. Fecha de incorporación preferible: Inmediata. Las plazas estarán abiertas hasta cubrirse; postúlese lo antes posible. Compensación: salario anual de seis cifras según perfil y ubicación + Plan de Opciones para Empleados (ESOP). Ubicación: Trabajo remoto. Posibilidad de trabajar o reunirse con otros miembros del equipo en alguna de nuestras oficinas: Palo Alto, California; París, Francia o Wroclaw, Polonia. Se considerarán candidatos de cualquier lugar de la UE, Reino Unido, Estados Unidos y Canadá. Si cumple con nuestros amplios requisitos pero le falta algo de experiencia, no dude en contactarnos.