Salario negociable
Qode
New Jersey, USA
Científico de Datos - Responsabilidades Clave Crear y optimizar modelos de clasificación, regresión y predicción utilizando técnicas clásicas de ML y de aprendizaje profundo. Desarrollar e implementar arquitecturas de aprendizaje profundo, incluyendo LSTMs, transformadores y otros modelos basados en secuencias para series temporales, procesamiento del lenguaje natural (NLP) y detección de anomalías. Diseñar e implementar tuberías de NLP para clasificación de texto, búsqueda semántica, resumen y respuesta a preguntas utilizando modelos basados en transformadores (por ejemplo, BERT, T5, GPT). Crear tuberías RAG (generación aumentada por recuperación) que integren modelos lingüísticos grandes (LLMs) con bases de datos vectoriales (por ejemplo, FAISS, Pinecone, Weaviate) y marcos de indexación de documentos. Aplicar y ajustar modelos lingüísticos grandes (LLMs) (por ejemplo, OpenAI, Mistral, LLaMA, Cohere) para tareas específicas del dominio mediante métodos de ajuste fino supervisado o LoRA/QLoRA. Construir y orquestar sistemas de inteligencia artificial multiagente utilizando marcos como LangGraph, CrewAI u OpenAgents para soportar agentes autónomos con capacidad de uso de herramientas en flujos de trabajo de toma de decisiones. Colaborar con ingenieros de datos, gerentes de producto y partes interesadas para traducir necesidades comerciales en soluciones listas para producción. Capacitar y apoyar a científicos de datos junior mediante revisiones de código, retroalimentación en diseño de modelos y experimentación colaborativa. Promover las mejores prácticas en modelado reproducible, inteligencia artificial responsable y despliegue escalable. Habilidades y Experiencia Requeridas Más de 5 años de experiencia en ciencia de datos o aprendizaje automático aplicado, con una sólida formación tanto en métodos clásicos como de aprendizaje profundo. Experiencia práctica con Python y bibliotecas/marcos como scikit-learn, pandas, PyTorch, TensorFlow, Hugging Face Transformers y LangChain. Comprensión sólida de métricas de clasificación, ingeniería de características, validación de modelos y ajuste de hiperparámetros. Experiencia demostrada con modelos lingüísticos grandes (LLMs), incluyendo ajuste fino, ingeniería de indicaciones (prompt engineering) y técnicas de generación aumentada por recuperación.