Categorías
···
Entrar / Registro

Desarrollador Java con experiencia en rastreadores web

Salario negociable

Axiom Software Solutions Limited

Austin, TX, USA

Favoritos
Compartir

Parte del contenido se ha traducido automáticamenteVer original
Descripción

Función: Desarrollador Java con experiencia en rastreadores web Ubicación: Austin TX (Híbrido) Responsabilidades: 1. Desarrollo de rastreadores web: Diseñar e implementar rastreadores web eficientes y escalables en Java para recopilar datos de diversas fuentes en línea. 2. Extracción de datos: Desarrollar y mantener sistemas para la extracción estructurada de datos, manejando diversos formatos de datos (HTML, JSON, XML, etc.). 3. Almacenamiento y procesamiento de datos: Diseñar canalizaciones de almacenamiento y procesamiento de datos, asegurando que los datos extraídos sean limpios, estructurados y fácilmente accesibles. 4. Optimización del rendimiento: Optimizar los procesos de rastreo web para lograr mayor velocidad, eficiencia y precisión, garantizando al mismo tiempo un impacto mínimo en los sitios web de origen. 5. Manejo de errores y registro: Implementar mecanismos de manejo de errores y sistemas de registro para detectar y resolver problemas durante las operaciones de rastreo. 6. Integridad de datos y cumplimiento: Asegurar que las prácticas de recopilación de datos sean éticas, legales y cumplan con las regulaciones pertinentes (por ejemplo, robots.txt, leyes de derechos de autor). Requisitos: Dominio de Java y experiencia con bibliotecas de raspado web basadas en Java (por ejemplo, Jsoup, Apache HttpClient). Conocimiento de frameworks y herramientas de rastreo web, como Scrapy, Selenium o Puppeteer. Sólida comprensión de HTML, CSS, JavaScript y estructuras de datos web. Familiaridad con técnicas de análisis y manejo de datos para formatos comunes como JSON, XML y otros. Experiencia con tecnologías de bases de datos (SQL, NoSQL) para almacenar y gestionar datos raspados. Conocimiento de los protocolos HTTP, encabezados, proxies y manejo de carga.

Fuentea:  workable Ver publicación original

Ubicación
Austin, TX, USA
Mostrar mapa

workable

También le puede interesar

Workable
Desarrollador ETL
Título – Desarrollador ETL Ubicación – Portland, OR Puesto – 4 meses (se extenderá por otros 6 meses) Tarifa – $Abierto Requisitos Funciones y responsabilidades El desarrollador ETL participará en todas las fases de implementación del proyecto y en el soporte continuo de Oracle Business Intelligence Enterprise Edition (OBIEE) para la empresa. Competencia principal demostrada utilizando DataStage y Appworx, con dominio preferiblemente adquirido en entornos OBIEE / OBIA. Este rol tendrá contacto directo con clientes y personal de TI para recopilar requisitos que respalden la creación y mantenimiento de artefactos OBIEE. El candidato debe tener sólida experiencia en desarrollo de informes y mapeos en DataStage, capacidad de ejecución de flujos de trabajo en DataStage / Appworx, y experiencia en diseño e implementación de OBIEE/DataStage. El candidato también debe tener experiencia en desarrollo de mapeos con Informatica y programación de flujos de trabajo con DAC dentro del diseño de OBIEE. Habilidades requeridas: CCNA, DLP, Symantec Bluecoat Proxy, Netskope Beneficios Nota: Si está interesado, envíe su currículum actualizado e incluya sus requisitos salariales junto con sus datos de contacto y un horario adecuado para poder comunicarnos con usted. Si conoce a alguien en su círculo de contactos que sea adecuado para este puesto, le agradeceríamos que reenviara esta oferta a dicha persona copiándonos a nosotros. ¡Esperamos tener noticias suyas lo antes posible!
Portland, OR, USA
Salario negociable
Workable
Desarrollador de Software Independiente (C/C++ - Rust) - Entrenador de IA
Esta oportunidad está disponible únicamente para candidatos que actualmente residan en el país especificado. Su ubicación puede afectar la elegibilidad y las tarifas. En Mindrift, la innovación se encuentra con la oportunidad. Creemos en el uso del poder de la inteligencia colectiva para moldear éticamente el futuro de la inteligencia artificial. Lo que hacemos La plataforma Mindrift conecta a especialistas con proyectos de IA procedentes de importantes innovadores tecnológicos. Nuestra misión es desbloquear el potencial de la IA generativa aprovechando la experiencia del mundo real de profesionales de todo el planeta. Sobre el puesto Los modelos de IA generativa están mejorando muy rápidamente, y uno de nuestros objetivos es hacerlos capaces de responder preguntas especializadas y desarrollar habilidades de razonamiento complejo. Si se une a la plataforma como Tutor de IA en programación, tendrá la oportunidad de colaborar en estos proyectos. Aunque cada proyecto es único, normalmente podría: Analizar y comprender código existente en Python o C/C++ Migrar lógica a Rust idiomático y seguro, preservando la funcionalidad Adaptar o trasladar la suite de pruebas y garantizar la equivalencia de comportamiento Documentar los pasos de migración y las decisiones técnicas Cómo comenzar Simplemente postúlese a esta oferta, apruebe el proceso de calificación y obtenga la oportunidad de contribuir a proyectos acordes a sus habilidades, en el horario que mejor le convenga. Desde la creación de indicaciones de entrenamiento hasta el perfeccionamiento de las respuestas del modelo, ayudará a dar forma al futuro de la IA, asegurando que la tecnología beneficie a todos. Requisitos Tiene un título de licenciatura o maestría en Desarrollo de Software, Ciencias de la Computación u otro campo relacionado. Tiene al menos 3 años de experiencia profesional con C/C++ y al menos 1 año de experiencia práctica con Rust. Tiene experiencia con herramientas FFI (bindgen, cxx) y con Rust inseguro (unsafe Rust) para la interoperabilidad con C/C++. Tiene experiencia en pruebas de código migrado (pruebas unitarias, de integración y de fuzzing). Demuestra un sólido conocimiento de la programación de sistemas (gestión de memoria, concurrencia). Es hábil para refactorizar código heredado y documentar los pasos de migración. La experiencia en ingeniería de indicaciones (prompt engineering) es altamente valorada. Su nivel de inglés es avanzado (C1) o superior. Está dispuesto a aprender nuevos métodos, puede cambiar rápidamente entre tareas y temas, y a veces trabajar con directrices desafiantes y complejas. Este puesto independiente es completamente remoto, por lo que solo necesita una laptop, conexión a internet, tiempo disponible y entusiasmo para asumir un reto. Beneficios ¿Por qué esta oportunidad freelance podría ser ideal para usted? Reciba un pago por su experiencia, con tarifas que pueden alcanzar hasta $50/hora, dependiendo de sus habilidades, experiencia y necesidades del proyecto. Participe en un proyecto freelance remoto y a tiempo parcial que se adapte a sus compromisos profesionales o académicos principales. Trabaje en proyectos avanzados de IA y adquiera experiencia valiosa que enriquezca su portafolio. Influya en la forma en que los futuros modelos de IA comprenden y comunican en su campo de especialidad.
New York, NY, USA
$50
Workable
Investigador / Ingeniero de Aprendizaje Automático (Modelos Fundacionales)
Acerca de Pathway Pathway está desarrollando sistemas LiveAI™ que piensan y aprenden en tiempo real como los seres humanos. Nuestra misión es comprender profundamente cómo y por qué funcionan los LLM, cambiando fundamentalmente la forma en que los modelos piensan. El equipo está formado por destacadas figuras de la IA. El CTO de Pathway, Jan Chorowski, coautor de artículos con Geoff Hinton y Yoshua Bengio, fue una de las primeras personas en aplicar la atención al reconocimiento de voz. Nuestro CSO, Adrian Kosowski, obtuvo su doctorado en Ciencias de la Computación Teórica a la edad de 20 años y ha realizado contribuciones significativas en numerosos campos científicos, incluyendo IA e información cuántica. También se desempeñó como profesor y entrenador de programadores competitivos en École Polytechnique. El equipo también incluye a numerosos científicos y programadores competitivos de élite a nivel mundial, junto con experimentados ejecutivos de Silicon Valley. Pathway cuenta con sólido respaldo de inversores. Hasta la fecha, hemos recaudado más de 15 millones de dólares; nuestra última ronda reportada fue la ronda inicial. Nuestras oficinas están ubicadas en Palo Alto, CA, así como en París, Francia y Wroclaw, Polonia. La Oportunidad Esta es una posición de I+D en modelos basados en atención. Actualmente estamos buscando 1 o 2 Ingenieros de I+D con un historial sólido en investigación de modelos de aprendizaje automático. Este es un proyecto fundacional extremadamente ambicioso. Existe un presupuesto flexible de GPU asociado a este proyecto específico, garantizado como mínimo en un rango de seis cifras. Usted realizará entrenamiento de modelos (distribuido). ayudará a mejorar/adaptar arquitecturas de modelos basadas en resultados experimentales. diseñará nuevas tareas y experimentos. opcionalmente: supervisará las actividades de miembros del equipo involucrados en la preparación de datos. Los resultados de su trabajo desempeñarán un papel crucial en el éxito del proyecto. Requisitos Carta de presentación ¡Siempre es un placer saludar! Si pudiera dejarnos 2-3 líneas, lo agradeceríamos mucho. Se espera que cumpla al menos uno de los siguientes criterios: Ha publicado al menos un artículo en NeurIPS, ICLR o ICML, en el que fue autor principal o realizó contribuciones conceptuales y de código significativas. Ha contribuido significativamente a un esfuerzo de entrenamiento de LLM que tuvo repercusión mediática (encabezó un benchmark de Huggingface, modelo líder en su clase, etc.), preferiblemente utilizando múltiples GPU. Ha trabajado al menos 6 meses en un centro líder de investigación de Aprendizaje Automático (por ejemplo: Google Brain / Deepmind, Apple, Meta, Anthropic, Nvidia, MILA). Fue finalista en la Final Mundial de la ICPC, o medallista en la IOI, IMO o IPhO durante la escuela secundaria. Usted Es Un investigador de aprendizaje profundo, con experiencia en Modelos de Lenguaje y/o RL (también se aceptan candidatos con experiencia en Visión o Robótica). Interesado en mejorar arquitecturas fundamentales y crear nuevos benchmarks. Con experiencia práctica en experimentos y entrenamiento de modelos (PyTorch, Jax o Tensorflow). Con buen conocimiento de la arquitectura de GPU, diseño de memoria y comunicación. Con buen conocimiento de algoritmos de grafos. Con cierta familiaridad con monitoreo de modelos, git, sistemas de compilación y CI/CD. Respetuoso con los demás Fluido en inglés Puntos Adicionales Conocimiento de enfoques utilizados en entrenamiento distribuido. Familiaridad con Triton Historial exitoso en concursos de algoritmos y ciencia de datos. Mostrar un portafolio de código. Por Qué Debería Aplicar Únase a un entorno de trabajo intelectualmente estimulante. Sea un pionero: tendrá la oportunidad de trabajar con un nuevo tipo de desafíos de "IA en Vivo" relacionados con secuencias largas y datos cambiantes. Forme parte de una startup de IA en etapas iniciales que cree en la investigación de impacto y en cambios fundamentales. Beneficios Tipo de contrato: Tiempo completo, indefinido Fecha de incorporación preferible: Inmediata. Las posiciones están abiertas hasta cubrirse; postúlese inmediatamente. Compensación: salario anual de seis cifras según perfil y ubicación + Plan de Opciones Accionarias para Empleados. Ubicación: Trabajo remoto. Posibilidad de trabajar o reunirse con otros miembros del equipo en alguna de nuestras oficinas: Palo Alto, CA; París, Francia o Wroclaw, Polonia. Se considerarán candidatos de cualquier lugar de la UE, Reino Unido, Estados Unidos y Canadá. Si cumple con nuestros amplios requisitos pero le falta algo de experiencia, no dude en contactarnos.
Palo Alto, CA, USA
$100,000/año
Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.