Categorías
···
Entrar / Registro

Desarrollador Java con experiencia en rastreadores web

Salario negociable

Axiom Software Solutions Limited

Austin, TX, USA

Favoritos
Compartir

Parte del contenido se ha traducido automáticamenteVer original
Descripción

Función: Desarrollador Java con experiencia en rastreadores web Ubicación: Austin TX (Híbrido) Responsabilidades: 1. Desarrollo de rastreadores web: Diseñar e implementar rastreadores web eficientes y escalables en Java para recopilar datos de diversas fuentes en línea. 2. Extracción de datos: Desarrollar y mantener sistemas para la extracción estructurada de datos, manejando diversos formatos de datos (HTML, JSON, XML, etc.). 3. Almacenamiento y procesamiento de datos: Diseñar canalizaciones de almacenamiento y procesamiento de datos, asegurando que los datos extraídos sean limpios, estructurados y fácilmente accesibles. 4. Optimización del rendimiento: Optimizar los procesos de rastreo web para lograr mayor velocidad, eficiencia y precisión, garantizando al mismo tiempo un impacto mínimo en los sitios web de origen. 5. Manejo de errores y registro: Implementar mecanismos de manejo de errores y sistemas de registro para detectar y resolver problemas durante las operaciones de rastreo. 6. Integridad de datos y cumplimiento: Asegurar que las prácticas de recopilación de datos sean éticas, legales y cumplan con las regulaciones pertinentes (por ejemplo, robots.txt, leyes de derechos de autor). Requisitos: Dominio de Java y experiencia con bibliotecas de raspado web basadas en Java (por ejemplo, Jsoup, Apache HttpClient). Conocimiento de frameworks y herramientas de rastreo web, como Scrapy, Selenium o Puppeteer. Sólida comprensión de HTML, CSS, JavaScript y estructuras de datos web. Familiaridad con técnicas de análisis y manejo de datos para formatos comunes como JSON, XML y otros. Experiencia con tecnologías de bases de datos (SQL, NoSQL) para almacenar y gestionar datos raspados. Conocimiento de los protocolos HTTP, encabezados, proxies y manejo de carga.

Fuentea:  workable Ver publicación original

Ubicación
Austin, TX, USA
Mostrar mapa

workable

También le puede interesar

Workable
Ingeniero de Datos de Mercado en C++
Trexquant es un fondo sistemático en crecimiento a la vanguardia de las finanzas cuantitativas, con un equipo central compuesto por investigadores e ingenieros altamente calificados. Para mantener el ritmo con nuestras operaciones comerciales globales en expansión, estamos buscando un Ingeniero de Datos de Mercado en C++ para diseñar y construir controladores de alimentación de ultra baja latencia para fuentes principales de proveedores y fuentes multicast de bolsas importantes. Este es un puesto de alto impacto que se encuentra en el núcleo de la plataforma comercial de Trexquant; la calidad, velocidad y fiabilidad de su código influyen directamente en cada estrategia que ejecutamos. Responsabilidades Diseñar e implementar controladores de alimentación de alto rendimiento en C++ moderno para acciones, futuros y opciones en mercados globales (por ejemplo, NYSE, CME, Refinitiv RTS, Bloomberg B-PIPE). Optimizar para latencias de micro y nanosegundos utilizando estructuras de datos sin bloqueo, disposiciones de memoria amigables con caché y redes que evitan el kernel cuando sea apropiado. Construir bibliotecas reutilizables para la decodificación de mensajes, normalización y publicación en buses internos compartidos por sistemas de investigación, simulación y trading en tiempo real. Colaborar con equipos multifuncionales para ajustar pilas TCP/UDP multicast, parámetros del kernel y configuraciones de NIC para obtener un rendimiento determinista. Proporcionar mecanismos robustos de conmutación por error, recuperación de brechas y reproducción para garantizar la integridad de los datos ante pérdidas de paquetes o interrupciones en las fuentes. Instrumentar trayectorias de código con marcas de tiempo precisas y métricas de rendimiento; impulsar pruebas continuas de regresión de latencia y planificación de capacidad. Trabajar estrechamente con investigadores cuantitativos para comprender los requisitos de datos posteriores y afinar los formatos de entrega tanto para simulación como para trading en tiempo real. Producir documentación clara de arquitectura, manuales operativos y análisis post mortem; participar en una rotación de soporte 24×7 siguiendo el sol para servicios críticos de datos de mercado. Requisitos Licenciatura/Maestría/Doctorado en Ciencias de la Computación, Ingeniería Eléctrica o campo relacionado. 3+ años de experiencia profesional en desarrollo en C++ (14,17,20) enfocada en sistemas de baja latencia y alto rendimiento. Trayectoria comprobada en la construcción o mantenimiento de fuentes de datos de mercado en tiempo real (por ejemplo, Refinitiv RTS/TREP, Bloomberg B-PIPE, OPRA, CME MDP, ITCH). Sólido conocimiento de concurrencia, algoritmos sin bloqueo, semántica del modelo de memoria y optimizaciones del compilador. Conocimientos sobre formatos de serialización (FAST, SBE, Protocol Buffers) y bases de datos de series temporales o cachés en memoria. Capacidad para usar scripts en Python para prototipado, pruebas y automatización operativa. Excelentes habilidades para resolver problemas, mentalidad de responsabilidad y capacidad para destacar en un entorno comercial acelerado. Conocimientos sobre contenerización (Docker/K8s) y redes en la nube pública (AWS, GCP). Beneficios Salario competitivo, más bono basado en el desempeño individual y de la empresa. Entorno de trabajo colaborativo, informal y amigable mientras se resuelven los problemas más difíciles en los mercados financieros. Seguro médico PPO, dental y de visión completamente cubierto para usted y sus dependientes. Beneficios preimpuestos para transporte Trexquant es un empleador que ofrece igualdad de oportunidades
Stamford, CT, USA
Salario negociable
Craigslist
Inscríbete hoy en el campamento intensivo de software en línea y consigue un trabajo en tecnología
The Tech Academy ofrece campamentos intensivos de programación en línea rentables y a tu propio ritmo, diseñados especialmente para principiantes sin conocimientos técnicos o de codificación previos. Nuestros programas de certificación cubren exhaustivamente las habilidades más demandadas en la industria tecnológica, cuentan con excelentes reseñas en línea y están diseñados para adaptarse a tu horario personal, preparándote para tu carrera en tecnología con un conjunto completo de herramientas. Hemos estado ofreciendo campamentos intensivos de programación completos, económicos, flexibles y confiables durante más de una década. Fundada en 2014, The Tech Academy se especializa en certificar estudiantes en una amplia gama de especialidades técnicas, incluyendo: inteligencia artificial, programación, ciberseguridad, ciencia de datos, desarrollo de aplicaciones, diseño, desarrollo web y más. Después de tu campamento intensivo de programación, nuestros especialistas en colocación laboral te brindarán orientación profesional. Nuestro equipo ha colocado con éxito a más de 1.000 graduados en puestos técnicos, y la mayoría obtiene un promedio de más de $30 por hora en su primer trabajo tras la graduación. A continuación, se muestra un resumen de los programas de certificación de The Tech Academy: 1. HORARIOS FLEXIBLES Y FORMACIÓN A TU PROPIO RITMO 2. CURSOS ADECUADOS PARA PRINCIPIANTES 3. FORMACIÓN COMPLETA E INTEGRAL 4. MATRÍCULA ECONÓMICA Y ADAPTADA AL PRESUPUESTO 5. MÁS DE 1.000 RESEÑAS DE 5 ESTRELLAS EN LÍNEA 6. FORMACIÓN Y AYUDA PARA COLOCACIÓN LABORAL Los programas de certificación en línea de The Tech Academy comienzan en $5.980, con varias opciones de financiamiento disponibles. ¡Comienza hoy tu camino hacia la industria tecnológica con uno de nuestros galardonados campamentos intensivos de programación en línea! Descubre más aquí contactándonos en: https://thetechacademy.us ¡Tu trabajo soñado en tecnología está a solo un campamento intensivo de The Tech Academy!
1048 Fillmore St, Denver, CO 80206, USA
$30/hora
Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.