Categorías

···

Entrar / Registro

Desarrollador Java con experiencia en rastreadores web

Salario negociable

Axiom Software Solutions Limited

Austin, TX, USA

Favoritos

Compartir

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Función: Desarrollador Java con experiencia en rastreadores web Ubicación: Austin TX (Híbrido) Responsabilidades: 1. Desarrollo de rastreadores web: Diseñar e implementar rastreadores web eficientes y escalables en Java para recopilar datos de diversas fuentes en línea. 2. Extracción de datos: Desarrollar y mantener sistemas para la extracción estructurada de datos, manejando diversos formatos de datos (HTML, JSON, XML, etc.). 3. Almacenamiento y procesamiento de datos: Diseñar canalizaciones de almacenamiento y procesamiento de datos, asegurando que los datos extraídos sean limpios, estructurados y fácilmente accesibles. 4. Optimización del rendimiento: Optimizar los procesos de rastreo web para lograr mayor velocidad, eficiencia y precisión, garantizando al mismo tiempo un impacto mínimo en los sitios web de origen. 5. Manejo de errores y registro: Implementar mecanismos de manejo de errores y sistemas de registro para detectar y resolver problemas durante las operaciones de rastreo. 6. Integridad de datos y cumplimiento: Asegurar que las prácticas de recopilación de datos sean éticas, legales y cumplan con las regulaciones pertinentes (por ejemplo, robots.txt, leyes de derechos de autor). Requisitos: Dominio de Java y experiencia con bibliotecas de raspado web basadas en Java (por ejemplo, Jsoup, Apache HttpClient). Conocimiento de frameworks y herramientas de rastreo web, como Scrapy, Selenium o Puppeteer. Sólida comprensión de HTML, CSS, JavaScript y estructuras de datos web. Familiaridad con técnicas de análisis y manejo de datos para formatos comunes como JSON, XML y otros. Experiencia con tecnologías de bases de datos (SQL, NoSQL) para almacenar y gestionar datos raspados. Conocimiento de los protocolos HTTP, encabezados, proxies y manejo de carga.

Fuentea: workable Ver publicación original

Ubicación

Austin, TX, USA

Mostrar mapa

workable

También le puede interesar

Ingeniero de Datos de Mercado en C++

Trexquant es un fondo sistemático en crecimiento a la vanguardia de las finanzas cuantitativas, con un equipo central compuesto por investigadores e ingenieros altamente calificados. Para mantener el ritmo con nuestras operaciones comerciales globales en expansión, estamos buscando un Ingeniero de Datos de Mercado en C++ para diseñar y construir controladores de alimentación de ultra baja latencia para fuentes principales de proveedores y fuentes multicast de bolsas importantes. Este es un puesto de alto impacto que se encuentra en el núcleo de la plataforma comercial de Trexquant; la calidad, velocidad y fiabilidad de su código influyen directamente en cada estrategia que ejecutamos. Responsabilidades Diseñar e implementar controladores de alimentación de alto rendimiento en C++ moderno para acciones, futuros y opciones en mercados globales (por ejemplo, NYSE, CME, Refinitiv RTS, Bloomberg B-PIPE). Optimizar para latencias de micro y nanosegundos utilizando estructuras de datos sin bloqueo, disposiciones de memoria amigables con caché y redes que evitan el kernel cuando sea apropiado. Construir bibliotecas reutilizables para la decodificación de mensajes, normalización y publicación en buses internos compartidos por sistemas de investigación, simulación y trading en tiempo real. Colaborar con equipos multifuncionales para ajustar pilas TCP/UDP multicast, parámetros del kernel y configuraciones de NIC para obtener un rendimiento determinista. Proporcionar mecanismos robustos de conmutación por error, recuperación de brechas y reproducción para garantizar la integridad de los datos ante pérdidas de paquetes o interrupciones en las fuentes. Instrumentar trayectorias de código con marcas de tiempo precisas y métricas de rendimiento; impulsar pruebas continuas de regresión de latencia y planificación de capacidad. Trabajar estrechamente con investigadores cuantitativos para comprender los requisitos de datos posteriores y afinar los formatos de entrega tanto para simulación como para trading en tiempo real. Producir documentación clara de arquitectura, manuales operativos y análisis post mortem; participar en una rotación de soporte 24×7 siguiendo el sol para servicios críticos de datos de mercado. Requisitos Licenciatura/Maestría/Doctorado en Ciencias de la Computación, Ingeniería Eléctrica o campo relacionado. 3+ años de experiencia profesional en desarrollo en C++ (14,17,20) enfocada en sistemas de baja latencia y alto rendimiento. Trayectoria comprobada en la construcción o mantenimiento de fuentes de datos de mercado en tiempo real (por ejemplo, Refinitiv RTS/TREP, Bloomberg B-PIPE, OPRA, CME MDP, ITCH). Sólido conocimiento de concurrencia, algoritmos sin bloqueo, semántica del modelo de memoria y optimizaciones del compilador. Conocimientos sobre formatos de serialización (FAST, SBE, Protocol Buffers) y bases de datos de series temporales o cachés en memoria. Capacidad para usar scripts en Python para prototipado, pruebas y automatización operativa. Excelentes habilidades para resolver problemas, mentalidad de responsabilidad y capacidad para destacar en un entorno comercial acelerado. Conocimientos sobre contenerización (Docker/K8s) y redes en la nube pública (AWS, GCP). Beneficios Salario competitivo, más bono basado en el desempeño individual y de la empresa. Entorno de trabajo colaborativo, informal y amigable mientras se resuelven los problemas más difíciles en los mercados financieros. Seguro médico PPO, dental y de visión completamente cubierto para usted y sus dependientes. Beneficios preimpuestos para transporte Trexquant es un empleador que ofrece igualdad de oportunidades

Stamford, CT, USA

Salario negociable

Ingeniero de Aprendizaje Automático, Tiempo de Ejecución y Optimización de ML

Fundada en 2016 en el Valle del Silicio, Pony.ai se ha convertido rápidamente en un líder global en movilidad autónoma y es pionera en la expansión de tecnologías y servicios de movilidad autónoma en una huella cada vez mayor de sitios en todo el mundo. Con unidades de negocio de Robotaxi, Robotruck y vehículos de propiedad personal (POV), Pony.ai es un líder industrial en la comercialización de la conducción autónoma y está comprometida a desarrollar capacidades de conducción autónoma seguras a escala global. La posición líder de Pony.ai ha sido reconocida, con CNBC clasificando a Pony.ai en el número 10 en su lista CNBC Disruptor de las 50 empresas tecnológicas más innovadoras y disruptivas de 2022. En junio de 2023, Pony.ai fue reconocida en la lista inaugural XB100 de 2023 de XPRIZE y Bessemer Venture Partners como una de las 100 principales empresas privadas de tecnología profunda del mundo, ocupando el puesto número 12 a nivel mundial. A partir de agosto de 2023, Pony.ai ha acumulado casi 21 millones de millas de conducción autónoma a nivel global. Pony.ai salió a bolsa en NASDAQ en noviembre de 2024. Responsabilidades El equipo de Infraestructura de ML en Pony.ai ofrece un conjunto de herramientas para respaldar y automatizar el ciclo de vida del flujo de trabajo de IA, incluyendo desarrollo del modelo, evaluación, optimización, despliegue y monitoreo. Como Ingeniero de Aprendizaje Automático en Tiempo de Ejecución y Optimización de ML, desarrollarás tecnologías para acelerar el entrenamiento y las inferencias de los modelos de IA en sistemas de conducción autónoma. Esto incluye: Identificar aplicaciones clave para problemas actuales y futuros de conducción autónoma y realizar análisis y optimización detallados para garantizar el mejor rendimiento posible en arquitecturas de computación actuales y de próxima generación. Colaborar estrechamente con diversos grupos dentro de Pony.ai, tanto de hardware como de software, para optimizar y diseñar algoritmos paralelos fundamentales, así como influir en el diseño de la arquitectura de plataformas de cómputo de próxima generación y en la infraestructura de software. Aplicar técnicas de optimización de modelos y de aprendizaje profundo eficiente a modelos y bibliotecas optimizadas de operadores de ML. Trabajar en toda la pila del marco/compilador de ML (por ejemplo, Torch, CUDA y TensorRT) y en modelos de aprendizaje profundo eficientes a nivel de sistema. Requisitos Título universitario (Licenciatura/Maestría o Doctorado) en informática, ingeniería eléctrica o disciplina relacionada. Sólidas habilidades de programación en C/C++ o Python. Experiencia en optimización de modelos, cuantización u otras técnicas eficientes de aprendizaje profundo. Buen conocimiento del rendimiento del hardware, respecto al modelo de ejecución de CPU o GPU, hilos, registros, caché, equilibrio costo/rendimiento, etc. Experiencia en perfilado, pruebas de referencia y validación del rendimiento en arquitecturas de cómputo complejas. Experiencia en la optimización del uso de recursos de cómputo, identificación y resolución de cuellos de botella en el flujo de datos y cómputo. Sólidas habilidades de comunicación y capacidad para trabajar transversalmente entre equipos de software y hardware. Calificaciones Preferidas: Se prefieren uno o más de los siguientes campos Experiencia en programación paralela, idealmente CUDA, OpenCL o OpenACC. Experiencia en visión por computadora, aprendizaje automático y aprendizaje profundo. Amplios conocimientos sobre diseño de software, técnicas de programación y algoritmos. Buen conocimiento de marcos y bibliotecas comunes de aprendizaje profundo. Conocimientos profundos sobre rendimiento del sistema, optimización de GPU o compiladores de ML. Compensación y Beneficios Rango Salarial Base: $140,000 - $250,000 anuales La compensación puede variar fuera de este rango dependiendo de muchos factores, incluyendo las calificaciones, habilidades, competencias, experiencia y ubicación del candidato. El salario base es solo una parte de la Compensación Total, y este puesto puede ser elegible para bonos/incentivos y unidades de acciones restringidas. Además, ofrecemos los siguientes beneficios a empleados elegibles: Plan de Atención Médica (Médico, Dental y Visual) Plan de Jubilación (401k tradicional y Roth) Seguro de Vida (Básico, Voluntario y AD&D) Tiempo Libre Pagado (Vacaciones y Días Festivos) Licencia Familiar (Maternidad, Paternidad) Discapacidad a Corto y Largo Plazo Comida y Bocadillos Gratis

Fremont, CA, USA

$140,000-250,000/año

Ingeniero de Datos Senior

PLUM es una empresa fintech que empodera a instituciones financieras para que crezcan sus negocios mediante una avanzada suite de software impulsada por inteligencia artificial, diseñada específicamente para prestamistas y sus socios en todo el ecosistema financiero. Somos una empresa pequeña, en la que las contribuciones e ideas de cada persona son fundamentales para el crecimiento de la compañía. Este puesto es completamente remoto y está abierto a candidatos en cualquier parte de EE. UU. con una conexión a internet confiable. Aunque nos reunimos en persona algunas veces al año, este rol está diseñado para mantenerse remoto a largo plazo. Tendrás autonomía y flexibilidad dentro de una estructura corporativa plana que te brinda la oportunidad de que tus aportes directos se concreten y se pongan en práctica. Colaborarás con un equipo de alto rendimiento, incluyendo profesionales de ventas, marketing y expertos en servicios financieros, conectados a través de Slack, videollamadas y reuniones regulares de equipo y de toda la empresa. Somos un equipo que sabe cómo trabajar con intensidad, divertirse y generar un impacto significativo, tanto en conjunto como individualmente. Resumen del puesto Buscamos un Ingeniero Senior de Datos para liderar el diseño e implementación de canalizaciones de datos escalables que ingieran y procesen datos de diversos sistemas externos de clientes. Este rol es fundamental para construir la infraestructura de datos que impulsa los productos de nueva generación de Plum basados en inteligencia artificial. Trabajarás con una pila de datos moderna que incluye Python, Databricks, AWS, Delta Lake y más. Como miembro senior del equipo, asumirás la responsabilidad sobre las decisiones arquitectónicas, el diseño del sistema y la preparación para producción, colaborando con otros miembros del equipo para garantizar que los datos sean confiables, accesibles y tengan impacto. Responsabilidades clave - Diseñar y arquitectar canalizaciones completas de procesamiento de datos: ingesta, transformación y entrega al Lakehouse Delta. - Integrar con sistemas externos (por ejemplo, CRMs, sistemas de archivos, APIs) para automatizar la ingesta de diversas fuentes de datos. - Desarrollar flujos de trabajo robustos de datos usando Python y Databricks Workflows. - Implementar procesos ETL modulares y mantenibles siguiendo las mejores prácticas del ciclo de vida del desarrollo de software (SDLC) y control de versiones basado en Git. - Contribuir a la evolución de nuestra arquitectura de Lakehouse para soportar casos de uso analíticos y de aprendizaje automático. - Monitorear, solucionar problemas y optimizar flujos de trabajo de datos en producción. - Colaborar con equipos multifuncionales para traducir necesidades de datos en soluciones escalables. Requisitos - Maestría en Ciencias de la Computación, Ingeniería, Física o campo técnico relacionado, o experiencia laboral equivalente. - 3 o más años de experiencia construyendo y manteniendo canalizaciones de datos en entornos productivos. - Demostrada experiencia en Python y SQL para tareas de ingeniería de datos. - Sólido conocimiento de la arquitectura de lakehouse y conceptos de modelado de datos. - Experiencia trabajando con Databricks, Delta Lake y Apache Spark. - Experiencia práctica con infraestructura en la nube de AWS. - Trayectoria comprobada en la integración de datos de sistemas externos, APIs y bases de datos. - Sólidas habilidades para resolver problemas y capacidad para liderar en entornos de incertidumbre. - Excelentes habilidades de comunicación y documentación. Cualificaciones deseables - Experiencia en la creación de soluciones de datos en los sectores fintech, tecnologías de ventas o tecnologías de marketing. - Conocimiento de plataformas CRM (por ejemplo, Salesforce, HubSpot) y modelos de datos CRM. - Experiencia usando herramientas ETL como Fivetran o Airbyte. - Comprensión de las mejores prácticas en gobernanza, seguridad y cumplimiento de datos. Beneficios - Una cultura de startup dinámica y colaborativa con gran visibilidad. - Autonomía, flexibilidad y una estructura corporativa plana que te brinda la oportunidad de que tus aportes directos se concreten y se pongan en práctica. - Oportunidad de generar un impacto significativo en la construcción de una empresa y su cultura. - Participación accionaria en una startup de tecnología financiera. - Cobertura generosa de salud, dental y visión para empleados y sus familiares, más plan 401K. - Once días festivos pagados y vacaciones ilimitadas discrecionales. - Compensación competitiva y potencial de bonificación.

San Francisco, CA, USA

Salario negociable

Términos de Uso

Política de Privacidad

ayuda

Preguntas frecuentes

Cookie

Política de cookies

Configuración de cookies

Nuestras aplicaciones

Descargar en

APP Store

Download

Consíguelo en

Google Play

© 2025 Servanan International Pte. Ltd.