CompanyRemote

Ingeniero de Datos para Expansión de Pipeline Etl de Bienes Raíces...

Project-Based

Description

Estate Atlas es una startup de datos como servicio (DaaS) con la misión de proporcionar información basada en datos sobre los mercados inmobiliarios globales, empoderando a inversores, analistas y profesionales con datos precisos, transparentes y prácticos. Estamos construyendo la principal fuente mundial de datos inmobiliarios internacionales, agregando y estandarizando información de una amplia gama de fuentes globales para hacer los mercados más transparentes y accesibles. Ya hemos diseñado una infraestructura ETL de vanguardia sin servidor y ahora necesitamos un profesional para impulsarla. El enfoque principal será localizar fuentes de datos internacionales de alto valor, verificar su precisión e integrar estas fuentes en nuestro ecosistema. Serás responsable de expandir nuestra cobertura a más de 15 países, asegurando que los datos sin procesar de diversas fuentes globales se extraigan, limpien y carguen correctamente en nuestro lago de datos. Responsabilidades diarias incluyen: Exploración y verificación de fuentes: Investigar y localizar activamente fuentes de datos fiables (registros gubernamentales, bancos centrales, portales) y crear hojas de datos para verificar su fiabilidad, formato y frecuencia de actualización. Integración de pipelines: Escribir y mantener scripts Python eficientes para extraer datos sin procesar e integrarlos en nuestro pipeline ETL sin servidor existente. Perfilado y calidad de datos: Analizar datos de muestra para comprender su estructura (comprobación de valores nulos, únicos y atípicos) y definir las reglas de negocio "limpias" para garantizar la calidad. Estandarización: Implementar lógica de transformación utilizando herramientas como Polars y DuckDB para estandarizar diversos conjuntos de datos.

Category: IT & Programming Subcategory: Data Science Project size: Large

Skills

SQLData ScienceData WarehousingDatabaseAmazon Web Services (AWS)Data ModelingETLPython

Want AI to find more roles like this?

Upload your CV once. Get matched to relevant assignments automatically.

Try personalized matching