CompanyRemote

Ingeniero de Datos para Expansión de Infraestructura Etl Inmobiliar...

Project-Based

Description

Estate Atlas, una startup de datos como servicio (DaaS) con la misión de ser la principal fuente mundial de datos inmobiliarios internacionales, busca un Ingeniero de Datos experimentado. Ya hemos diseñado una infraestructura ETL de vanguardia sin servidor y ahora necesitamos que la impulses. Este rol es fundamental para nuestra estrategia de datos, centrándose en la localización, verificación e integración de fuentes de datos internacionales de alto valor en nuestro ecosistema.

El objetivo principal de este proyecto es expandir nuestra cobertura a más de 15 países. El profesional seleccionado será responsable de garantizar que los datos sin procesar de diversas fuentes globales se extraigan, limpien y carguen correctamente en nuestro lago de datos, haciendo que los mercados inmobiliarios sean más transparentes y accesibles para inversores, analistas y profesionales.

Responsabilidades diarias clave incluyen:

Exploración y verificación de fuentes: Investigar y localizar activamente fuentes de datos fiables (registros gubernamentales, bancos centrales, portales inmobiliarios, etc.). Se espera la creación de hojas de datos detalladas para verificar la fiabilidad, el formato y la frecuencia de actualización de cada fuente.

Integración de pipelines: Escribir y mantener scripts Python eficientes para extraer datos sin procesar y asegurar su integración fluida en nuestro pipeline ETL sin servidor existente.

Perfilado y calidad de datos: Analizar datos de muestra para comprender a fondo su estructura, incluyendo la comprobación de valores nulos, únicos y atípicos. Definir y aplicar reglas de negocio para garantizar la alta calidad de los datos.

Estandarización: Implementar lógica de transformación utilizando herramientas como Polars y DuckDB para estandarizar diversos conjuntos de datos, por ejemplo, realizando conversiones de monedas a USD para uniformar la información.

Category: IT & Programming Subcategory: Data Science Project size: Medium

Skills

Data WarehousingPythonData ScienceSQLExtract Transform Load (ETL)Data ModelingETLData MiningData Engineer (Python)Big Data

Want AI to find more roles like this?

Upload your CV once. Get matched to relevant assignments automatically.

Try personalized matching