CompanyRemote

Ingeniero de Datos Python para Expansión de Plataforma Inmobiliaria...

Project-Based

Description

Estate Atlas, una startup de datos como servicio (DaaS), busca un Ingeniero de Datos Python experimentado para impulsar nuestra infraestructura ETL de vanguardia. Nuestra misión es proporcionar información basada en datos sobre los mercados inmobiliarios globales, empoderando a inversores, analistas y profesionales con datos precisos, transparentes y prácticos. Estamos construyendo la principal fuente mundial de datos inmobiliarios internacionales, agregando y estandarizando información de una amplia gama de fuentes globales para hacer los mercados más transparentes y accesibles. Ya hemos diseñado una infraestructura ETL sin servidor robusta y ahora necesitamos un profesional que la impulse y expanda.

La oportunidad:

Te centrarás en la parte fundamental de nuestra estrategia de datos: localizar fuentes de datos internacionales de alto valor, verificar su precisión y escribir el código necesario para integrarlas en nuestro ecosistema. Serás responsable de expandir nuestra cobertura a más de 15 países, garantizando que los datos sin procesar de diversas fuentes globales se extraigan, limpien y carguen correctamente en nuestro lago de datos.

Responsabilidades diarias clave:

Exploración y verificación de fuentes: Investigar y localizar activamente fuentes de datos fiables (registros gubernamentales, bancos centrales, portales inmobiliarios, etc.). Crear hojas de datos detalladas para verificar la fiabilidad, el formato y la frecuencia de actualización de cada fuente.

Integración de pipelines: Escribir y mantener scripts Python eficientes para extraer datos sin procesar e integrarlos en nuestro pipeline ETL sin servidor existente. Esto incluye el desarrollo de conectores y adaptadores para diversas APIs y formatos de datos.

Perfilado y calidad de datos: Analizar datos de muestra para comprender a fondo su estructura, identificando valores nulos, únicos y atípicos. Definir e implementar reglas de negocio claras para garantizar la máxima calidad y consistencia de los datos.

Estandarización: Implementar lógica de transformación avanzada utilizando herramientas como Polars y DuckDB para estandarizar diversos conjuntos de datos. Esto incluirá tareas como la conversión de monedas a USD, la normalización de formatos de fechas y la unificación de unidades de medida, entre otras.

Category: IT & Programming Subcategory: Data Science Project size: Large

Skills

Amazon Web Services (AWS)Web ScrapingAPIData ScienceData Engineer (Python)Microsoft AzureDatabaseGoogle Cloud Platform (GCP)Big DataSQLPythonData ModelingETL

Want AI to find more roles like this?

Upload your CV once. Get matched to relevant assignments automatically.

Try personalized matching