CompanyRemote

Ingeniero de Datos Python para Expansión Global de Etl Inmobiliario...

Project-Based

Description

Estate Atlas, una startup de Datos como Servicio (DaaS), busca un Ingeniero de Datos Python experimentado para impulsar la expansión de su infraestructura ETL sin servidor. Nuestra misión es proporcionar información basada en datos sobre los mercados inmobiliarios globales, empoderando a inversores, analistas y profesionales con datos precisos, transparentes y prácticos. Estamos construyendo la principal fuente mundial de datos inmobiliarios internacionales, agregando y estandarizando información de una amplia gama de fuentes globales para hacer que los mercados sean más transparentes y accesibles.

Ya hemos diseñado una infraestructura ETL de vanguardia sin servidor y ahora necesitamos que un profesional impulse su crecimiento. Te centrarás en la parte fundamental de nuestra estrategia de datos: localizar fuentes de datos internacionales de alto valor, verificar su precisión y escribir el código necesario para integrarlas en nuestro ecosistema. Serás responsable de expandir nuestra cobertura a más de 15 países, garantizando que los datos sin procesar de diversas fuentes globales se extraigan, limpien y carguen correctamente en nuestro lago de datos.

Responsabilidades diarias clave incluyen:

Exploración y verificación de fuentes: Investigar y localizar activamente fuentes de datos fiables (registros gubernamentales, bancos centrales, portales inmobiliarios, etc.) Y crear hojas de datos para verificar su fiabilidad, formato y frecuencia de actualización. Se proporcionará acceso a un sitio web con fuentes disponibles.

Integración de pipelines: Escribir y mantener scripts Python eficientes para extraer datos sin procesar e integrarlos en nuestro pipeline ETL sin servidor existente.

Perfilado y calidad de datos: Analizar datos de muestra para comprender su estructura (comprobación de valores nulos, únicos y atípicos) y definir las reglas de negocio "limpias" para garantizar la calidad y estandarización de los datos.

Category: IT & Programming Subcategory: Data Science Project size: Medium

Skills

Data ModelingWeb ScrapingAmazon Web Services (AWS)Google Cloud Platform (GCP)DatabaseExtract Transform Load (ETL)MicroservicesAPIBig DataData ScienceETLData WarehousingPythonSQLMicrosoft Azure

Want AI to find more roles like this?

Upload your CV once. Get matched to relevant assignments automatically.

Try personalized matching