Especialista en Etl con Python para Expansión de Datos Inmobiliario...
Description
Estate Atlas tiene la misión de proporcionar información basada en datos sobre los mercados inmobiliarios globales, empoderando a inversores, analistas y profesionales con datos inmobiliarios precisos, transparentes y prácticos. Somos una startup de datos como servicio (DaaS) que construye la principal fuente mundial de datos inmobiliarios internacionales. Al agregar y estandarizar información de una amplia gama de fuentes globales, estamos haciendo que los mercados inmobiliarios sean más transparentes y accesibles. La oportunidad: Ya hemos diseñado una infraestructura ETL de vanguardia sin servidor. Ahora, necesitamos que la impulses. Te centrarás en la parte fundamental de nuestra estrategia de datos: localizar fuentes de datos internacionales de alto valor en una base de datos, verificar su precisión y escribir el código para integrarlas en nuestro ecosistema. Serás responsable de expandir nuestra cobertura a más de 15 países, garantizando que los datos sin procesar de diversas fuentes globales se extraigan, limpien y carguen correctamente en nuestro lago de datos. Responsabilidades diarias seleccionadas: Exploración y verificación de fuentes: Investigar y localizar activamente fuentes de datos fiables (disponemos del sitio web que contiene todas las fuentes) (registros gubernamentales, bancos centrales, portales) y crear hojas de datos para verificar su fiabilidad, formato y frecuencia de actualización. Integración de pipelines: Escribir y mantener scripts Python eficientes para extraer datos sin procesar e integrarlos en nuestro pipeline ETL sin servidor existente. Perfilado y calidad de datos: Analizar datos de muestra para comprender su estructura (comprobación de valores nulos, únicos y atípicos) y definir las reglas de negocio "limpias" para garantizar la calidad. Estandarización: Implementar lógica de transformación mediante Polars y DuckDB para estandarizar diversos conjuntos de datos (por ejemplo, conversión de formatos).
Category: IT & Programming Subcategory: Data Science Project size: Large
Skills
Want AI to find more roles like this?
Upload your CV once. Get matched to relevant assignments automatically.