Ingeniero de Datos Python para Expansión Global de Plataforma Etl I...
Description
Estate Atlas, una startup de datos como servicio (DaaS), busca un Ingeniero de Datos Python para impulsar nuestra infraestructura ETL serverless de vanguardia. Nuestra misión es proporcionar información basada en datos sobre los mercados inmobiliarios globales, empoderando a inversores, analistas y profesionales con datos precisos, transparentes y prácticos. Estamos construyendo la principal fuente mundial de datos inmobiliarios internacionales, agregando y estandarizando información de una amplia gama de fuentes globales para hacer los mercados más transparentes y accesibles.
La oportunidad es clave: ya hemos diseñado una infraestructura ETL serverless y ahora necesitamos expandirla significativamente. El profesional seleccionado se centrará en la parte fundamental de nuestra estrategia de datos: localizar fuentes de datos internacionales de alto valor, verificar su precisión e integrar el código necesario en nuestro ecosistema.
Serás responsable de expandir nuestra cobertura a más de 15 países, asegurando que los datos sin procesar de diversas fuentes globales se extraigan, limpien y carguen correctamente en nuestro lago de datos.
Responsabilidades diarias incluirán:
* Exploración y verificación de fuentes: Investigar y localizar activamente fuentes de datos fiables (registros gubernamentales, bancos centrales, portales) y crear hojas de datos para verificar su fiabilidad, formato y frecuencia de actualización.
* Integración de pipelines: Escribir y mantener scripts Python eficientes para extraer datos sin procesar e integrarlos en nuestro pipeline ETL serverless existente.
* Perfilado y calidad de datos: Analizar datos de muestra para comprender su estructura (comprobación de valores nulos, únicos y atípicos) y definir las reglas de negocio "limpias" para garantizar la calidad.
* Estandarización: Implementar lógica de transformación mediante Polars y DuckDB para estandarizar diversos conjuntos de datos (por ejemplo, conversión de monedas a USD).
Buscamos un profesional proactivo con experiencia en Python y un profundo conocimiento de los principios de ETL y calidad de datos para unirse a nuestro equipo en crecimiento.
Category: IT & Programming Subcategory: Data Science Project size: Medium
Skills
Want AI to find more roles like this?
Upload your CV once. Get matched to relevant assignments automatically.