Optimización de Visión Artificial con Python y Opencv para Detecció...
Description
Buscamos un ingeniero de visión artificial altamente experimentado en Python y OpenCV para optimizar un flujo de trabajo de procesamiento de imágenes existente. Nuestra implementación actual se basa en OCR, lo cual es computacionalmente costoso y limita significativamente el rendimiento del sistema. El objetivo principal es sustituir el uso de OCR por una solución de coincidencia de plantillas eficiente, permitiéndonos procesar un mayor número de imágenes por segundo con menor latencia y coste operativo. Actualmente, contamos con código comentado que ya realiza la coincidencia de plantillas para algunas resoluciones, logrando más de 100 imágenes por segundo.
El proyecto implica desarrollar e implementar una solución robusta de coincidencia de plantillas para detectar elementos específicos de la interfaz de usuario, como "Kickoff" y "Final", dentro del juego Madden 2026. Se proporcionaron capturas de pantalla de ejemplo de estos elementos para definir los objetivos de detección. El profesional deberá obtener o generar capturas de pantalla adicionales de Madden 2026 en múltiples resoluciones de pantalla y relaciones de aspecto (por ejemplo, 1080p, 1440p, 4K, ultrawide) para validar exhaustivamente que la detección funciona correctamente en diversas condiciones.
La solución debe gestionar de manera efectiva los siguientes escenarios:
Casos positivos:
Si el elemento "Kickoff" o "Final" está presente, la solución debe devolver la ubicación de la coincidencia (x, y, w, h) y una puntuación de confianza asociada.
Casos negativos:
Si la plantilla no está presente en la imagen, la solución debe devolver un valor nulo o indicar una discrepancia, asegurando la ausencia de falsos positivos.
Es crucial lograr una alta precisión para evitar falsos positivos. Opcionalmente, se podría recurrir al ocr solo si la puntuación de confianza de la coincidencia de plantillas es baja, aunque el objetivo primordial es minimizar la dependencia del ocr.
La solución debe ser capaz de manejar:
Diferentes resoluciones y escalados de pantalla.
Ligeros cambios en la interfaz de usuario, como variaciones en la posición de los elementos.
Diferencias de compresión en las imágenes, si las hubiera.
Diversas situaciones de coincidencia donde aparezcan los elementos "Kickoff" o "Final".
La API para devolver los resultados de detección ya está implementada, por lo que el enfoque será en la lógica de visión artificial y la integración de la nueva solución.
Category: IT & Programming Subcategory: Artificial Intelligence Project size: Medium
Skills
Want AI to find more roles like this?
Upload your CV once. Get matched to relevant assignments automatically.