CompanyRemote

Ingeniero de Visión Artificial para Optimización de Detección de Ui...

Project-Based

Description

Buscamos un ingeniero de visión artificial altamente experimentado en Python y OpenCV para optimizar un flujo de trabajo de procesamiento de imágenes existente. Nuestro sistema actual se basa en OCR, que es computacionalmente costoso y limita significativamente el rendimiento. El objetivo principal de este proyecto es reemplazar el uso de OCR mediante la implementación de una solución eficiente de coincidencia de plantillas. Esto nos permitirá procesar un mayor número de imágenes por segundo con una latencia reducida y un coste operativo menor. Actualmente, contamos con código comentado que realiza la coincidencia de plantillas para algunas resoluciones, logrando más de 100 imágenes por segundo, lo que servirá como punto de partida.

El proyecto se centrará en la detección de elementos específicos de la interfaz de usuario (UI) en capturas de pantalla del juego Madden 2026, como 'Kickoff' y 'Final'.

Responsabilidades clave:

  • Desarrollar e integrar lógica de coincidencia de plantillas robusta utilizando Python y OpenCV para sustituir el OCR.

  • Obtener o generar capturas de pantalla adicionales de Madden 2026 en múltiples resoluciones de pantalla y relaciones de aspecto (por ejemplo, 1080p, 1440p, 4K, ultrawide) para validar la funcionalidad de detección.

  • Asegurar que la solución gestione correctamente los siguientes escenarios:

  • Casos positivos: Si 'Kickoff' o 'Final' están presentes, la solución debe devolver la ubicación de coincidencia (x, y, w, h) y una puntuación de confianza.

  • Casos negativos: Si la plantilla no está presente, la solución debe devolver un valor nulo o indicar una discrepancia, evitando falsos positivos.

Requisitos de la solución:

  • Alta precisión para evitar falsos positivos es crucial.

  • Capacidad para manejar diferentes resoluciones y escalado de la interfaz de usuario.

  • Adaptabilidad a ligeros cambios en la posición de los elementos de la interfaz de usuario.

  • Tolerancia a posibles diferencias de compresión en las imágenes.

  • Cobertura de diversas situaciones de coincidencia donde aparecen los textos 'Kickoff' o 'Final'.

  • Opcionalmente, se puede considerar el uso de OCR como un respaldo solo si la confianza de la coincidencia de plantillas es baja, pero el objetivo principal es minimizar su uso.

La API para devolver los resultados de detección ya está implementada. Su tarea consistirá únicamente en integrar la nueva lógica de visión artificial en esta infraestructura existente.

Category: IT & Programming Subcategory: Artificial Intelligence Project size: Medium

Skills

Machine LearningArtificial IntelligenceAPITestingPython

Want AI to find more roles like this?

Upload your CV once. Get matched to relevant assignments automatically.

Try personalized matching