Se desea tener una aplicación, desarrollada en Python, que realice la lectura de un video desde un archivo, y el cual identifique en el video que aplicaciones tiene la persona instalada en el computador, mediante segmentación de imágenes de los iconos que tiene en el escritorio.
Ejemplo: debe leer el video, el cual es el escritorio del usuario, y debe identificar que tiene el icono de Word, Excel, y Outlook.
Se requiere la utilización de entrenamiento de datos, segmentación de visión y algo de inteligencia artificial.
Los módulos propuestos son los siguientes:
Implementar un módulo para lectura de video desde archivo o captura de pantalla.
Implementar un módulo para la generación automática de datos de entrenamiento del sistema
Implementar un módulo para la segmentación de aplicaciones mediante una técnica de visión artificial o IA
Implementar un módulo para identificar la transición entre aplicaciones mediante una técnica de
Implementar un modelo para la identificación de las aplicaciones seleccionadas.
Integrar los módulos y validar la solución desarrollada.
Hola
Gracias por publicar los requisitos de su proyecto.
Estudiamos su requerimiento y lo entendemos.
Para entender más y aclarar nuestras dudas, queremos discutir con usted algunas preguntas.
Luego, envíenos un mensaje para que podamos revisarlo en detalle, proporcionar una estimación precisa y comenzar.
Gracias
Hola buen día Señor/Señora.
Tengo amplia experiencia en el procesamiento de video y la implementación IA. Al final del proyecto le entregaré un reporte de cómo se comporta la red neuronal en la identificación de los íconos mencionados (en términos de precisión y velocidad de procesamiento) en los VIDEOS que USTED me proporcione, hago énfasis en esto, porque será un reporte del ambiente real y no generales de la arquitectura. En un inicio también podemos evaluar la mejor arquitectura dependiendo de las capacidades de procesamiento de su hardware para tener el mejor equilibrio entre performance y precisión. En mi experiencia vamos a partir por usar Transfer learning para optimizar el aprendizaje y minimizar la cantidad de información necesaria para el entrenamiento. Adicionalmente cuento con un GPU para generar el primer modelo en cuestión de horas o minutos dependiendo del reporte de aprendizaje. Quedo atento a sus comentarios.
Hola puedo entregarte resultados de lo que buscas, realizaría el enlace entre python y una plataforma de Inteligencia artificial para reconocer los iconos.