Método de reconocimiento de texto en imágenes naturales
Fecha
2021-11-11Autor
Vergara Villegas, Osslan Osiris
Metadatos
Mostrar el registro completo del ítemResumen
El reconocimiento de texto en imágenes naturales es una tarea que presenta retos, como la complejidad del fondo, variación de colores, iluminación y perspectiva. Para enfrentarlos, se han usado diversas técnicas, incluyendo métodos de detección de regiones (como MSER y SURF), análisis semántico y los métodos más recientes utilizan técnicas de aprendizaje profundo. En este trabajo se presenta implementa un método de reconocimiento de texto en imágenes naturales, aplicando segmentación semántica. El método propuesto utiliza dos técnicas de segmentación: primero, se aplica una FCN (siglas en inglés de fully convolutional network) para simplificar la imagen, separando el fondo del texto; y, posteriormente, se utiliza una red residual para etiquetar los pixeles de los caracteres utilizando la información de sus vecinos. Para disminuir el tiempo de procesamiento al efectuar la clasificación de los píxeles de la imagen, se introduce un método para reducir el número de pixeles a evaluar. Mediante la separación del fondo del texto y la reducción del número de píxeles a procesar, el esfuerzo requerido disminuye entre un 20 % a 60 %, dependiendo de la complejidad de las imágenes. De esta forma se facilita el uso de técnicas complejas de clasificación de los píxeles de los caracteres en la imagen.
Colecciones
- Memoria en abstract [184]