Usa herramientas de ENVI para crear imágenes etiquetadas para Deep Learning

Agricultura
Agua

Con el lanzamiento del módulo ENVI Deep Learning, el proceso de extracción de entidades de las imágenes se ha vuelto mucho más simple para los usuarios de teledetección. Parte de esta simplicidad proviene de la capacidad de usar las herramientas de pre-procesamiento y análisis espectral de ENVI para crear conjuntos de datos etiquetados. ¿Por qué pasar tantas horas dibujando tediosamente regiones de interés (ROI) en torno a entidades de ejemplo, cuando podría automatizar parcialmente el proceso de etiquetado? En este artículo, mostraré un ejemplo en el que utilicé imágenes de relación de banda para crear conjuntos de datos etiquetados para el entrenamiento y la validación de un modelo de aprendizaje profundo (deep learning) para buscar entidades artificiales (hechas por el hombre) en imágenes aéreas.

Descargué 16 imágenes adyacentes del Programa Nacional de Imágenes Agrícolas (NAIP) del sitio USGS EarthExplorer. Estas fueron imágenes de 1 metro y cuatro bandas de una región del norte de San Antonio, Texas, EEUU, adquirida en octubre de 2016. Utilicé la herramienta ENVI Seamless Mosaic para crear rápidamente un mosaico georreferenciado a partir de las imágenes. Luego creé dos subconjuntos espaciales a partir del mosaico: uno para entrenamiento y otro para validar que el modelo de aprendizaje profundo aprende correctamente las características que me interesan. Mi objetivo final era extraer del mosaico NAIP todos los caminos, tierra removida, estructuras y otras características que indicaran el desarrollo humano.

 

Normalmente dibujaría ROIs de polilíneas y polígonos sobre todas las entidades incorporadas en las imágenes de entrenamiento y validación. Sin embargo, intenté un proceso más rápido en su lugar:

 

  1. Crear una imagen de relación de banda azul / casi infrarrojo que resalte estas características mientras suprime la firma espectral de la vegetación.

  1. Aplicar un estiramiento lineal del 5% a la imagen de relación usando Run task > Linear percent stretch raster, en la Caja de herramientas ENVI. Esto proporcionó aún más contraste entre las entidades integradas y el fondo.

 

  1. Crear una capa de umbral de ROI a partir de la imagen estirada, donde los valores de píxeles superiores a 200 se resaltan en rojo.

 

  1. Usar la tarea Run task > Convert ROIs to classification, en la Caja de herramientas ENVI para convertir el resultado en una imagen de clasificación.

El resultado proporcionó un buen punto de partida para identificar los píxeles de entidades en las imágenes de entrenamiento y validación, sin requerir ningún dibujo o etiquetado a mano. El resultado no fue perfecto, por lo que se necesitaba un mínimo de edición extra. Utilicé la herramienta Edit classification image, para eliminar píxeles clasificados incorrectamente, como sombras y agua, y agregué varios píxeles más a la clase «acumulada».

  1. Usar la herramienta Deep Learning > Build label raster from classification, para crear un ráster de etiquetas a fin de entrenar un modelo de aprendizaje profundo.

 

Todo el proceso de los pasos 1 al 5 sólo tardó unos 20 minutos, y además tuvo el beneficio adicional de definir las formas de las entidades integradas en lugar de sólo marcar sus ubicaciones. El entrenamiento de un modelo de aprendizaje profundo para identificar estas entidades tomó 30 minutos adicionales en mi sistema con una tarjeta gráfica de 8 GB. Luego usé el modelo entrenado para clasificar todo el mosaico NAIP, que solo tomó unos minutos. Aquí hay una muestra de la imagen de activación de clase resultante. El modelo aprendió a identificar casi todas las entidades integradas, que se muestran en blanco a continuación:

Aquí hay una comparación entre una muestra de mosaico NAIP y la correspondiente imagen de activación de clase:

La aplicación de un sector de color ráster a la imagen de activación de clase muestra las áreas con la mayor probabilidad (rojo-naranja) de pertenecer a la clase «integrada». Se pueden entrenar y aplicar modelos similares para extraer tejados y superficies impermeables a partir  de imágenes que cubren amplias áreas geográficas.

Para concluir, la amplia variedad de herramientas de procesamiento de imágenes en ENVI puede ayudar a acelerar el proceso de preparación de datos para el Deep Learning. Un ejemplo sería usar herramientas de detección de objetivos, como el Adaptive coherence estimator (ACE), o el Matched filter, para etiquetar las entidades de interés en las imágenes hiperespectrales. Otras herramientas espectrales que pueden resaltar efectivamente los objetos en las imágenes incluyen Spectral indices, Principal component analysis y Dimensionality expansion.

Jason Wolfe

L3HARRIS Geospatial Solutions

comentarios

0