Cuando el Deep Learning se encuentra con el GIS

Agricultura
Agua

El campo de la Inteligencia Artificial (AI) ha progresado rápidamente en años recientes, alcanzando, o en algunos casos superando, la exactitud humana en tareas tales como reconocimiento de imágenes, comprensión de lectura y traducción de textos. La intersección de la AI y el GIS está creando oportunidades masivas que no eran posibles antes. La AI, machine learning y deep learning nos están ayudando a mejorar el mundo, ayudando por ejemplo a aumentar la obtención de cultivos por medio de la agricultura de precisión, a combatir la delincuencia implementando modelos predictivos, y a predecir cuándo golpeará la próxima gran tormenta y estar mejor equipados para afrontarla.

Hablando en general, AI es la capacidad de las computadoras de realizar una tarea que típicamente requiere algún nivel de inteligencia humana. Machine learning es un tipo de motor que hace esto posible. Utiliza algoritmos de datos para aprender de éstos y darte las respuestas que necesitas. Un tipo de machine learning que ha emergido recientemente es deep learning. Deep learning usa redes neurales generadas por computadora, que están inspiradas por (y vagamente se asemejan a) el cerebro humano, para resolver problemas y hacer predicciones.

Machine learning en ArcGIS

Machine learning ha sido un componente central del análisis espacial en GIS. Estas herramientas y algoritmos han sido aplicadas a las herramientas de geoprocesamiento para resolver problemas en tres categorías amplias. Con la clasificación, puedes usar algoritmos vectoriales para crear capas de clasificación de cobertura de tierras. Otro ejemplo es el agrupamiento, que te permite procesar grandes cantidades de datos de puntos, identificar los conglomerados importantes dentro de ellos, y separarlos del ruido sobrante. Los algoritmos de predicción, tales como regresión geográficamente ponderada, te da la capacidad de modelar espacialmente las relaciones que varían. Estos métodos trabajan bien en varias áreas, y sus resultados son interpretables, pero necesitan expertos para identificar o nutrir esos factores (o entidades) que afectan el resultado que estamos intentando predecir.

El surgimiento del Deep Learning

¿No sería genial si las máquinas se dieran cuenta de cuáles son esos factores/entidades sólo con mirar los datos? Es allí que entra a tallar el deep learning. Está inspirado por (y vagamente se asemeja a) el cerebro humano. En una red neural profunda, hay neuronas que responden a estímulos y están conectadas entre ellas en capas. Las redes neurales han existido por décadas, pero ha sido un desafío el entrenarlas.

La llegada de deep learning puede deberse a tres desarrollos principales en años recientes: disponibilidad de datos, computación veloz y mejoras en los algoritmos.

Datos: Tenemos hoy vastas cantidades de datos, gracias a Internet, los sensores a nuestro alrededor y los numerosos satélites que toman imágenes de todo el mundo cada día.

Computación: Tenemos poderosos recursos computacionales, gracias a la computación en la nube y a las unidades de procesamiento gráfico (GPUs), que se han vuelto más poderosas que nunca y más económicas, gracias a la industria del gaming.

Mejoras en los algoritmos: Finalmente, los investigadores han respondido a algunos de los aspectos más desafiantes del entrenamiento de las profundas redes neurales a través de mejoras en los algoritmos y arquitecturas de red.

Aplicando visión computacional al análisis geoespacial

Un área de la AI en la que al deep learning le ha ido extremadamente bien es la visión computacional, es decir, la habilidad de las computadoras de ver. Esto es particularmente útil para los GIS, puesto que las imágenes satelitales, aéreas y de drones son producidas a una velocidad que hace imposible el analizarlas y sacar conclusiones a través de medios tradicionales.

La figura inferior muestra algunas de las más importantes tareas de visión computacional o casos de uso, y cómo pueden aplicarse a los GIS:

Tareas importantes de visión computacional son aplicadas a los GIS.

La más simple es clasificación de imagen, en la que la computadora asigna una etiqueta, tal como “perro” o “gato”, a una imagen. Esto puede usarse en los GIS para categorizar fotos geoetiquetadas. Una de las imágenes de arriba ha sido clasificada como multitud densa. Esta clasificación de actividades peatonales puede usarse para una planificación de gestión de tráfico y de peatones durante eventos públicos. Un ejemplo de esto fue demostrado en la sesión plenaria de la Conferencia de Usuarios Esri de 2018 por personal del Condado de Cobb, Georgia.

El Condado de Cobb, Georgia, lleva a cabo una planificación de los movimientos peatonales y de tráfico.

Con la detección de objetos, la computadora necesita encontrar objetos dentro de una imagen, así como su ubicación. Esta es una tarea muy importante en los GIS: encontrar lo que hay en las imágenes satelitales, aéreas o de drones, luego localizarlo y colocarlo en un mapa. Esto puede usarse para cartografía de infraestructuras, detección de anomalías y extracción de entidades.

Piscinas son detectadas en parcelas residenciales.

Otra tarea importante en la visión computacional es la segmentación semántica, en la que cada píxel de una imagen es clasificado como perteneciente a una clase en particular. Por ejemplo, en la primera imagen de este artículo, el gato está en los píxeles amarillos, los píxeles verdes pertenecen a la clase suelo, y el cielo está en azul. En los GIS, la segmentación semántica puede usarse para una clasificación de cobertura de tierras o para extraer redes de caminos a partir de imágenes satelitales.

La clasificación de cobertura de tierras utiliza deep learning.

Otro tipo de segmentación es la segmentación por instancia. Puede considerarse como una detección más exacta de objetos, en la que el borde preciso de cada instancia de objeto está marcado. La segmentación por instancia puede usarse para tareas como mejorar mapas base. Esto puede hacerse añadiendo huellas de edificios o reconstruyendo edificios 3D a partir de datos lidar.

El edificio de arriba (izquierda) fue reconstruido en 3D usando máscaras digitadas por editores humanos. El mismo edificio (derecha) fue reconstruido en 3D con las máscaras producidas por el modelo Mask R-CNN.

Deep learning para la cartografía

Al trabajar con imágenes satelitales, una aplicación importante del deep learning es crear mapas digitales extrayendo automáticamente las redes de caminos y las huellas de edificios.

Imagina el aplicar un modelo entrenado de deep learning en una gran área geográfica y llegar a tener un mapa con todos los caminos de la región, luego tener la capacidad de crear direcciones para manejar usando esta red de caminos detectados. Esto puede ser particularmente útil para países en desarrollo que no tienen mapas digitales de alta calidad, o en áreas donde se han construido nuevas urbanizaciones.

Los caminos pueden detectarse usando deep learning y luego convertirse a entidades geográficas.

Los buenos mapas necesitan más que sólo caminos: necesitan edificaciones. Los modelos de segmentación por instancia, como Mask R-CNN, son particularmente útiles para la segmentación de huellas de edificios, y pueden ayudar a crear huellas sin necesidad de digitación manual. Sin embargo, estos modelos usualmente resultan en huellas irregulares que se parecen más a obras de Antonio Gaudí que a edificios regulares con bordes rectos y ángulos rectos. El usar la herramienta Regularize Building Footprint en ArcGIS Pro puede ayudar a restaurar los bordes y ángulos rectos necesarios para una representación exacta de huellas de edificios.

Huellas de edificios extraídas de imágenes satelitales y regularizadas usando la herramienta Regularize Building Footprint en ArcGIS Pro.

Integrando ArcGIS con Inteligencia Artificial

ArcGIS tiene herramientas para ayudar en cada paso del flujo de trabajo de la ciencia de datos, incluyendo preparación de datos y análisis de datos exploratorios; entrenamiento del modelo; realizado de análisis espacial; y finalmente, diseminación de los resultados usando capas y mapas web, guiando la actividad en campo. Para añadir contexto y profundidad a tus análisis, puedes usar contenido del Atlas Vivo del Mundo, de ArcGIS. Esta gran colección de imágenes de Esri y proporcionadas por sus socios puede ser crítica para un flujo de trabajo de deep learning.

ArcGIS Pro incluye herramientas para ayudar con la preparación de datos para los flujos de trabajo de deep learning, y ha sido mejorado para implementar modelos entrenados para la extracción de entidades o la clasificación. ArcGIS Image Server en la versión 10.7 de ArcGIS Enterprise tiene capacidades similares, otorgando la capacidad de implementar modelos de deep learning a escala al aprovechar la computación distribuida.

Python ha surgido como un lenguaje común en el mundo de deep learning, con librerías populares como TensorFlow, PyTorch o CNTK siendo escogidas como lenguajes de programación de preferencia. ArcGIS API for Python y ArcPy. son naturalmente adecuados para integrarse a estas librerías de deep learning, dándote más capacidades.

Aunque este artículo ha tratado mayormente de imágenes y visión computacional, el deep learning puede usarse igualmente bien para procesar grandes volúmenes de datos estructurados, tales como observaciones de sensores, o atributos de una capa de entidades. Las aplicaciones de tales técnicas a los datos estructurados incluyen el predecir la probabilidad de accidentes, el pronóstico de ventas, y el enrutamiento y geocodificación en lenguaje natural.

Deep learning es un campo de rápido avance, y permite a los científicos de datos el apalancarse en las investigaciones de vanguardia, y al mismo tiempo aprovechar un GIS industrialmente robusto.

Rohit Singh

Director del Centro de Investigación y Desarrollo de Esri en Nueva Delhi

 

comentarios

0