Clasificación automatizada de tierras de área amplia en Australia con Machine learning

Agricultura
Agua

El estado de Queensland, en el noreste de Australia, es notablemente diverso geográficamente. Incluye bosques tropicales costeros, bosques de eucaliptos y acacias, sabanas tropicales, efímeros ríos interiores, desiertos y ricos cinturones agrícolas. Con un área de 1,730,000 kilómetros cuadrados, es aproximadamente siete veces el tamaño de Gran Bretaña.

Para mapear y evaluar los patrones de uso de la tierra y los cambios en todo el estado, el Departamento de Medio Ambiente y Ciencia de Queensland (DES) formó el Programa de Mapeo de Uso de la Tierra de Queensland (QLUMP) hace más de 20 años.

El mapeo y la evaluación de los patrones de uso de la tierra y los cambios en todo Queensland solían ser un proceso que requería mucho tiempo y recursos. Pero con el aprendizaje automático (Machine learning), el Centro de Teledetección DES ha reducido la cantidad de tiempo necesario para clasificar el uso de la tierra en grandes extensiones de tierra, y ha logrado que el algoritmo alcance una tasa de precisión del 97 por ciento.

 

«El uso de la tierra ha sido identificado como un conjunto de datos espaciales fundamentales que el gobierno considera vital para la progresión y el desarrollo de Queensland», dijo Andy Clark, científico principal del Centro de Teledetección DES. “El estado es grande y es importante que continuemos mejorando la velocidad a la que recopilamos estos datos, así como su precisión. Además, debemos mantener nuestros procedimientos de acuerdo con los estándares establecidos por el Sistema de Clasificación de Manejo y Uso de Tierras de Australia para que sea coherente con los datos recopilados en todo el país «.

Tradicionalmente, la metodología utilizada para mantener actualizado QLUMP se basaba en un equipo de científicos espaciales expertos para digitalizar manualmente las entidades del uso de la tierra a partir de imágenes satelitales. Debido al tamaño de Queensland, este proceso tomaba mucho tiempo y recursos.

«Anteriormente, hemos hecho varios intentos de automatizar QLUMP, que finalmente no tuvieron éxito», dijo Clark. “Se utilizaron modelos de árboles de decisión para inferir características del uso de la tierra a partir de datos auxiliares; sin embargo, este método no proporcionó una representación precisa de lo que estaba en el terreno. Intentamos usar la información espectral de las imágenes satelitales para realizar una clasificación supervisada, pero determinamos que este procedimiento no podía distinguir con éxito las entidades porque, espectralmente, parecen muy similares. Además, los análisis de imágenes basados en objetos tienden a ser tan intensivos en recursos como dibujar manualmente las características del uso de la tierra ”.

Sin embargo, en los últimos años, el aprendizaje automático (Machine learning), una subdisciplina de la inteligencia artificial (IA), ha progresado hasta el punto de que el uso de la visión por computadora y el aprendizaje profundo en el análisis y clasificación de imágenes ahora es viable.

«Con herramientas de programación avanzadas y hardware de computadora, la velocidad y las capacidades requeridas para aplicar con éxito el aprendizaje automático para clasificar con precisión grandes áreas de tierra parece muy prometedor», dijo Clark.

De hecho, él y su equipo desarrollaron un modelo que puede clasificar automáticamente diferentes tipos de uso de la tierra en todo Queensland. Así es como lo hicieron funcionar.

Refinando los datos y entrenando el proceso

Se requiere mucha información para entrenar un modelo para que haga aprendizaje automático. Afortunadamente para DES, había estado usando QLUMP durante años para recopilar datos.

«Era solo una cuestión de refinarlo para que pudiera usarse en el proceso de aprendizaje automático», dijo Clark.

 

El Departamento de Medio Ambiente y Ciencia de Queensland (DES) creó un modelo de visión por computadora que utiliza el aprendizaje automático para mapear las plantaciones de plátanos en la cuenca del río Johnstone.

 

Utilizó ArcGIS Pro y ArcPy para generar y refinar los datos de entrenamiento. Clark también aplicó una variedad de herramientas de geoprocesamiento para postprocesar la probabilidad de predicción del modelo de visión por computadora.

«La herramienta Reclasificar se utilizó para convertir la predicción en un ráster binario», explicó. “Ráster a polígono se usó para convertir los datos a una clase de entidad. Unión se utilizó para derivar el cambio. Y Eliminar se usó para fusionar entidades pequeñas en otras más grandes «.

El equipo de QLUMP verificó independientemente la precisión del proceso al generar miles de puntos al azar y evaluar el uso de la tierra en cada punto.

«ArcGIS Pro también genera la matriz de errores para nosotros, así como la creación y publicación de mapas web, aplicaciones e informes para comunicarnos con nuestros grupos de interés», agregó Clark.

En el proceso de aprendizaje automático, DES utiliza una red neuronal convolucional (CNN) basada en una arquitectura U-net para ayudar al modelo a reconocer visualmente la cobertura del suelo. Estas CNN son algoritmos que imitan las funciones del cerebro humano. Al estar expuesto a grandes cantidades de datos visuales, el modelo puede aprender a distinguir entre similitudes y diferencias en los datos.

«Tomamos prestada la idea de Olaf Ronneberger, quien la desarrolló para la segmentación de imágenes biomédicas, que es una forma de identificar células en imágenes de microscopía», explicó Clark. «Usando esta arquitectura, creamos un algoritmo con 87,153,153 parámetros».

El equipo alimentó iterativamente miles de parches de imágenes satelitales a través de la red neuronal para producir una predicción. Luego, el algoritmo autoevaluó y refinó la predicción, y el ciclo se repitió hasta que finalmente alcanzó una tasa de precisión del 97 por ciento.

El modelo muestra cómo el uso de la tierra ha cambiado con el tiempo. Este ejemplo muestra cómo una plantación de plátanos en el norte de Queensland se ha transformado de 2015 a 2018.

 

«Python se utilizó para desarrollar la parte de visión por computadora del proyecto», dijo Clark. “Utilizamos NumPy, una biblioteca con una gran colección de funciones matemáticas de alto nivel para Python, para manejar la matriz multidimensional, y la Biblioteca de Abstracción de Datos Geoespaciales (GDAL) para leer las imágenes y convertirlas a la matriz NumPy, el formato requerido para la red neuronal «.

GDAL puede tomar una matriz de salida y convertirla nuevamente en una imagen.

«Hubo un pequeño componente de lectura de datos vectoriales de GDAL, pero ArcGIS Pro fue la herramienta principal para procesar vectores», dijo Clark. “También utilizamos Keras, una biblioteca de Python, para desarrollar y evaluar modelos de aprendizaje profundo. TensorFlow corrió en la parte de atrás. Es una biblioteca de inteligencia artificial para el flujo de datos y la creación de redes neuronales a gran escala «.

En el aprendizaje automático, debido a la cantidad de datos que deben procesarse y refinarse rápida y repetidamente, la velocidad de procesamiento es crítica. Es por eso que DES está utilizando ocho unidades de procesamiento de gráficos (GPU) Tesla V100 que están conectadas a su infraestructura informática de alto rendimiento para el procesamiento de datos de aprendizaje profundo (Deep learning).

«La velocidad de procesamiento es increíble», dijo Clark. «Cada GPU nos proporciona esencialmente el equivalente a un año de procesamiento de CPU convencional en aproximadamente 2.5 días».

Expandiendo el aprendizaje automático a otros usos de la tierra

Originalmente, el modelo fue entrenado para identificar y mapear las plantaciones de plátanos en la cuenca del río Johnstone en el norte de Queensland. Luego se usó para inferir plantaciones de plátanos en la cuenca de Tully. Esto permitió a los científicos involucrados en el análisis de imágenes centrarse en la interpretación de las imágenes que produce el modelo para que puedan informar mejor a los responsables de la toma de decisiones del departamento sobre las respuestas de bioseguridad adecuadas a las enfermedades de las plantas.

Panama Tropical Race 4 es una enfermedad grave que puede propagarse rápidamente a través de una plantación de plátanos. En 2015, el Departamento de Agricultura y Pesca de Queensland (DAF) lo detectó al examinar muestras de plantas.

Después de un brote de Panama Tropical Race 4 en 2015, DES tuvo que implementar medidas de bioseguridad en ciertas plantaciones de plátanos.

 

En ese momento, DES no había implementado su proceso de análisis de imágenes basado en visión por computadora. Por lo tanto, determinar la propagación potencial del hongo generalizado requirió un equipo de cinco científicos por año para mapear y analizar manualmente todas las plantaciones de plátanos y otras clases de uso de la tierra en Queensland.Los esfuerzos de mapeo de estos científicos se utilizaron posteriormente para ayudar a entrenar el modelo CNN. En 2019, DES recibió nuevas imágenes y actualizó el mapeo de las plantaciones de plátanos, que tardó cuatro días en completar la computadora. Debido a su velocidad y precisión, el modelo CNN se está entrenando actualmente para mapear otras clases de uso de la tierra.

Los esfuerzos de mapeo de estos científicos se utilizaron posteriormente para ayudar a entrenar el modelo CNN. En 2019, DES recibió nuevas imágenes y actualizó el mapeo de las plantaciones de plátanos, que tardó cuatro días en completar la computadora. Debido a su velocidad y precisión, el modelo CNN se está entrenando actualmente para mapear otras clases de uso de la tierra.

«La visión por computadora en fusión con la supercomputación de alto rendimiento e integrada con ArcGIS representa un cambio de paradigma que aumenta nuestra capacidad de recopilar y publicar información oportuna sobre el uso del suelo», dijo Clark. «Los métodos son sostenibles para cualquier tarea de segmentación de imágenes y se han aplicado al mapeo de vegetación arbolada en Queensland, que es una aplicación bastante diferente, ya que estas áreas van desde densas selvas tropicales hasta paisajes de árboles dispersos».

DES tiene la intención de expandir sus métodos a la mayoría de los usos de la tierra, incluidos otros tipos de cultivos, plantaciones forestales y clases urbanas de uso de la tierra.

“Cualquier cosa que puedas ver en las imágenes, puedes entrenar un algoritmo para encontrarlo. Solo necesita muchos datos de capacitación de buena calidad ”, dijo Clark. «Basada en los métodos desarrollados hasta la fecha, la visión por computadora tiene la capacidad de aportar eficiencia a los programas de mapeo y monitoreo de áreas extensas que informan el manejo de los recursos naturales por parte de organizaciones gubernamentales y no gubernamentales».

 

Noticias – Esri Inc.

comentarios

0