<Presentaciones/>
Máquinas de aprendizaje para analis de datos geoespaciales en procesos de identificación de cobertura terrestre e índices. (Español)
Autores
Fecha y Hora
Sábado 08, 10:00
Sobre la ponencia
El procesamiento digital de imágenes está estrictamente ligado a los software y se ha convertido en una herramienta necesaria para procesar, analizar y presentar resultados, por este motivo, diferentes empresas y públicas han desarrollado proyectos para analizar y gestionar de una manera eficiente este tipo de información, una de ellas es el IDEAM que ha desarrollado la adaptación del OPEN DATACUBE de imágenes de satélite para Colombia, esta plataforma permite realizar el procesamiento, análisis y clasificación de las imágenes del cubo en lenguaje Python, por medio de algoritmos desarrollados que se conectan a la base de datos del cubo de datos de imágenes de satélite de Colombia, este cuenta con datos de sensores remotos ópticos y de radar tomadas periódicamente desde hace 19 años. Los datos del cubo cuentan con una estructura estándar y las bandas de las imágenes se pueden consultar como matrices en formato xarray , lo cual permite realizar operaciones y generar algoritmos sobre las imágenes digitales de una manera más sencilla. La industria del procesamiento digital de imágenes de satélite ha venido desarrollando una serie de algoritmos específicos para el tratamiento de las mismas en busca de la optimización de resultados, dentro de la propuesta actual se presenta una clasificación supervisada semiautomática en jupyter notebook con máquinas de aprendizaje (Machine Learning), utilizando librerías como scikit-learn y numpy. La metodología se desarrolla con la selección y apilamiento de imágenes consultadas del cubo de datos manteniendo la estructura de los distintos espectros(bandas espectrales) ejecutando algunas mascaras que permiten la mejora de los datos, posteriormente se emplean las maquinas de aprendizaje con una incorporación de modelos de entrenamiento o datos vector que servirán como insumo para la clasificación, en esta oportunidad se realiza la incorporación de varios clasificadores para obtener una imagen clasificada optimizada controlando cada paso en el procedimiento, finalmente con la imagen clasificada con coberturas se realiza una validación cruzada de resultados y una validación de exactitud temática, en comparación con los procesamientos de clasificación de otros tipos software, con esta metodología podemos emplear más de un insumo de entrada (diferentes imágenes o dem) y clasificar por más de un algoritmo, obteniendo mejores resultados temáticos sin perder la información de localización espacial de los insumos empleando la librería gdal. En conclusión el manejo de datos en plataformas como OPEN DATACUBE permiten una trazabilidad de los procesos y errores obtenidos en los mismos, obteniendo una identificación de la cobertura más acertada a la realidad con un seguimiento temporal de resultados realizando operaciones sobre los datos base que favorecen una la metodología de trabajo particular y resultante respecto al área específica de investigación.