Aug 7, 2016

Como profesional involucrado con el procesamiento de datos espaciales, he encontrado que muchos de los principios y buenas prácticas propuestos en Data Science pueden ser incorporados en el campo de los SIG y el procesamiento de imágenes para lograr mejorar los procesos de manejo y análisis de datos. Por ello, algunos de los posts que he publicado previamente en mi blog, entre ellos el de la aplicación de Machine Learning a la clasificación de imágenes y el de la implementación de análisis espaciales reproducibles, han sido escritos con el propósito de acelerar la adopción de prácticas de Data Science en la profesión de la geomática.

Como parte de este esfuerzo continuo, y gracias a la invitación de Raúl Jiménez, coordinador de la comunidad de GeoDevelopers, recientemente di una charla, en formato webinar, sobre cómo Data Science puede ser aplicado a los datos espaciales. GeoDevelopers es una comunidad virtual muy activa y colaboradora con más de 800 desarrolladores SIG que comparten y crean contenido en temas como el desarrollo de apps geoespaciales, servicios en la nube y el procesamiento de datos, entre muchos otros.

Spatial Data Science con R


Contenido del webinar y materiales relacionados

El webinar fue grabado en video y ya está disponible en YouTube como lo puedes ver más abajo. En la primera sección de la charla (min. 2:54) empiezo describiendo qué es Spatial Data Science y qué habilidades necesita tener un científico de datos espaciales. Luego explico qué características ofrece R para la realización de análisis espaciales y hago una breve introducción de las clases de R definidas para manejar datos espaciales.

En la segunda parte (min. 16:37) se presentan cada una de las fases de un proceso de Spatial Data Science a través de ejemplos prácticos ejecutados usando el lenguaje R, a saber:

  • + Acceso a los datos
  • + Preparación y transformación de los datos
  • + Exploración de datos
  • + Modelación de datos
  • + Visualización y comunicación de resultados

En la última parte (min. 44:03) hablo sobre reproducibilidad en Spatial Data Science y presento ejemplos de cómo integrar el lenguaje R con algunos de los principales software SIG, incluyendo ArcGIS y QGIS.

A continuación puedes ver el video del webinar:


Aquí puedes ver las diapositivas de la presentación:


En esta página puedes encontrar los ejemplos de demostración de la aplicación del lenguaje R a Spatial Data Science, que están relacionados con las diapositivas 14 a 18, como se muestra después del minuto 16:37 en el video.

El documento original escrito en RMarkdown (.Rmd) para estos ejemplos, así como los datos de muestra, se pueden descargar desde este link. Una vez descargues los materiales, deberías poder reproducir todos los ejemplos presentados en la charla ejecutando los fragmentos de código del archivo .Rmd, como se explica en el video. Las diapositivas del webinar pueden ser descargadas desde este link.

Espero que esta charla te brinde nuevas ideas sobre cómo mejorar el procesamiento de datos geospaciales a través de la sinergia con Data Science. Hay mucho sobre qué discutir respecto a Spatial Data Science, asi que me encantaría conocer tus opiniones sobre este tema. Nos vemos en la sección de comentarios!


También te puede interesar:

* Análisis espaciales reproducibles con ArcPy y R usando Jupyter Notebook

* Clasificación de imágenes con RandomForests en R (y QGIS)


Comparte este post:   



Subscríbete a mi blog y obtén la guía con los '50 mejores plugins de QGIS de 2016'