POSTS


  • Dec 11, 2016

    Búsqueda y descarga automatizada de imágenes satelitales con SkyWatch

    Durante las últimas semanas he estado probando un API desarrollado por SkyWatch que ofrece un fácil acceso a varios datasets climáticos y atmosféricos y a imágenes satelitales, incluyendo Landsat-8 y Sentinel-2. El API de SkyWatch permite buscar datasets por parámetros como fecha, localización, fuente de datos (ya sea sensor o el satélite) o cobertura de nubes, entre otros.

    He desarrollado un paquete de R llamado SkyWatchr para facilitar las consultas al API y la descarga de los datasets seleccionados. En este post explico la instalación del paquete SkyWatchr y presento algunos ejemplos del uso de las funciones que he incluido en el paquete hasta ahora.

    Leer más ...


  • Oct 22, 2016

    Mejorando la exactitud en la clasificación mediante ensamble de modelos

    Cuando tomé los cursos de la especialización de Data Science en Coursera, uno de los métodos que me pareció más interesante fue el ensamble de modelos, el cual busca incrementar la exactitud a partir de la combinación de las predicciones de múltiples modelos.

    En estos días que he estado trabajando en el procesamiento de algunas imágenes Landsat para la investigación de mi tesis, ha sido la oportunidad perfecta para probar esta técnica y evaluar si puede ayudar a mejorar los resultados de las clasificaciones de coberturas que tengo que realizar. En los siguientes párrafos explico los pasos que seguí y algunas de las lecciones que aprendí durante mi primer experiencia de ensamble de modelos.

    Leer más ...


  • Sep 20, 2016

    Por qué es importante trabajar con datos balanceados para clasificación

    Cuando se realiza clasificación supervisada con algoritmos de machine learning como RandomForests, una práctica que se recomienda es trabajar con un dataset de clasificación balanceado. Sin embargo, algunas veces esta recomendación se ignora debido a que se desconoce su relevancia o no se tiene conocimiento sobre cómo llevarla a cabo.

    El propósito de este post es, primero, examinar algunas de las consecuencias de trabajar con un dataset desbalanceado usando un ejemplo de clasificación de imágenes, y segundo, probar y sugerir algunas técnicas para corregir este problema.

    Leer más ...


  • Aug 7, 2016

    Introducción a Spatial Data Science con R

    Como profesional involucrado con el procesamiento de datos espaciales, he encontrado que muchos de los principios y buenas prácticas propuestos en Data Science pueden ser incorporados en el campo de los SIG y el procesamiento de imágenes para lograr mejorar los procesos de manejo y análisis de datos. Por ello, algunos de los posts que he publicado previamente en mi blog, entre ellos el de la aplicación de Machine Learning a la clasificación de imágenes y el de la implementación de análisis espaciales reproducibles, han sido escritos con el propósito de acelerar la adopción de prácticas de Data Science en la profesión de la geomática.

    Como parte de este esfuerzo continuo, y gracias a la invitación de Raúl Jiménez, coordinador de la comunidad de GeoDevelopers, recientemente di una charla, en formato webinar, sobre cómo Data Science puede ser aplicado a los datos espaciales. GeoDevelopers es una comunidad virtual muy activa y colaboradora con más de 800 desarrolladores SIG que comparten y crean contenido en temas como el desarrollo de apps geoespaciales, servicios en la nube y el procesamiento de datos, entre muchos otros.

    Leer más ...


  • Jun 29, 2016

    Análisis espaciales reproducibles con ArcPy y R usando Jupyter Notebook

    Reproducibilidad, la capacidad de un estudio de ser replicado, es uno de los conceptos centrales en lo que se conoce como ciencia de datos (o Data Science). Si bien preparar análisis de datos de tal forma que sean reproducibles no es una tarea trivial, hacerlo puede conducir a un conjunto de beneficios para el analista o investigador haciendo su trabajo mucho más eficiente: puede ayudar a ahorrar tiempo a través de la reutilización de código y de resultados de estudios anteriores al igual que a través de la aplicación sobre datos nuevos de metodologías establecidas previamente.

    Entre las diferentes herramientas que han sido desarrolladas para ayudar a la implementación de análisis reproducibles, los notebooks interactivos han ido ganando en popularidad y aceptación. Estos son ambientes computacionales basados en la web en los cuales es posible integrar fragmentos de código, texto descriptivo, gráficos y multimedia. En este post me enfoco en la herramienta Jupyter Notebook y describo particularmente cómo usarla para crear reportes reproducibles que combinen análisis geoespaciales basados en ArcPy y R. En las siguientes secciones explico cómo instalar y configurar Jupyter Notebook para trabajar con ArcPy y R, y posteriormente presento un ejemplo práctico.

    Leer más ...


  • May 28, 2016

    Mapeando tweets: Cómo crear tu propia aplicación web

    Una de las razones por las cuales Twitter es tan popular es porque se ha convertido en un excelente medio para obtener datos para proyectos y aplicaciones web. A través de su interfaz de programación de aplicaciones (API) para búsquedas (Search API), es posible encontrar contenido a partir de consultas en Twitter con base en términos de búsqueda. Los resultados pueden ser analizados o visualizados posteriormente usando herramientas de software complementarias.

    El propósito de este tutorial es aprender cómo crear una aplicación web interactiva que obtenga tweets geocodificados y los muestre en un mapa. Suena interesante? Para facilitar la creación de la aplicación vamos a usar Shiny, un paquete de R útil para desarrollar aplicaciones web. Veamos cómo podemos crear nuestra app de una manera sencilla.

    Leer más ...


  • Apr 30, 2016

    arcgisbinding: Evaluando la nueva interfaz de ArcGIS para el lenguaje R

    Hace un par de meses ESRI hizo pública una nueva librería para conectar ArcGIS y R, la cual fue diseñada con el propósito de facilitar el manejo y procesamiento de datos de ArcGIS para los usuarios de R, y al mismo tiempo, hacer más sencillo para los usuarios de ArcGIS la incorporación de las poderosas herramientas de análisis de R en sus flujos de trabajo.

    Esta nueva librería parece bastante prometedora, por lo cual he escrito un breve tutorial para aprender, e igualmente para probar, las capacidades de la misma para integrar dos de los más importantes proyectos de los campos de los SIG y el análisis de datos. En este post describo cómo instalar la librería y cómo crear y ejecutar una herramienta que combina datasets de ArcGIS con las funcionalidades existentes en algunos paquetes de R para abordar el modelamiento de distribución de especies dentro del ambiente de ArcGIS. Arranquemos!

    Leer más ...


  • Nov 28, 2015

    Clasificación de imágenes con RandomForests en R (y QGIS)

    El objetivo de este post es demostrar las capacidades de R para clasificar imágenes multiespectrales usando los algoritmos conocidos como RandomForests. Estos algoritmos son actualmente una de las técnicas que producen mejores resultados para la regresión y clasificación de datos. Aunque su interpretabilidad puede ser un tanto difícil, estos algoritmos son ampliamente populares debido a su habilidad para clasificar grandes cantidades de datos con una alta exactitud.

    En las secciones siguientes describo cómo importar en R una imagen Landsat y cómo extraer los valores de los pixeles para entrenar y ajustar un modelo de RandomForests. También explico cómo acelerar la clasificación de las imágenes mediante procesamiento en paralelo. Finalmente presento cómo implementar estos algoritmos para clasificación de imágenes en QGIS usando los paquetes de R.

    Leer más ...


  • Oct 31, 2015

    Integración de QGIS y R: Un ejemplo con muestreo espacial estratificado

    QGIS, un software libre y de código abierto, se ha convertido en uno de los SIG (sistemas de información geográfica) líder del mercado. Gracias al trabajo de un grupo activo de desarrolladores, QGIS contiene módulos de geoprocesamiento similares a herramientas estándar que se encuentran en SIG privativos. Además, QGIS permite la lectura y escritura de la mayoría de formatos vector y raster, al tiempo que provee una interfaz a bases de datos como PostgreSQL/PostGIS, SpatiaLite y MySQL.

    Una de las características más atractivas de QGIS es su integración con otros paquetes estadísticos y SIG de código abierto. Actualmente, QGIS soporta SAGA, Orfeo Toolbox, GRASS GIS y R, lo cual expande ampliamente la funcionalidad de QGIS. En este post hago énfasis en la integración entre QGIS y R y explico cómo configurar el sistema de procesamiento de QGIS para ejecutar un algoritmo externo de R desde el módulo de procesamiento de QGIS.

    Leer más ...


  • Oct 3, 2015

    Prepara archivos para creación de imágenes de reflectancia en CLASlite usando R

    Una tarea muy común cuando se procesan imágenes satelitales para producir mapas de cobertura o analizar cambios multitemporales es la conversión de los datos registrados en cada píxel de la imagen a valores de reflectancia en la superficie. Este proceso se conoce como calibración a valores de reflectancia en superficie e involucra la calibración radiométrica y la corrección de distorsiones causadas por la atmósfera.

    Como se mencionó en la anterior entrada de mi blog, estas labores de procesamiento se pueden llevar a cabo con el programa CLASlite. En este post explico cómo automatizar la creación de los archivos de textos requeridos por CLASLite para la calibración de la imagen.

    Leer más ...


  • Sep 5, 2015

    Usando R para el apilamiento de imágenes en CLASlite

    CLASlite es un poderoso software de procesamiento de imágenes desarrollado por Carnegie Institution for Science que contiene herramientas para la calibración, preprocesamiento, corrección atmosférica, enmascaramiento de nubes, análisis de mezclas espectrales y clasificación.

    En este post describo cómo usar el lenguaje R para crear los archivos de texto requeridos por CLASlite para realizar el apilamiento (stacking) de imágenes a través de procesamiento por lotes. Esta es una aplicación simple para mostrarle a aquellos que están iniciando con R cómo hacer uso de funciones básicas de R tales como el listado de archivos y la implementación de bucles con el comando for.

    Leer más ...


  • Aug 11, 2015

    Mapeo web con Leaflet y R

    Leaflet es una librería de JavaScript my popular para la creación de mapas interactivos. Una forma de crear un mapa usando la librería JavaScript de Leaflet es incluir los archivos de la librería Leaflet y los archivos de estilo (CSS) en la cabecera de la página y luego definir la configuración del mapa en el cuerpo de la página html.

    Una forma alternativa es crear el mapa web usando un paquete desarrollado para el lenguaje R llamado leaflet, desarrollado por la gente de RStudio, el cual permite controlar e integrar mapas de Leaflet en R. En esta entrada del blog explico cómo leer en R un mapa vectorial en formato shapefile y cómo crear un mapa web con leaflet personalizando la forma en que el mapa vectorial es presentado. También describo cómo adicionar una legenda, un control para las capas y popups para desplegar datos de la tabla de atributos.

    Leer más ...


  • Aug 9, 2015

    Bienvenido a mi Blog!

    Hola! Bienvenido a mi blog: The R-Spatialist!

    Estaré escribiendo acerca de diferentes temas relacionados con los SIG y el procesamiento digital de imágenes tomadas por sensores remotos, así como sobre la aplicación de lenguajes de programación al procesamiento, visualización y análisis de datos espaciales, especialmente usando el lenguaje R.

    Leer más ...


Subscríbete a mi blog y obtén la guía con los '50 mejores plugins de QGIS de 2016'


Ver TODAS LAS ENTRADAS >>>