Pulso Digital

Una de las características más importantes de la Geografía es su interés en las características locales y en el efecto que tienen estas sobre diferentes procesos ¿Cuál es el efecto de la historia y la cultura local en los resultados electorales? ¿Cómo influencia la cohesión social de un vecindario la cantidad de delitos cometidos localmente?

Este tipo de preguntas que relacionan la escala local, el contexto geográfico, con una variedad de fenómenos son muy interesantes porque, por un lado, la escala local es la que está más directamente relacionada con la experiencia cotidiana de los habitantes de una ciudad y, por otro lado, en esa escala es posible intervenir, desde el gobierno o la sociedad civil, para mejorar las condiciones de vida de los ciudadanos.

Problemas como la delincuencia, la inequidad social o la resiliencia frente a desastres, tienen características locales que hacen que tengan diferentes expresiones en el territorio. Entender estas diferencias es fundamental, tanto para la investigación académica como para el desarrollo de soluciones útiles para la sociedad.

Tomando en cuenta lo anterior, en el Laboratorio Nacional de Geointeligencia se está desarrollando un proyecto que pretende servir como base para utilizar el concepto geográfico de lugar en diferentes investigaciones y aplicaciones. La idea es integrar una gran base de datos con diversas fuentes de información, tanto de fuentes oficiales como de redes sociales y medios escritos para desarrollar una plataforma que permita generar contextos locales: dado un evento determinado, asociar variables cualitativas y cuantitativas que describan el entorno local en que sucedió dicho evento.

Una característica común de los fenómenos geográficos es su heterogeneidad espacial, es decir, la variación en las relaciones causales que producen las variables observadas. Por esta razón, los modelos predictivos estacionarios suelen proporcionar resultados pobres al utilizarse en fenómenos geográficos.

Para entender la dinámica de eventos espacio-temporales determinados, como ocurrencias de delitos, es importante conocer el contexto geográfico en el que estos ocurren e incluir, a través de éste, la variación espacial de las variables explicativas. En este sentido, una parte importante de la Geointeligencia es la construcción de modelos que permitan asignar a un evento determinado las variables de contexto geográfico relevantes. En la Figura 1 se muestra, en su forma más general, la operación de un modelo de contexto geográfico:


Figura 1.- Operación de un modelo de contexto geográfico

Dado un evento espacio-temporal, el contexto geográfico está definido por dos modelos complementarios que dependen del problema específico. En primer lugar tenemos al modelo de vecindad que define la extensión del espacio geográfico donde el evento influye. En el caso más sencillo la vecindad se puede entender como un buffer (área circular) alrededor del evento; sin embargo, en general, es posible usar modelos de conectividad más sofisticados como áreas de influencia basadas en redes de transporte o cobertura celular, por ejemplo. En segundo lugar se necesita un modelo de variables que defina qué elementos geográficos deben ser asignados al evento, esto es, cuáles son las variables más relevantes que nos ayudan a entender la variación espacial de los eventos que se estén estudiando. En la siguiente figura (Figura 2), se muestra la asignación de variables (determinadas por los puntos de diferentes colores) a un evento (representado con la estrella) a través de buffers de diferentes radios (líneas punteadas).


Figura 2.- Ejemplo de asignación de variables (puntos) a un evento determinado (estrella)

En términos generales, la asignación de variables de contexto geográfico a bases de datos de eventos espacio-temporales o a eventos registrados en tiempo real (como llamadas a Locatel o al 911) nos permite la construcción de modelos de Geointeligencia que capturen mejor la heterogeneidad espacial, aportando elementos adicionales para su aplicación en los procesos de toma de decisiones..

Debido a las observaciones anteriores, resulta fundamental, en términos de desarrollo tecnológico, el desarrollo de un servicio digital que permita, de manera automática, la asignación de variables geográficas a un evento a través de un modelo de vecindad mediante la extracción de conocimiento de bases de datos comprehensivas que incluya fuentes oficiales de información (p.e. censo, denue, catastro, etc.) fusionada con información derivada de redes sociales (p.e. Twitter, Facebook o Instagram), de motores de recomendación (p.e. Yelp o TripAdvisor) o de información de la ciudadanía obtenida por medio de aplicaciones móviles.

La cantidad de datos generada todo el tiempo en una ciudad supera por mucho nuestra capacidad de análisis, hacer sentido de estos datos y aprovecharlos en diferentes ámbitos de la sociedad requiere contar con herramientas que nos permitan pasar de la gran cantidad de datos a información relevante.

Fuentes de datos como los tweets georreferenciados o las llamadas del 911, que además de las coordenadas espacio-temporales tienen asociados textos cortos, requieren de un tratamiento especial que, además de métodos de procesamiento geográfico, incorporen técnicas de Procesamiento de Lenguaje Natural, para explotar su potencial.

  • En GeoInt se han desarrollado metodologías de análisis que permiten obtener resúmenes geográficos a partir de grandes volúmenes de datos. Estos resúmenes geográficos nos permiten:
  • Identificar los patrones regulares de actividad ¿cómo se distribuyen espacialmente los usuarios de Twitter a lo largo del día? ¿qué zonas de la ciudad concentran los reportes del 911?
  • Capturar los temas de conversación predominantes en diferentes zonas de la ciudad
  • Detectar eventos inusuales como concentraciones inusuales de usuarios de Twitter, cambios en el contenido normal de las conversaciones o un alza en la incidencia de reportes del 911
  • El Pulso Digital de la Ciudad integra en una misma plataforma de análisis y visualización diferentes modelos desarrollados por GeoInt para producir información concisa y útil para usuarios interesados en capturar la dinámica diaria de la ciudad.

@DATANLAB

Página del proyecto aquí