68
Geographic Business Intelligence Francesc Puigvert i Pell

Geographic BI

Embed Size (px)

DESCRIPTION

Geographic BI

Citation preview

  • Geographic

    Business Intelligence

    Francesc Puigvert i Pell

  • ..

  • FUOC PID_00000000 3 Geographic Business Intelligence

    ndice

    INTRODUCCIN 5

    1. IMPORTANCIA DE LOS DATOS GEOGRFICOS EN LOS SISTEMAS DE BI 6

    2. SISTEMAS DE INFORMACIN GEOGRFICA 14

    3. LOS SIG EN LOS PROCESOS DE ANALTICA DE NEGOCIO 16

    3.1 Pblico objetivo y beneficios 16

    4. LOS DATOS GEOGRFICOS 18

    4.1 Componente espacial 18

    4.1.1 Localizacin 18

    4.1.2 Modelos de representacin 22

    4.1.3 Atributos espaciales 25

    4.1.4 Relaciones espaciales 25

    4.2 Componente temtico 27

    4.2.1 Clasificacin en funcin del modelo 27

    4.2.2 Clasificacin en funcin de la naturaleza 29

    4.3. Componente temporal 32

    5. COMUNICACIN CARTOGRFICA 33

    5.1.Mtodos de representacin cartogrfica 34

    5.1.1. Representacin simple 34

    5.1.2. Clasificacin por categorias 35

    5.2.Tcnicas de representacin en mapas 39

    5.2.1. Agrupaciones o Clustering 40

    5.2.2. Mapa de calor (Heatmap) 40

    5.2.3. Mapas de flujos 41

    5.2.4. Colores graduados o coropletas 42

    5.2.5. Smbolos graduados 43

    5.2.6. Puntos de densidad 44

    6. ANLISIS DE DATOS 45

    6.1.Operaciones de anlisis bsicas 45

    6.2.Operaciones de geomarketing 47

    6.2.1. Diseo del territorio 47

    6.2.2. Planificacin de Mercado 53

    7. FUENTES DE DATOS EXTERNAS 55

    7.1.Normalizacin para proveer de geolocalizacin 55

    7.2.Servicios de callejero 56

    7.3.Variables de mercado 58

    8. SOLUCIONES DE MERCADO 60

    8.1.SIG Tradicionales 60

    8.2.BI Tradicionales 62

    RESUMEN 64

    GLOSARIO 65

  • FUOC PID_00000000 4 Geographic Business Intelligence

    BIBLIOGRAFA 67

  • FUOC PID_00000000 5 Geographic Business Intelligence

    Introduccin

    Hoy en da es habitual que al comprar productos en determinadas tiendas, el cajero nos

    pregunte: - Cdigo Postal? La razn de esta pregunta es que, seguramente, la empresa

    realiza estudios de mercado con los datos de los clientes. Los objetivos pueden ser varia-

    dos, como por ejemplo, lanzar campaas ms efectivas por segmento de poblacin, iden-

    tificar el nicho para la ubicacin de nuevas tiendas o identificar tipos de cliente cruzando

    el cdigo postal con variables socio-econmicas tipo, como puede ser el nivel adquisitivo

    medio de los habitantes de un cdigo postal determinado.

    En estos materiales asumiremos que el lector ya conoce los procesos relacionados con la

    actividad de inteligencia de negocio y que ya sabe las aportaciones de las soluciones de

    Business Intelligence pueden proporcionar. El material se enfoca a las situaciones donde

    la actividad de inteligencia de negocio utiliza informacin geogrfica. En estos casos los

    Sistemas de Informacin Geogrfica son un elemento a tener en cuenta. A continuacin

    presentamos un conjunto de preguntas que un responsable de cuentas puede haberse

    hecho en su actividad profesional.

    Dnde puedo abrir mi nuevo negocio?

    Dnde elegir la mejor ubicacin sobre el territorio?

    Dnde estn localizados mis recursos?

    Dnde estn mis clientes potenciales?

    Desde qu zona domino el mercado?

    Dnde est localizada mi competencia?

    Existe alguna tipologa de clientes comn o siguen patrones distintos?

    Desde qu zona existe alguna correlacin entre los patrones?

    Tras que patrn existe alguna correlacin entre las distintas zonas?

    Existen zonas similares que ofrecen la misma productividad? Y productividad

    distinta?

    Qu zona me ofrece un mejor rendimiento?

    Tengo algn patrn que explique el comportamiento de mi empresa y lo puedo

    reproducir en una zona similar?

    Puedo replicar mi zona de xito en sitios con clientes similares?

    Cul es la mejor manera para distribuir la fuerza de ventas sobre el territorio?

    El material est enfocado a que el lector entienda cmo funciona la informacin geogr-

    fica y cmo integrarla en los sistemas de inteligencia de negocio para dar respuesta a

    preguntas similares a las anteriores.

  • 1. Importancia de los datos geogrficos en los sistemas de Business Inte-

    lligence

    Todos los elementos y eventos fsicos tienen una ubicacin determinada. Esa ubicacin,

    si puede almacenarse y procesarse puede ser muy til, no slo desde un punto de vista

    operativo, sino tambin en los procesos analticos. De hecho, la informacin geogrfica

    es relevante desde dos puntos de vista diferenciados: la representacin de informacin

    (para representar el lugar de ocurrencia de los hechos y agentes del mundo real) y la

    visualizacin de informacin (para mostrar un conjunto de datos teniendo en cuenta sus

    caractersticas geogrficas). A continuacin mostramos, mediante un ejemplo, la impor-

    tancia de los datos geogrficos en los sistemas de inteligencia de negocio (BI de aqu en

    adelante) y analizamos los informes de algunas consultoras de prestigio para dar fuerza a

    esta afirmacin.

    Supongamos que un analista revisa una lista de ventas por clientes en el rea de Barcelo-

    na similar a la imagen inferior:

    Ventas por cliente en Barcelona.

    Fuente: elaboracin propia (emulado)

    El analista intenta analizar la distribucin de las ventas por distrito. Para ello agrupa los

    valores y genera un grfico de tarta representando los distritos donde se muestra el vo-

    lumen de ventas en el ejercicio del 2013.

  • FUOC PID_00000000 7 Geographic Business Intelligence

    Ventas 2013 por distrito en Barcelona

    Fuente: elaboracin propia (emulado)

    En la imagen superior, se puede ver que el volumen mximo de ventas se da en el barrio

    de Eixample y en Sants-Monjuic. En este caso, aunque el analista no sea de Barce-

    lona y no conozca la distribucin de la ciudad el grfico podra serle til.

    Sin embargo, si prueba de realizar el mismo ejercicio utilizando el volumen de ventas

    por barrio la lectura grfica del resultado es casi imposible, dado el gran nmero de

    barrios existentes,, eso sin contar que el analista pierde la vista de la distribucin de los

    datos en la ciudad de Barcelona porque cada venta, cada cliente est en algn lugar. Por

    tanto el analista perdera el valor de situacin, o como se denomina en la comunidad el

    valor del donde del dato.

    Ventas 2013 por distrito en Barcelona

    Fuente: elaboracin propia (emulado)

    Utilizando un mapa, como el de la imagen inferior la lectura es notablemente ms fcil:

    las zonas rojas (en la periferia) son las zonas con menos importe en ventas, mientras que

    los barrios centrales (en azul) indican un mayor nmero de ventas.

  • FUOC PID_00000000 8 Geographic Business Intelligence

    Ventas 2013 por barrios en Barcelona

    Fuente: elaboracin propia. Mapa base Esri.

    El mapa no slo es capaz de representar la informacin de manera efectiva, tambin es

    capaz de analizar la existencia de una correlacin de ventas entre barrios, las zonas con

    menos ventas estn en la periferia y la zona centro es la que ofrece mayor volumen de

    ventas.

    En la figura anterior, se observa un salto en la correlacin de las ventas en la zona del

    centro de Barcelona. La lnea amarilla de la siguiente figura indica el salto entre zonas.

    Este comportamiento anmalo en los datos sera un caso de estudio tpico de anlisis

    geogrfico.

  • FUOC PID_00000000 9 Geographic Business Intelligence

    Zona de anlisis. Ventas 2013 por barrio en Barcelona

    Fuente: elaboracin propia. Mapa base Esri.

    Si se representa la informacin por conteo de clientes de tal forma que los colores azules

    se corresponden a los barrios con menos clientes y los colores verdes corresponden a las

    zonas con un nmero de clientes mayor, se observa cmo el nmero de clientes en la

    zona central sigue una disposicin regular (lnea amarilla), lo que indica que esta zona

    ofrece un rendimiento de las ventas por debajo de su supuesto potencial.

    Nmero de clientes por barrio en Barcelona

    Fuente: elaboracin propia. Mapa base Esri.

  • FUOC PID_00000000 10 Geographic Business Intelligence

    La siguiente figura, ilustra mejor la problemtica en el estudio de la anomala detectada.

    En este caso se ha dividido el total de las ventas realizadas en el 2013 entre el nmero de

    clientes totales que hay por barrio. Este proceso de estandarizacin (ventas / clientes) se

    llama normalizar los datos. Cuando se pretende englobar los valores de distintos campos

    en una nica representacin, es necesario homogeneizar su estructura.

    En la siguiente imagen se observa, de color verde las zonas que ofrecen un mayor impor-

    te en ventas en funcin del nmero de clientes, mientras que las zonas rojas indican

    donde la productividad es menor. Las flechas amarillas (sobrepuestas en el mapa) resal-

    tan las zonas donde el rendimiento de las ventas en relacin con el nmero de clientes es

    menor.

    Mapa normalizado de ventas por clientes en los barrios de Barcelona

    Fuente: elaboracin propia. Mapa base Esri.

    Los datos geogrficos son de vital importancia para los sistemas de BI siempre y cuando

    algunas de las preguntas que se quieran resolver tengan en cuenta informacin geogrfi-

    ca. Hoy en da, la importancia y expansin de los dispositivos mviles y de las aplicacio-

    nes basadas en localizacin, la democratizacin de los sistemas de informacin geogrfi-

    ca (SIG en adelante) y la madurez de los sistemas de BI ha hecho que el uso de

    informacin geogrfica en los sistemas BI sea uno de los principales retos a batir. De

    hecho, los recientes informes de las consultoras en el sector dan soporte a este argumen-

    to.

  • FUOC PID_00000000 11 Geographic Business Intelligence

    Cuadrante mgico de Gartner

    Cada ao la consultora tecnolgica Gartner1 publica distintos estudios comparativos

    que dan una foto del estado del arte respecto la tecnologa analizada. Del estudio, se

    extrae una representacin grfica que ilustra la situacin del momento. Esta represen-

    tacin es conocida como Cuadrante mgico de Gartner.

    En el cuadrante se identifican cuatro grupos categorizados en:

    Lderes (Leaders) forman parte de este grupo, aquellos productos que ejecu-

    tan correctamente las funcionalidades del producto actual y estn bien posi-

    cionados respecto las tendencias futuras.

    Visionarios (Visionaries) productos innovadores pero con una base de clien-

    tes limitada.

    Jugadores nicho (Niche Players) enfocados a un segmento de mercado espe-

    cializado, pero no ofrecen capacidad de innovacin.

    Aspirantes (Challengers), aquellos que dominan el momento actual tanto en

    tecnologa como en despliegue pero no son parte activa de la tendencia.

    Grupos del cuadrante mgico.

    Fuente: www.gartner.com

    En el cuadrante mgico de Gartner presentado en 2014 sobre analtica de negocio y

    plataformas analticas2 queda patente la relevancia de los datos geogrficos para los

    sistemas de BI. De hecho cuatro de los cinco criterios incorporados por Gartner (los

    1 Gartner Inc. es una prestigiosa empresa consultora y de investigacin sobre tecnologas

    de la informacin. http://www.gartner.com/

    2 Cuadrante mgico de Gartner sobre analtica de negocio del 2014:

    http://www.gartner.com/technology/reprints.do?id=1-

    1QLGACN&ct=140210&st=sb

  • FUOC PID_00000000 12 Geographic Business Intelligence

    cuatro primeros) para ponderar la tendencia y actualidad del mercado estn estrechamen-

    te relacionados con informacin geogrfica:

    Geoespacial e inteligencia de localizacin

    Anlisis avanzados embebidos

    Mashup y modelado de datos

    Anlisis embebido

    Soporte de Big Data

    El presente documento cubre las tendencias de las soluciones de localizacin en entornos

    de negocio.

    Segn Gartner, si se extrae la capacidad de los 17 puntos que se usan para evaluar el

    presente y la tendencia de los sistemas de negocio se obtiene que, como mnimo, los

    siguientes puntos tienen vinculacin directa con los datos geogrficos:

    1. Informes: Proveer de la capacidad de definir un formato de informe para impre-

    sin o anlisis interactivo.

    2. Cuadros de mando (Dashboards): podramos ver el cuadro de mando como un in-

    forme o panel grfico interactivo para representar las variables de rendimiento.

    Incluye capacidad de publicar varios objetos e informes interactivos y filtrar me-

    diante parmetros la informacin mostrada en los mismos. Los cuadros de mando

    a menudo emplean componentes visuales, entre ellos mapas.

    3. Informes y consultas ad hoc: permite a los usuarios interrogar los datos sin de-

    pender de terceros y crear informes con los datos seleccionados. En particular, las

    herramientas deben tener una capa semntica reutilizable para permitir a los usua-

    rios navegar por las fuentes de datos disponibles, mtricas predefinidas, jerarqu-

    as, etc.

    4. Visualizacin interactiva: permite la exploracin de datos a travs de la manipu-

    lacin de los elementos visualizados (imgenes, grficos, mapas de calor, mapas

    geogrficos, etc.) que representan los aspectos del conjunto de datos que se estn

    analizando.

    5. Localizacin geoespacial e inteligente: admite visualizaciones y anlisis pro-

    porcionados por un contexto geogrfico, espacial y temporal. Permite combinar

    datos geogrficos con informacin de terceros (mapas satlites, datos socio-

    econmicos) o datos empresariales. Esto le permite representar sus patrones fsi-

    cos, estableciendo relaciones entre datos e incorporando algoritmos geoespaciales

    (superposicin de datos en mapas interactivos, clculos de distancia, clculo de

    rutas, geofencing3, etctera) y realizar visualizaciones ms usables (utilizando

    3 Geofencing es un evento geogrfico. Un caso tpico de uso, es la definicin un rea

    en el mapa que se quiera controlar (por ejemplo zona reservada), de tal modo que si

    una entidad entra, sale o cruza del rea delimitada (por ejemplo, un coche) se dispara

    un evento con su consecuente accin (por ejemplo, una notificacin).

  • FUOC PID_00000000 13 Geographic Business Intelligence

    mapas de calor, mapas temporales, agrupaciones de datos o clustering, o visuali-

    zaciones en tres dimensiones por ejemplo).

    Las evidencias presentadas apuntan al hecho de que la informacin geogrfica y su ma-

    nipulacin/anlisis son relevantes en el mundo del BI y unos de los principales proble-

    mas a resolver hoy en da.

  • FUOC PID_00000000 14 Geographic Business Intelligence

    2. Sistemas de Informacin Geogrfica

    Desde hace siglos que la humanidad ha tenido la necesidad de representar mapas sobre

    un medio, ya sea la piedra, la madera, el papiro, el papel o los actuales formatos digita-

    les.

    Uno de los primeros mapas de los que se tiene conocimiento es una tablilla de arcilla de

    Babilonia de hace unos 5000 aos, que se expone en el Museo Britnico de Londres. Se

    considera que los babilonios utilizaban mapas para medir distancias desde 2.300 a.C con

    la intencin de recaudar impuestos.

    Primer mapa babilonio del mundo

    Fuente: http://www.cubadebate.cu/noticias/2010/02/19/primer-babilonio-mapa-

    mundo/#.U02dweYXTPA

    Sin embargo, con el paso de los aos los mapas han ido evolucionando tcnicamente, en

    formato, en calidad y en exactitud. Ahora no slo representan la realidad como una foto-

    grafa fija, sino que tambin la modelan en representacin y comportamiento. Esto per-

    mite interrogar activamente los elementos contenidos en un mapa, siendo posible realizar

    preguntas como las que se muestras a continuacin.

    Qu pasara si?

    Existe alguna relacin entre?

  • FUOC PID_00000000 15 Geographic Business Intelligence

    Y si cruzo esta informacin con?

    Hay algn modelo similar para?

    Los SIG pueden definirse de muchas maneras segn la ptica desde la que se miren. Una

    de las definiciones ms extendidas es la de Kjerne y Deuker, que los definieron en 1989

    como:

    Un sistema de hardware, software, datos, personas, organizaciones y convenios ins-

    titucionales para la recopilacin, almacenamiento, anlisis y distribucin de infor-

    macin de territorios de la Tierra.

    No obstante, segn la web4 del Instituto Geogrfico Nacional (IGN) la definicin ms

    extendida es la que se puede extraer del propio Departamento de Medio Ambiente (DoE)

    y de Burrough, Goodchild o Rhin:

    Conjunto integrado de medios y mtodos informticos, capaz de recoger, verificar,

    almacenar, gestionar, actualizar, manipular, recuperar, transformar, analizar, mos-

    trar y transferir datos espacialmente referidos a la Tierra.

    En la misma web, completan con la definicin de Burrough y Bouill, en que afirman

    que un SIG debe verse tambin como un modelo del mundo real. Segn lo cual un SIG

    podra definirse como:

    Modelo informatizado del mundo real, en un sistema de referencia ligado a la Tierra

    para satisfacer unas necesidades de informacin concretas.

    En este documento asumiremos como vlida de concepto SIG la acepcin definida por

    Burrough, Goodchild o Rhin.

    4 Web del Instituto Geogrfico Nacional (IGN)

    http://www.ign.es/ign/layoutIn/actividadesSistemaInfoGeografica.do?locale=en

  • FUOC PID_00000000 16 Geographic Business Intelligence

    3. Los SIG en los procesos de analtica de negocio

    Los sistemas de inteligencia de negocio ofrecen un valioso conocimiento del estado del

    negocio y una detallada prediccin de acontecimientos futuros. Sin embargo sin el valor

    del componente geogrfico ofrecen una visin parcial pues no identifican el contexto

    geogrfico de los datos.

    Los SIG se orientan a distintos mbitos y finalidades como podran ser la elaboracin de

    mapas en un instituto cartogrfico o el anlisis de canalizaciones en una red de distribu-

    cin de aguas.

    Este documento se centra en su uso para el anlisis del negocio, conocido con los nom-

    bres de Geomarketing y Location Analytics entre otros. Segn Chasco5 Podemos definir

    geomarketing como:

    un conjunto de tcnicas que permiten analizar la realidad econmico-social desde un

    punto de vista geogrfico, a travs de instrumentos cartogrficos y herramientas de la

    estadstica espacial.

    Mientras, que Location Analytics6 habilita las capacidades espaciales de los SIG (mapas

    y herramientas de anlisis) al servicio de un mejor conocimiento del negocio.

    Ambas definiciones se solapan en cuanto a objetivo y funcionalidades, lo que las dife-

    rencia es el punto de vista del trmino. Geomarketing se centra en la incorporacin del

    dato en el SIG, mientras que las soluciones de Location Analytics son no intrusivas, se

    centran en la incorporacin del SIG en los sistemas de negocio (es el SIG que se adapta

    al BI y no el BI el que se adapta al SIG). Ambos trminos se engloban bajo el concepto

    de Geographic Business Intelligence, un trmino mucho ms genrico de la misma idea.

    3.1 Pblico objetivo y beneficios

    El pblico objetivo las soluciones de negocio georeferenciadas sera cualquier empresa

    que quiera tomar decisiones considerando variables del territorio. Entre los beneficios de

    este tipo de sistemas podemos destacar:

    Optimizacin de la inversin en acciones de mercadotecnia

    Un mayor conocimiento del mercado y la habilidad de focalizar esfuerzos en de-

    terminados segmentos del mercado

    5 Mtodos de Geomarketing

    http://www.uam.es/personal_pdi/economicas/coro/docencia/doctorado/MasterESIC/

    Geomarkt_Chasco.pdf

    6 Location Analytics es un concepto de Esri Inc., empresa del sector SIG.

    http://www.esri.com/software/location-analytics

  • FUOC PID_00000000 17 Geographic Business Intelligence

    Disear zonas de ventas, rutas de distribucin, rutas de merchandising y rutas

    comerciales

    Visualizar los datos de negocio en distintos niveles de agregacin geogrficos

    (zonas de ventas, sectores, parroquias, municipios, poblaciones, estados, y nacio-

    nes)

    Identificar puntos de ventas, oficinas, sucursales, distribuidores, competencia, etc.

    Localizar oficinas ms cercanas, anlisis de rutas ptimas y alternativas

    Determinar el rea de influencia para precisar la poblacin a la cual se est cu-

    briendo

    Responder a preguntas como: Es ptima la localizacin actual de un negocio?

    Dnde se podra ubicar una nueva sucursal? Dnde dirigir una campaa publi-

    citaria?

    Localizacin de zonas con un alto potencial de mercado.

    Aadir valor en procesos de marketing directo o de atencin al cliente.

  • FUOC PID_00000000 18 Geographic Business Intelligence

    4. Los datos geogrficos

    La unidad bsica de la representacin espacial es el dato geogrfico, que identifica el

    lugar donde se sita una determinada ocurrencia.

    Los datos son la representacin concreta de hechos y constituyen el antecedente necesa-

    rio para el conocimiento de un fenmeno. La informacin almacenada en una base de

    datos se obtiene para una finalidad determinada y es fruto de un proceso interpretativo

    del usuario (Comas y Ruiz, 1993).

    Los datos geogrficos presentan tres tipos de componentes: el componente espacial (lo-

    calizacin del elemento/evento descrito), el componente temtico (los datos que descri-

    ban el elemento/evento) y el componente temporal (ocurrencia y validez del ele-

    ment0/evento descrito)7. A continuacin veremos en ms detalle estos componentes.

    4.1 Componente espacial

    El componente espacial define la informacin asociada a la localizacin. Esta informa-

    cin incluye su situacin fsica (tambin denominada localizacin), informacin sobre su

    sistema de representacin, sus atributos especficamente espaciales y la relacin con los

    otros datos.

    4.1.1 Localizacin

    La localizacin de un dato sobre un mapa depende del sistema de representacin o pro-

    yeccin cartogrfica que se utilice para proyectar los elementos de una superficie esf-

    rica (como es la Tierra) sobre una superficie plana (como acostumbra a ser un mapa).

    As mismo, debemos tener en cuenta tambin el sistema de referencia que determinar

    como se ubica cualquier elemento sobre un mapa a partir de un sistema de coordenadas.

    Estos conceptos son suficientemente complejos para determinar una ciencia propia, la

    Geodesia. A continuacin introducimos algunos aspectos generales sobre los elementos

    necesarios para tener una idea bsica de qu son y cmo se gestionan los datos espacia-

    les. En particular, veremos qu son las proyecciones cartogrficas, para qu sirven y

    cules son las ms extendidas. Veremos tambin qu son los sistemas de coordenadas y

    cules son los ms utilizados (latitud y longitud). Y finalmente, que son los sistemas de

    referencia y los ms utilizados actualmente.

    7 Lectura complementaria: Introduccin a los sistemas de informacin geogrfica.

    Conceptos y operaciones fundamentales (Olivella, R; Rodrguez, J).

  • FUOC PID_00000000 19 Geographic Business Intelligence

    Proyeccin cartogrfica

    Una proyeccin cartogrfica permite representar la localizacin situada en el elipsoide de

    la Tierra (en 3D) en una superficie plana (un mapa 2D). Las proyecciones facilitan una

    representacin visual ms cmoda de datos geogrficos en medios de dos dimensiones,

    como pueden ser un monitor o en papel.

    Segn la superficie donde se proyecta, se puede definir como proyeccin cnica, ciln-

    drica y plana o acimutal (o polar si la tangente es en los polos).

    La siguiente figura, muestra tres tipos de proyecciones: cnica, cilndrica y polar. Se

    puede observar que la eleccin del tipo de proyeccin ideal, depende de la zona que se

    quiera representar y qu factores (rea, distancia o direccin) son crticos, por ejemplo, la

    ms habitual, la proyeccin cilndrica, ofrece una gran distorsin en los polos. Por lo que

    en el caso de la representacin polar, la mejor opcin es la proyeccin plana o polar.

    Infografa que ilustra las opciones de proyeccin

    Fuente: http://www.cartovirtual.es/

    El sistema UTM

    Actualmente una de las proyecciones ms extendidas a nivel mundial es la Universal

    Transversal Mercator (UTM) que tambin se utiliza como sistema de coordenadas y que

    fue creada. Se trata de un sistema creado por el ejrcito de los Estados Unidos, basado en

    una proyeccin cilndrica, pero que en lugar de realizar la proyeccin cilndrica en la

    tangente del Ecuador, la realiza en el meridiano.

    Proyeccin UTM y distribucin de husos

    Fuente: http://www.atlasdemurcia.com

  • FUOC PID_00000000 20 Geographic Business Intelligence

    La proyeccin UTM que corta un meridiano permite representar la informacin cercana

    al meridiano con una margen de error mnimo. Este margen de error crece a medida que

    nos alejamos del meridiano de corte. Por este motivo, el sistema de coordenadas UTM

    divide la Tierra en 60 zonas. A cada zona se le llama huso (por ejemplo Espaa est

    incluida en las zonas o husos 28, 29, 30 y 31).

    La siguiente figura, muestra los distintos husos en la que se divide la pennsula Ibrica.

    Podemos observar como en la parte oeste se utiliza el huso es el 29, en la parte central el

    30 y en Catalunya y Baleares el huso 31.

    Los husos UTM en la pennsula Ibrica

    Fuente: http://ramonortiz1946.wordpress.com/

    Sistema de coordenadas

    Si bien existen diversos sistemas de coordenadas, en este caso nos centraremos en el

    sistema de coordenadas determinado por la proyeccin UTM y en las coordenadas ge-

    ogrficas:

    Las coordenadas geogrficas permiten ubicar cualquier elemento en la superficie de la

    tierra a partir de su concepcin tridimensional y teniendo en cuenta los meridianos

    (usando el de Greenwich como referencia central) y paralelos (con referencia central en

    el de Ecuador).

  • FUOC PID_00000000 21 Geographic Business Intelligence

    Meridianos y paralelos que permiten determinar las coordenadas geogrficas

    Fuente: http://www.cartesia.org/data/apuntes/cartografia/cartografia-geograficas.pdf

    A partir de la red de Paralelos y Meridianos y el ngulo que se genera entre ambos se

    puede determinar la longitud y latitud de un elemento. De esta manera la longitud se

    define por la distancia desde un punto cualquiera de la tierra al Ecuador, pudiendo tener

    valores desde 0 hasta los 90 tanto en direccin norte como sur. Por su parte la latitud se

    determinara por la distancia desde un punto cualquiera de la Tierra al meridiano de

    Greenwich, y los valores que se obtendran seran de 0 hasta 180 en direccin este u

    oeste.

    En la siguiente figura podemos ver las latitudes y longitudes que delimitan la pennsula

    ibrica.

    Latitud mnima y mxima de la Pennsula Ibrica: 35,82N a 43,80N.

    Longitud mnima y mxima de la Pennsula Ibrica: 9,29W a 4,33E

    Distribucin de las coordenadas geogrficas en la Pennsula Ibrica

    Fuente: http://www.cartesia.org/data/apuntes/cartografia/cartografia-geograficas.pdf

  • FUOC PID_00000000 22 Geographic Business Intelligence

    Sistemas de referencia

    En el apartado anterior hemos visto un par de sistemas de coordenadas (UTM y geogr-

    ficas). Pues bien, todos los sistemas de coordenadas requieren de un sistema de referen-

    cia que permita concretar la posicin de un elemento en la Tierra con la mxima exacti-

    tud teniendo en cuenta la forma irregular de sta. De esta manera un sistema de

    referencia vendr determinado por una serie de constantes fsicas en el territorio que nos

    permitan el clculo de la posicin respecto al sistema de coordenadas escogido y esto es

    lo que se denomina datum. Actualmente podemos determinar 2 sistemas de referencia

    como los ms utilizados:

    WGC84, se trata de un sistema de referencia a nivel internacional y utilizado por

    ejemplo por los dispositivos GPS

    ETRS89, se trata del sistema de referencia oficial en Europa y que permite una

    mayor precisin en el territorio europeo que el WGC84.

    4.1.2 Modelos de representacin

    Una vez sabemos cmo describir datos geogrficos, el siguiente paso es ver en qu for-

    mato se pueden almacenar. Se pueden distinguir principalmente dos tipos de representa-

    cin: vectorial y raster. El uso de una u otra depender de si los valores de los datos a

    representar son discretos (representacin vectorial) o continuos (representacin raster).

    En la siguiente figura, podemos ver la misma realidad con dos representaciones distintas,

    en la parte izquierda el modelo vectorial junto a su tabla de almacenamiento (con tres

    valores que se corresponden a las tres zonas representadas), mientras que en la parte

    derecha podemos observar la representacin raster, donde cada celda almacena su propio

    valor. Como consecuencia el espacio requerido para almacenar datos raster tiende a ser

    significativamente mayor.

  • FUOC PID_00000000 23 Geographic Business Intelligence

    Vectorial y raster, dos formas de representar la misma realidad

    Fuente: http://civilgeeks.com/

    Modelo vectorial

    En el modelo vectorial de los datos, los elementos bsicos son puntos y segmentos rec-

    tos. Un punto se representa mediante un par de coordenadas (X e Y). Un segmento es

    una lnea recta que une dos puntos.

    Conjugando este par de elementos, se pueden representar los siguientes elementos:

    Puntos: elementos localizados por una X e Y

    Lneas: segmentos definidos a partir de las coordenadas de puntos

    Polgonos: superficies lineales cerradas

    Almacenes, ejes de las tramas de la red de calles y edificios de Barcelona

    Fuente: Elaboracin propia. Mapa base Esri.

  • FUOC PID_00000000 24 Geographic Business Intelligence

    En la imagen anterior se puede observar los elementos del modelo vectorial:

    Puntos: almacenes representados por el carrito de la compra

    Lneas: representados por las lneas rojas que muestran el eje de la red de calles

    Polgonos: edificios de color crema

    Modelo raster

    Una imagen tipo raster est definida por una malla de celdas donde cada una de ellas

    representa un valor. La definicin de cmo se define la celda y sus posibles valores de-

    pendern en funcin de lo que se quiera representar.

    La siguiente figura muestra un modelo de representacin raster de usos del suelo. En la

    izquierda hay un detalle de la seccin de la malla de localizacin con la informacin

    asociada a cada valor en la celda, dicho valor establece la categora del uso del suelo.

    Ejemplo representacin cualitativa del modelo raster.

    Fuente: SIGMUR (Universidad de Murcia)

    http://www.um.es/geograf/sigmur/sigpdf/temario_4.pdf

    El ejemplo podra ser til en caso de una empresa de venta de aparatos de descalcifica-

    cin de agua. Se podran identificar zonas urbanas cerca de suelos clcicos, candidatas a

    una determinada accin de marketing comercial.

  • FUOC PID_00000000 25 Geographic Business Intelligence

    4.1.3 Atributos espaciales

    Para que los elementos espaciales definan la realidad de forma fiable, deben proveer de

    ciertos atributos referentes a su localizacin que permitan conocer el rigor de los datos y

    otros aspectos adicionales, como por ejemplo, el rea de un edificio o la longitud de una

    carretera.

    Estos atributos estn sujetos al modelo utilizado para la representacin y explicado ante-

    riormente en este mismo documento. Algunas de estas propiedades para los modelos

    vectoriales y raster son:

    Modelo vectorial.

    o Puntos: sistema de coordenadas

    o Lneas: sistema de coordenadas, medida de longitud, forma, pendiente

    y orientacin

    o Polgonos: sistema de coordenadas, rea, permetro, forma, pendiente

    y orientacin

    Modelo raster.

    o Malla de celdas: la unidad mnima o celdas son representaciones poli-

    gonales, por lo que sus propiedades son: Sistema de coordenadas,

    rea, permetro, forma, pendiente y orientacin.

    4.1.4 Relaciones espaciales

    En un SIG los datos representan la realidad y esta realidad se estructura en forma de

    capas de informacin. Por ejemplo, un modelo de usos del suelo seria la capa de usos

    del suelo, mientras que un modelo que muestre un tendido elctrico podra ser la capa

    cable de red y la visualizacin de las torres de soporte de la lnea elctrica podra inte-

    grarse en una capa llamada torres.

    Un SIG modela la realidad y en la realidad los elementos se relacionan y se ordenan por

    reglas, ya sean fsicas, una torre del tendido elctrico soporta cable de red por lo que

    la capa cable de red debe estar por encima y tocar de la capa torres, o legales, un

    tendido elctrico de alto voltaje (capa cable de red) no puede pasar por encima de un

    rea protegida (capa usos del suelo).

    Estas relaciones o reglas entre los elementos pueden definirse a travs de un campo

    comn entre las dos capas. La capa torres y la capa cable de red pueden tener un

    identificador de lnea elctrica comn), al igual que se establece en una base de datos

    relacional (conocido habitualmente como relacin por campo atributo o JOIN).

    Sin embargo, no siempre dos capas tienen un campo comn, por ejemplo, en el caso de

    la relacin entre el tendido elctrico y un rea protegida. En este caso, el tipo de relacin

    entre las dos capas es espacial: el tendido elctrico no puede tocar un rea protegida, en

    lo que se conoce como relacin espacial o SPATIAL JOIN.

  • FUOC PID_00000000 26 Geographic Business Intelligence

    La capacidad de poder establecer relaciones espaciales es una de las caractersticas ms

    importantes que justifica un SIG. Sin la informacin geogrfica almacenada, es imposi-

    ble poder establecer este tipo de relaciones.

    Una relacin espacial, nos permite relacionar informacin tan dispar (y lgica) como:

    una capa de locales disponibles cerca de una carretera principal, a menos de 5 minutos

    en coche de un ncleo urbano que tenga una poblacin de ms de 25.000 unidades fami-

    liares donde los padres tengan entre 25 y 45 aos de un poder adquisitivo medio-alto

    que nos permitira encontrar una buena ubicacin para un concesionario de coches espe-

    cializado en la venta de utilitarios familiares.

    Una relacin permite comprobar distintas propiedades geogrficas, por ejemplo:

    Si un elemento est contenido en otro

    Si un elemento coincide con otro

    Si un elemento intersecta con otro

    Si un elemento se superpone a otro

    Si un elemento toca a otro

    Si un elemento cruza a otro

    La distancia de uno respecto el otro

    Etctera

    En el siguiente ejemplo, se puede observar varios tipos de relaciones entre varios ele-

    mentos de tipo distinto: puntos, lneas y polgonos.

    Ejemplo de relaciones espaciales

    Fuente: Wikipedia http://es.wikipedia.org/

    Una relacin espacial, no siempre se utiliza en consultas, existen casos donde las relacio-

    nes entre los elementos, establecen las restricciones de integridad del modelo de datos.

    Las Relaciones topolgicas son un conjunto de reglas que definen cmo coexisten en el

    mismo espacio distintas capas. Se trata de relaciones cualitativas. Ejemplos pueden ser

    una zona construida debe estar contenida dentro de una zona urbana. O, como en el

  • FUOC PID_00000000 27 Geographic Business Intelligence

    ejemplo anterior, una torre elctrica debe estar situada dentro de una lnea de tendido

    elctrico.

    Las relaciones topolgicas establecen cmo deben evolucionar los elementos geogrficos

    al modificar alguno de sus elementos relacionados. Por tanto, al modificar uno de los

    elementos de las capas, se deben utilizar las relaciones topolgicas para rectificar los

    elementos en los que estn relacionados.

    Como podemos ver en la siguiente figura, los lmites administrativos de los pases, son

    un claro ejemplo de reglas topolgicas. Si un pas redefine una frontera, automticamen-

    te queda modificados los lmites de los pases colindantes.

    Mapa de poltico mundial.

    http://www.osgeo.org/

    4.2 Componente temtico

    No es lo mismo visualizar una capa con los nombres de los barrios, que una capa con las

    ventas anuales por cada uno de ellos. Todo elemento geogrfico tiene informacin alfa-

    numrica asociada que puede ser utilizada en funcin de qu punto de vista de la realidad

    se quiere mostrar.

    El componente temtico, tambin conocido como atributos o variables, son los valores o

    campos (cuantitativos o cualitativos) que definen una capa y que definen la naturaleza y

    el objetivo de la informacin mostrada.

    Este componente temtico, depende del modelo de datos utilizado y de la naturaleza del

    valor.

    4.2.1 Clasificacin en funcin del modelo

    En el modelo vectorial, el componente temtico de los elementos viene dado por los

    datos asociados a la geometra. Estos elementos deben ser recogidos explcitamente en

    funcin del modelo a representar. Los atributos suelen ser mltiples, como en el caso de

  • FUOC PID_00000000 28 Geographic Business Intelligence

    representar provincias, los atributos asociados podran ser la poblacin, la renta per

    cpita o los idiomas oficiales.

    La siguiente figura muestra un mapa temtico que ilustra la cada de precios de las vi-

    viendas en 2011 por provincias en Espaa. Los valores con un rojo ms vivo muestran

    las zonas con una cada ms pronunciada (concentradas mayoritariamente en la costa

    este) mientras que los colores ms claros ilustran la zona con una menor cada (en la

    zona del pas vasco y navarra).

    Mapa temtico cada de las ventas de vivienda en 2011 desde mximos por provincias

    Fuente http://www.ine.es (18/04/2014)

    En el modelo raster, el componente temtico est implcitamente ligado dentro de la

    capa a partir de la celda representada en la malla. El componente temtico, forma parte

    del propio valor del raster y normalmente se genera al clasificar los valores de la ima-

    gen.

    La siguiente imagen muestra un mapa temtico de usos del suelo basado en un modelo

    raster de Mxico.

  • FUOC PID_00000000 29 Geographic Business Intelligence

    Mapa de usos del suelo y vegetacin de Mxico 2007.

    Fuente: Instituto Nacional de Ecologa de Mxico. http://www.inecc.gob.mx/

    4.2.2 Clasificacin en funcin de la naturaleza

    Segn la naturaleza de los datos a analizar y del tipo de informacin que contienen, los

    podemos clasificar en:

    Cualitativos o cuantitativos

    o Los valores cualitativos son descriptivos. Un ejemplo sera la clasifi-

    cacin de bares en funcin de su tipo (cafetera, cervecera, bar de co-

    pas, etctera). En esta clasificacin, las operaciones aritmticas, siem-

    pre que no sean de agrupacin o igualdad, pierden su sentido.

    o Los valores cuantitativos son numricos y representan una medicin,

    como poblacin, temperatura o valor.

    Discretos o continuos

    o Los valores discretos son finitos (un entero o un conjunto de valores

    por ejemplo). Por ejemplo la siguiente figura, que ilustra el nmero de

    libreras por comunidad autnoma.

  • FUOC PID_00000000 30 Geographic Business Intelligence

    Nmero de libreras por comunidad autnoma (23/07/2007).

    Fuente: Instituto Geogrfico Nacional http://www.cartovirtual.es/

    o Los valores continuos representan un rango continuo infinito de valo-

    res. Ejemplos seran la densidad de poblacin de un municipio o las

    poblaciones colindantes con una gran ciudad, que suelen disminuir su

    densidad de poblacin a medida que nos alejamos del centro princi-

    pal.

    Densidad de libreras por cada 10000 habitantes por comunidad autnoma (23/07/2007).

    Fuente: Instituto Geogrfico Nacional http://www.cartovirtual.es/

  • FUOC PID_00000000 31 Geographic Business Intelligence

    Valores de correlacin

    Esta clasificacin se realiza en funcin de la similitud que representan los datos:

    Autocorrelacin espacial son aquellas donde los valores se asemejan entre ele-

    mentos prximos entre s.

    La siguiente imagen muestra los valores de temperaturas en Catalunya el 18 de

    Abril del 2014 entre 20:30 y 21:00. Se puede observar cmo no existen saltos

    bruscos de temperaturas en comarcas con similar orografa, por lo que siguen una

    correlacin espacial similar en el mismo instante.

    Mapa de evolucin de las temperaturas de Catalunya.

    Fuente: http://www.meteocat.cat

    Autocorrelacin temporal son aquellas en que los valores se asemejan en fun-

    cin de la proximidad temporal en que fueron tomados.

    En la imagen inferior, se puede observar la evolucin del cicln tropical Gustav y

    como su crecimiento es similar en funcin de la progresin temporal.

    Evolucin de un cicln tropical Gustav.

    Fuente: http://www.meteomoraleja.es/

  • FUOC PID_00000000 32 Geographic Business Intelligence

    4.3. Componente temporal

    El componente temporal se centra en la representacin de la variabilidad de los fenme-

    nos geogrficos en el tiempo.

    Este componente va ntimamente ligado al componente temtico y sirve principalmente

    para identificar variables de correlacin temporal tanto en posicin, como podra ser la

    trazabilidad de una flota de vehculos, cmo en sus atributos, como podra ser el ndice

    de crecimiento poblacional en un municipio (Componente temtico).

    El componente temporal se suele representar mediante:

    Mapas comparativos temporales o secuencias de mapas: en la que se compa-

    ran dos mapas que comparten el mismo espacio geogrfico pero distinto espacio

    temporal.

    Mapa comparativo de evolucin del voto entre 2011 y 2007

    Fuente: http://www.votosycifras.com

    Mapa animado. En un nico visor se centra la evolucin animada de un determi-

    nado fenmeno.

    Seguimiento de tweets relativos a artistas famosos por da y hora.

    Fuente: http://cartodb.com/

  • FUOC PID_00000000 33 Geographic Business Intelligence

    5. Comunicacin cartogrfica

    Una vez vistos los componentes relativos a los datos geogrficos, en esta seccin vamos

    a estudiar mtodos para comunicar la informacin en un mapa. Los dos siguientes apar-

    tados tratan sobre los mtodos para ordenar, en caso de ser necesario, los datos en un

    mapa y sobre los distintos mtodos de representacin para que la comunicacin sea efec-

    tiva.

    Uno de los objetivos de un sistema de informacin geogrfica es la correcta visualizacin

    de los datos. No basta en representar los datos, sino que estos deben ser representados de

    una manera coherente y usable, que nos permita extraer informacin e identificar patro-

    nes a partir de su visualizacin.

    La siguiente figura pretende representar la distribucin de clientes en la zona de Barcelo-

    na. Sin embargo, en la representacin de la figura (a) es difcil saber dnde est la mayor

    concentracin de clientes, pues la representacin est masificada. En la figura (b) se opta

    por otro tipo de representacin para mostrar los mismos datos. Como vemos, usar una

    representacin agrupada sobre estos datos facilita visualizar donde hay la mayor concen-

    tracin de clientes.

    Mapa de puntos de ventas de Barcelona

    (a) Representacin de elementos puntales puros

    (b) Representacin de elementos agrupados

    Fuente: Elaboracin propia. Mapa base Esri.

    Otra alternativa de representacin interesante en este caso sera la tematizada por barrios

    en Barcelona como puede verse en la figura inferior.

  • FUOC PID_00000000 34 Geographic Business Intelligence

    Mapa de puntos de ventas por barrios en Barcelona.

    Fuente: Elaboracin propia. Mapa base Esri.

    5.1. Mtodos de representacin cartogrfica

    Mayoritariamente los mtodos de representacin cartogrfica son comunes en los dife-

    rentes tipos de geometra que nos podemos encontrar en un mapa (bsicamente: puntos,

    lneas y polgonos).

    Este apartado, describe los principales mtodos adoptados en la representacin cartogr-

    fica, que juntamente con las tcnicas descritas en el apartado posterior cubren la mayora

    de las necesidades en el mbito de la representacin de mapas.

    5.1.1. Representacin simple

    A menudo no es suficiente mostrar los datos como una representacin puntual simple en

    un mapa. Si la capa a representar es nica, un smbolo geomtrico puede ser suficiente.

    No obstante, cuando los elementos a representar son cuantiosos, es recomendable ver si

    se puede tipificar los datos y utilizar representaciones grficas (iconos) distintas para

    cada tipo de elemento.

    Por ejemplo, cul de estos mapas muestra la informacin de una manera ms clara?

    Obviamente, el segundo mapa ofrece ms informacin visualmente, facilitando a quien

    lo analice a entender mejor los datos que representa.

  • FUOC PID_00000000 35 Geographic Business Intelligence

    En el mapa (a) todos los puntos estn representados con el mismo icono, en el mapa (b)

    se distingue por cafetera, cervecera y bar.

    Fuente: Elaboracin propia. Mapa base Esri.

    5.1.2. Clasificacin por categorias

    Una categora clasifica elementos de un mismo grupo. Esta clasificacin puede ser por

    nivel de importancia o valor o por tipo (segn naturaleza de la entidad). Por ejemplo, si

    se analiza la poblacin podemos establecer categoras segn rango de edad o sexo. De

    esta manera, elementos que tienen valores parecidos formarn parte de la misma

    categora, mientras elementos afines formarn parte de otra.

    En los SIG, una categora define una agrupacin de los elementos en una capa. Su utili-

    zacin en un mapa es muy til para mostrar la informacin de una manera efectiva y

    visual. En el ejemplo anterior, en el mapa (b), los elementos forman parte de la misma

    capa, llamada local, y se representan en funcin de la categora tipo de local (cafe-

    tera, cervecera y bar).

    Si en la clasificacin se utiliza la naturaleza de su valor, una categora puede venir defi-

    nida por:

    Valores cualitativos, donde el valor representa una cualidad del elemento y des-

    cribe una tipologa, condicin o estado. Por ejemplo, el tipo de terreno: zona ur-

    bana, zona interurbana, terreno rstico, etc.

    Valores cuantitativos, donde la descripcin forma parte del propio valor num-

    rico, por ejemplo: la facturacin anual.

    Si se considera la clasificacin a nivel de agrupacin de elementos una categora puede

    definirse por:

    Valores nicos, como por ejemplo, la clave principal de un elemento.

    Valores nicos para cada categora. Por ejemplo, usos del suelo: forestal, de

    cultivo o urbano.

    Clasificacin por rangos. Por ejemplo, en el siguiente mapa se han establecido 5

    clases para representar la densidad de poblacin:

  • FUOC PID_00000000 36 Geographic Business Intelligence

    La densidad de poblacin de Espaa por provincia, segn el censo del 2001 del Instituto

    Nacional de Estadstica

    Fuente: http://www.ine.es/

    En el caso de la clasificacin de los valores cualitativos, la eleccin de los valores se deja

    al criterio del diseador del mapa. Por ejemplo, si lo que se quiere es un valor nico para

    cada tipo de suelo, una opcin podra ser: bosques, matorral, forestal, cultivos libres,

    cultivos secano, regado, zonas urbanas sin urbanizar, zonas urbanas construidas; pero en

    el caso de querer generalizar los elementos representados se podran utilizar agrupacio-

    nes de atributos tales como se muestra en la siguiente figura: terreno forestal (incluye

    bosques, matorral), terreno de cultivo (incluye secano o regado) y terreno urbano

    (incluye zona sin urbanizar y urbanizada).

    Superficie y usos del suelo por Comarcas en Catalunya

    Fuente: http://www.idescat.cat/

    En el caso de la clasificacin de valores cualitativos, el diseador del mapa tambin

    podra establecer los criterios de seleccin, o por lo contrario, se podra utilizar alguna de

    las tcnicas de clasificacin existente:

  • FUOC PID_00000000 37 Geographic Business Intelligence

    Clasificacin por intervalos equivalentes. Se define el nmero de clases que se

    quiere obtener y se divide por el valor mnimo y mximo, de esta manera los cor-

    tes resultantes son intervalos regulares. Se suele utilizar para la representacin de

    porcentajes o temperatura. Por ejemplo, en el caso de la clasificacin del porcen-

    taje de las ventas de clientes en zonas comerciales, si se establecen 4 clases los

    valores sern:

    o menor del 25%

    o igual o mayor al 25% y menor del 50%

    o igual o mayor al 50% y menor del 75%

    o igual o mayor al 75%

    Clasificacin por intervalos equivalentes de 469 elementos con valores entre 0 y 100.

    Fuente: captura de ArcMap, elaboracin propia.

    Clasificacin por intervalos definidos. El punto de partida de este tipo de clasi-

    ficacin es la contraria a la tcnica usada en el caso de los intervalos equivalen-

    tes. En esta clasificacin se empieza definiendo las unidades que abarcar cada

    corte. Por ejemplo, y siguiendo con el ejemplo anterior, si se quiere definir un in-

    tervalo de corte del 15%, los cortes resultantes sern:

    o menor del 15%

    o igual o mayor al 15% y menor del 30%

    o igual o mayor al 30% y menor del 45%

    o igual o mayor al 45% y menor del 60%

    o igual o mayor al 60% y menor del 75%

    o igual o mayor al 75% y menor del 90%

    o igual o mayor al 90%

    Por lo que se obtiene un total de 7 cortes.

  • FUOC PID_00000000 38 Geographic Business Intelligence

    Clasificacin por intervalos definidos de 469 elementos con valores entre 0 y 100.

    Fuente: captura de ArcMap, elaboracin propia.

    Clasificacin por cuantiles8. Se define cuantos cortes se quiere representar y se

    realiza cada clase con el mismo nmero de elementos. En esta clasificacin no

    existen los cortes con muchos valores o pocos. Se trata de un mtodo adecuado

    para la representacin de valores lineales.

    Clasificacin por cuantiles de 469 elementos con valores entre 0 y 100.

    Fuente: captura de ArcMap, elaboracin propia.

    Clasificacin por cortes naturales o clasificacin de Jenks. Este mtodo no

    ofrece una distribucin lineal de los datos. En esta clasificacin, se establece el

    nmero de cortes que se quiere representar y una funcin decide cal es la mejor

    8 mientras la clasificacin por intervalos equivalentes, realiza los cortes en funcin

    de los valores, la clasificacin por cuantiles la realiza por nmero de elementos.

  • FUOC PID_00000000 39 Geographic Business Intelligence

    agrupacin para conseguir que cada clase tenga valores similares y al mismo

    tiempo un alto contraste entre ellas.

    En la siguiente imagen se observa los valores de rotura utilizando el mtodo de

    Jenks. Como se observa en el histograma, ofrece una distribucin regular en

    cuanto a los valores entre roturas y el nmero de puntos contenidos en cada corte.

    Clasificacin por clasificacin de Jenks de 469 elementos con valores entre 0 y 100.

    Fuente: captura de ArcMap, elaboracin propia.

    El algoritmo no es trivial; en los siguientes enlaces se pueden encontrar el algo-

    ritmo matemtico9 (en Object Vision wiki) y la funcin desarrollada en python

    10

    por Daniel Lewis (Volunteered Geographic Information).

    5.2. Tcnicas de representacin en mapas

    A continuacin se definen diferentes tcnicas bsicas utilizadas para visualizar informa-

    cin en mapas con el fin de incrementar la cantidad y calidad de informacin que pro-

    porcionan al lector.

    En este documento solo trataremos algunos de los mtodos ms comunes y ms relevan-

    tes en nuestro caso.

    9 http://wiki.objectvision.nl/index.php/Fisher%27s_Natural_Breaks_Classification

    10 http://danieljlewis.org/2010/06/07/jenks-natural-breaks-algorithm-in-python/

  • FUOC PID_00000000 40 Geographic Business Intelligence

    5.2.1. Agrupaciones o Clustering

    La representacin en cluster es un sistema de visualizacin agrupada que clasifica grupos

    homogneos de datos que estn localizados a distancias relativamente cortas y los agrupa

    en la vista del mapa.

    Las agrupaciones por clustering, normalmente se aplican a elementos con geometras de

    tipo punto.

    Este tipo de visualizacin se utiliza en anlisis de densidad de puntos (anlisis de con-

    centracin de puntos por rea) para el reconocimiento de patrones en estudios de seg-

    mentacin de mercado o localizacin de clientes.

    En el ejemplo inferior se puede visualizar donde est localizada la mayor concentracin

    de clientes en el rea de Barcelona.

    Mapa de puntos de ventas de Barcelona

    Fuente: Elaboracin propia. Mapa base Esri.

    5.2.2. Mapa de calor (Heatmap)

    Un Heatmap o mapa de calor, es un mtodo de representacin que se utiliza para identi-

    ficar zonas significativas en un mapa. Se selecciona un criterio de inters, por posicin o

    por valor, y se representa su densidad sobre el mapa. Por ejemplo, si utilizamos exclusi-

    vamente la posicin de los clientes, la zona ms significativa aparecer donde exista una

    mayor concentracin de ellos, pero si utilizamos su volumen de gasto, la zona ms signi-

    ficativa, no tiene por qu ser donde exista la mayor concentracin de clientes sino que

    ser en las zonas donde realicen el gasto ms significativo (aunque sea un punto asilado).

  • FUOC PID_00000000 41 Geographic Business Intelligence

    Al final, las zonas con una concentracin mayor se corresponden con las zonas con un

    mayor valor del criterio seleccionado.

    Normalmente, en este tipo de mapas, se utilizan colores clidos para representar las

    zonas con ms impacto mientras que los colores fros representan las zonas menos repre-

    sentativas.

    Al igual que en la visualizacin va agrupaciones, se acostumbra a utilizar en anlisis de

    densidad y en el reconocimiento de patrones en estudios de segmentacin de mercado o

    localizacin de clientes.

    El ejemplo inferior podra indicar la zona donde existe una mayor concentracin de

    puntos (tiendas) en una zona geogrfica determinada.

    Ejemplo de mapa de calor.

    Fuente: http://leaflet.github.io/Leaflet.heat/demo/

    5.2.3. Mapas de flujos

    Un mapa de flujos sirve para ilustrar el movimiento de elementos en un mapa. Para con-

    seguirlo, se une por las trayectorias pares de localizaciones de la misma entidad. Este

    tipo de mapa permite definir, entre otros, movimientos migratorios o rutas logsticas.

  • FUOC PID_00000000 42 Geographic Business Intelligence

    La velocidad y direccin del viento de la tormenta Christian el pasado 28 de Octubre del

    2013 en el Noroeste de Alemania se sobrepone en un mapa basado en OSM

    Fuente: OpenStreetMap (http://wiki.openstreetmap.org/)

    5.2.4. Colores graduados o coropletas

    Es la opcin ms habitual en la representacin de informacin temtica cuantitativa. La

    clasificacin por categoras la encontramos representada mediante el uso de una trama de

    colores graduados (tambin llamados coropletas). El smbolo que representa las diferen-

    tes categoras es el mismo, mientras que el elemento distintivo es el color.

    Con el fin de enfatizar el valor que se quiere representar, el rango de colores escogido

    suele ir de los fros a los clidos11

    . En la siguiente figura se pueden ver diferentes opcio-

    nes de colores graduados.

    11

    El ojo humano distingue un nmero limitado de colores y tonalidades. Por ese

    motivo, es recomendable no utilizar ms de 7 categoras del mismo color.

  • FUOC PID_00000000 43 Geographic Business Intelligence

    Mapa coropltico de las elecciones de estados unidos 2004

    Fuente: Wikipedia

    5.2.5. Smbolos graduados

    Al igual que la representacin de colores graduados, la representacin por smbolos

    graduados, tambin es un mtodo bastante utilizado para representar informacin temti-

    ca cuantitativa. En este caso, los elementos tambin utilizan el mismo smbolo, pero no

    es el color el que determina la magnitud (o valor) de la categora, sino el tamao del

    smbolo.

    Mapa de composicin de unidades ganaderas por provincia12

    Fuente: Instituto Geogrfico Nacional http://www.ign.es

    12

    Una variante de la simbologa graduada es la representacin por smbolos

    graduados. En este caso no se establece la clasificacin por rangos, en su lugar se

    utilizan valores numricos de un atributo que dan volumen al elemento representado.

    (ver figura)

  • FUOC PID_00000000 44 Geographic Business Intelligence

    5.2.6. Puntos de densidad

    Es similar la representacin temtica de colores, pero en este caso las variaciones se

    muestran en la trama en forma de densidad de puntos que rellena la geometra. Este

    mtodo de representacin slo es posible en geometras de tipo lneas y polgonos.

    Este tipo de representacin permite visualizar categoras combinadas, por ejemplo: una

    variable cualitativa (colores por categoras) juntamente con una variable cuantitativa

    (valor en densidad de puntos).

    En la imagen inferior, se muestra las ventas comprendidas entre el 2011 y el 2013 por

    barrio. Cada punto representa un volumen de ventas de 5000. Los barrios donde existe

    una mayor densidad de puntos tienen un mayor volumen de ventas.

    Los colores de los puntos, representan los aos de las ventas (amarillo: ventas 2011, rojo:

    ventas 2012 y azul: ventas 2013).

    Mapa de puntos por densidad y ao

    Fuente: Elaboracin propia. Mapa base Esri.

  • FUOC PID_00000000 45 Geographic Business Intelligence

    6. Anlisis de datos

    El anlisis de datos es un imperativo en los Sistemas de BI y en los SIG. Sin la capacidad

    de interrogar los datos representados ninguna de estas tecnologas no tendran sentido.

    A parte de las operaciones bsicas en cualquier anlisis de datos, en los SIG se puede

    utilizar dos tipos ms de operaciones:

    Operaciones geomtricas: son operaciones cuyo resultado es una extraccin

    geomtrica. Como por ejemplo la extraccin de los datos contenidos dentro de

    una capa en funcin de una geometra concreta. Podra ser el caso de la seleccin

    de locales disponibles para la obertura de nuevas sucursales, junto con la capa de

    densidad de poblacin.

    Operaciones de combinacin: en las que el resultado proviene de datos de 2 o

    ms capas en concreto. Como por ejemplo, sobreponer dos capas de datos. Por

    ejemplo la zona de influencia de una determinada sucursal.

    Los siguientes apartados trataran sobre las distintas opciones de anlisis, en la primera

    seccin se muestran las operaciones ms comunes entre las distintas operaciones de SIG

    y aplicables en las necesidades de BI, mientras que en el segundo apartado nos centra-

    mos en operaciones ms especficas del mbito estricto del negocio.

    6.1. Operaciones de anlisis bsicas

    Los SIG se utilizan en mltiples mbitos: generaciones cartogrficas, gestin de parcelas,

    canalizaciones de agua, luz o gas, redes de comunicaciones, gestiones de incidencias,

    redes de transporte, etc. Para cada uno de estos mbitos existen herramientas de anlisis

    especializadas. No obstante existen anlisis bsicos, comunes entre todos ellos.

    Las operaciones bsicas sobre datos geogrficos se pueden resumir en 7 puntos13

    :

    Combinacin relacional. Es la tpica operacin de combinacin (JOIN) del

    modelo relacional. La combinacin se realiza a travs de un campo (atributo)

    comn, ya sea numrico o alfanumrico.

    Unin espacial. La relacin no se establece mediante atributos de datos sino me-

    diante su geometra, es decir, se tiene en cuenta la disposicin de los elementos

    en el espacio para relacionarlos. Por ejemplo: un supermercado (representado por

    un punto) que est contenido dentro de una zona con alta densidad demogrfica

    (polgono). La operacin es de combinacin y el resultado es la capa original con

    13

    Segn: Economic Development & GIS (Pogodzinski, J.M; Kos, R.M.)

  • FUOC PID_00000000 46 Geographic Business Intelligence

    el contenido enriquecido con la informacin de la capa sobre la que combina. El

    resultado sera el supermercado con la informacin de poblacin providente de la

    capa de densidad de poblacin.

    Consideraremos como entidad de unin el elemento del cual se aade la informa-

    cin y como entidad destino aquel elemento que queda enriquecido con la infor-

    macin de la entidad relacionada.

    Igual que en el caso de la combinacin relacional, cabe definir el marco de rela-

    cin entre los elementos, que puede ser de distintos tipos:

    Interseccin: en el caso que la entidad de unin cruce, contenga o to-

    que la entidad destino

    Contener: en el caso que la entidad de unin est contenida dentro de

    la entidad destino

    Concordancia: en el caso que las dos entidades sean equivalentes total

    o parcialmente

    Proximidad: la entidad de unin se relaciona con la entidad destino,

    siempre que se encuentre dentro de una distancia definida.

    Geocodificacin. El proceso de geocodificacin consiste en transformar una di-

    reccin o punto de inters en coordenadas geogrficas (latitud/longitud). El mis-

    mo proceso pero en direccin opuesta, es decir, seleccionar un punto en el mapa y

    obtener la direccin postal se conoce como geocodificacin inversa.

    Seleccin por atributos. Consiste en seleccionar aquellos elementos de una capa

    que satisfacen un determinado criterio de bsqueda. Por ejemplo, todas las carre-

    teras de la categora Provincial.

    Seleccin por geometra. Consiste en seleccionar aquellos elementos de una ca-

    pa que cumplen un determinado criterio de posicin geogrfica respecto a otra

    capa. Por ejemplo: las gasolineras situadas dentro de una va rpida.

    Simbolizacin temtica y simbolizacin de datos cualitativos. Consiste en

    simbolizar los elementos diferenciadamente en a partir del valor de un campo o

    atributo de la entidad que representa. Forman parte del mtodo de clasificacin y

    representacin cartogrfica por categoras descrito en el apartado titulado clasifi-

    cacin por categoras.

    Zonas de influencia o buffer. Una zona de influencia o buffer es el polgono re-

    sultante de aplicar una distancia concreta respecto a las entidades origen. Por

    ejemplo, un buffer lineal de 500 metros alrededor de un establecimiento de la

    competencia que deseamos contrarrestar, ser una circunferencia donde el radio

    de 500 metros alrededor de la tienda, que definira la zona donde localizar los

    clientes potenciales.

  • FUOC PID_00000000 47 Geographic Business Intelligence

    Zona de influencia de 500m respecto la localizacin de un almacn

    Fuente: Elaboracin propia. Mapa base Esri.

    Interseccin. A partir de la relacin entre dos capas de informacin, el proceso

    de interseccin determinar aquellos elementos geomtricos que estn presentes

    en ambas capas, conservando los atributos diferenciados que representaban en

    cada una de ellas. Por ejemplo, dadas dos capas, una de locales disponibles para

    su alquiler y otra de zonas potenciales de expansin, una proceso de interseccin

    entre ambas capas nos podra dar lugar a dos posibles resultados segn el orden

    en que se ejecute: una capa de locales disponibles que se encuentran en una zona

    de expansin o bien una capa de zonas de expansin donde existen locales dispo-

    nibles.

    La diferencia respecto la unin espacial, es que en esta caso las dos capas no tie-

    nen una relacin esttica, en esta caso la relacin est generada en tiempo de an-

    lisis.

    6.2. Operaciones de geomarketing

    En el mbito del anlisis de negocio en base a datos espaciales, tambin denominado

    geomarketing, los Sistemas de Informacin Geogrfica describen un conjunto de funcio-

    nalidades de anlisis orientadas a varios objetivos, como por ejemplo el anlisis de clien-

    tes o la distribucin de zonas comerciales. Este apartado recoge las operaciones ms

    relevantes en este mbito.

    6.2.1. Diseo del territorio

    Establecer y analizar correctamente las reas de negocio es un proceso crtico en cual-

    quier estrategia de negocio. A menudo se puede analizar el impacto del negocio en el

    mercado utilizando los lmites administrativos estndar. No obstante, comnmente, el

    negocio define sus propias reas, definiendo, por ejemplo, zonas comerciales sobre una

  • FUOC PID_00000000 48 Geographic Business Intelligence

    ciudad que no coinciden con la distribucin de los barrios de la misma. Una zona podra

    comprender medio barrio, dos barrios o simplemente zonas completamente diferentes.

    Un correcto estudio de las reas de negocio permite responder preguntas tales como:

    Las reas definidas son las ptimas?

    Existe alguna opcin para mejorar las reas actuales?

    Existe canibalizacin? Es decir, Me hago competencia a m mismo?

    Cules son las zonas comerciales tipo?

    Qu zonas comerciales rinden por debajo su potencial?

    A continuacin se presentan algunas de las tcnicas comunes para el anlisis de reas de

    influencia:

    reas derivadas de cliente

    Dada una capa con valores de referencia y una capa origen, las reas derivadas definen

    reas de influencia alrededor del origen teniendo en cuenta la referencia. La capa de

    referencia puede tener en cuenta un peso. El resultado es un rea de influencia.

    En la siguiente imagen muestra donde los almacenes (cuadrados naranjas) tienen loca-

    lizados el 25 y 50% de los clientes ms cercanos.

    Localizacin del 25 y 50% de los clientes alrededor de 3 almacenes.

    Fuente: Elaboracin propia. Mapa base Esri.

    Si aplicamos el rea derivada con pesos (total ventas), podemos ver en la siguiente ima-

    gen donde los almacenes tienen localizada el 25 y 50% de su facturacin. Se observa,

  • FUOC PID_00000000 49 Geographic Business Intelligence

    que en este caso el resultado es distinto, pues se considera la ubicacin de cada almacn

    y no la ubicacin de sus clientes14

    .

    Localizacin alrededor de los almacenes del 25 y 50% sus clientes con ms facturacin.

    Fuente: Elaboracin propia. Mapa base Esri.

    Anillos simples

    Representan una zona de influencia lineal alrededor de una capa origen. Es la tcnica de

    representacin ms simple y forma parte de la lista de las 7 operaciones ms comunes

    descritas en los puntos anlisis bsicos y zonas de influencia o buffers.

    Un posible caso de uso podra ser la localizacin de comercios a 100, 250 y 500 metros

    de distancia alrededor de un almacn inicial.

    14

    Se puede observar cmo hay superposicin de zona de influencia clientes entre los

    almacenes de la parte inferior de la imagen. Estos casos, se definen como

    canibalizacin.

  • FUOC PID_00000000 50 Geographic Business Intelligence

    Zona de influencia lineal de 100, 200 y 500 metros alrededor de un almacn.

    Fuente: Elaboracin propia. Mapa base OpenStreetMap.

    Anillos guiados

    Los anillos guiados son similares al rea generada por los anillos simples, pero con la

    variante que el radio es ponderado. Un ejemplo, podra ser las reas alrededor de alma-

    cenes con un radio equivalente al volumen de ventas.

    La siguiente imagen muestra el anlisis por anillos guiados de ventas por establecimien-

    to. Cada 100 del importe de ventas equivale a 1 metro en el radio del anillo en el mapa.

    Visualmente es fcil determinar que el establecimiento que ofrece un volumen de ventas

    mayor es el situado en el punto ms a la izquierda del mapa.

    Volmenes de venta por establecimiento (100 equivale a un radio de 1 metro).

    Fuente: Elaboracin propia. Mapa base Esri.

  • FUOC PID_00000000 51 Geographic Business Intelligence

    reas de servicio

    Se trata de una evolucin de los anillos simples pero en este caso, en lugar de definir una

    distancia lineal, se define por tiempos o distancia sobre un callejero. Por ejemplo, zona

    de influencia de 2,4 y 8 minutos en coche alrededor de un almacn en Barcelona (imagen

    siguiente).

    rea de servicio de 2, 4 y 8 minutos en coche alrededor de un almacn.

    Fuente: Elaboracin propia. Mapa base Esri.

    El resultado ser un buffer irregular, ya que las calles tienen sentido y velocidad. Por

    tanto, por norma general, no se consigue la misma rea en el casco antiguo de una zona

    urbana donde posiblemente se puede correr menos, que cerca de una autopista.

    Polgonos de Thiessen o diagrama de Voronoi

    La definicin de reas de competitividad (tambin conocidas como polgonos de Thies-

    sen) tiene en cuenta la proximidad entre los elementos de una misma capa para definir la

    zona de influencia de cada uno de los puntos, para ello se unen los puntos y se trazan las

    mediatrices entre los segmentos resultantes.

    La siguiente imagen del distribuye la zona de influencia de varios centros veterinarios en

    la ciudad de Valencia.

  • FUOC PID_00000000 52 Geographic Business Intelligence

    Ejemplo de zonas de influencia por clnica veterinaria en Valencia.

    Fuente: http://geomarketingvalencia.blogspot.com.es/

    En un estudio que se quiera determinar qu zonas son las ideales para abrir un nuevo

    centro, se debera considerar los puntos de confluencia de los polgonos con una superfi-

    cie mayor. Estos indicaran las zonas con una menor competencia.

    Ecuacin de probabilidad de Huff

    La ecuacin de probabilidad de Huff es un modelo gravitacional que se define por dos

    variables: la masa y la friccin. La masa se refiere a los valores que favorecen a la locali-

    zacin de puntos de venta (por ejemplo: superficie comercial), mientras que la friccin

    representa aquellas caractersticas que afectan negativamente la localizacin (por ejem-

    plo: la distancia respecto un centro comercial). El doctor David Huff, propuso la utilidad

    de un establecimiento (j) para un comprador (i) es:

    Ecuacin de probabilidad de Huff15

    .

    Fuente: http://www.cartografia.cl/

    En un ejemplo desarrollado en la web cartografia.cl se estudia la zona de influencia de

    dos cadenas A y B con tres establecimientos cada una, y una superficie (en unidades de

    15

    : Como se puede observar para el clculo de las distancias entre el consumidor (i)

    y el establecimiento (j) es necesario tener los datos del entramado de la red de calles.

  • FUOC PID_00000000 53 Geographic Business Intelligence

    m2) de 1600, 1700 y 2500 y 100, 2500 y 1800 respectivamente. El resultado es la si-

    guiente figura:

    Zona de influencia de 6 centros comerciales utilizando la ecuacin de Huff.

    Fuente: http://www.cartografia.cl/

    6.2.2. Planificacin de mercado

    El proceso de expansin comercial es costoso y es un hecho que puede perjudicar gra-

    vemente un negocio en caso de fracaso o una mala planificacin. Un correcto conoci-

    miento del territorio reduce considerablemente el riesgo de fracaso en estos casos. Los

    datos geogrficos pueden tener un papel muy importante en el estudio de mercado de las

    empresas, tal y como se comenta a continuacin.

    Una correcta planificacin de mercado para una empresa permite identificar:

    Qu zonas de expansin cumplen los potenciales clientes?

    Cmo se pueden clonar los casos de xito anteriores de la empresa?

    Cules son los elementos clave que rigen el mercado potencial?

    Cmo hacer crecer la probabilidad de xito disminuyendo el riesgo?

    Cmo crecer sobre un territorio geogrficamente desconocido?

    A continuacin se presentan algunas tcnicas que permiten analizar territorios y, por

    tanto, identificar zonas potencialmente ms apropiadas para desarrollar un negocio.

    Prospeccin de mercado

    Consiste en analizar el mercado para identificar al pblico objetivo y tematizar con cate-

    goras sobre los factores clave. Por ejemplo: empresas con una facturacin de ms de 1

    milln de euros que tengan entre 50 y 250 trabajadores. Una vez descubiertas las reas

    idneas, se debe definir el plan de despliegue empresarial.

  • FUOC PID_00000000 54 Geographic Business Intelligence

    Bsqueda de patrones similares

    Tomar como referencia el elemento ms productivo del negocio e identificar los factores

    clave, es el primer paso para el xito de este anlisis. Por ejemplo, en una cadena de

    supermercados, se analiza cul de los establecimientos funciona mejor. Seguidamente se

    busca el detalle que hace que ese establecimiento destaque sobre los otros, por ejemplo,

    est en una zona situada cerca de una autopista donde social-demogrficamente se sita

    un elevado nmero de familias jvenes con un poder adquisitivo medio. Una vez, identi-

    ficado el factor clave, se pueden buscar zonas con caractersticas clave similares, es decir

    situadas a una distancia equivalente de una carretera principal y con una poblacin de-

    mogrficamente parecida a la de referencia. De esta manera se intenta reproducir el

    establecimiento tipo.

    Location-allocation16

    En realidad se trata de un anlisis doble donde intervienen dos capas de datos: una identi-

    fica los puntos de demanda y la segunda identifica las ubicaciones que ofrecen servicio a

    los puntos de demanda.

    El primer anlisis tiene como objetivo encontrar los puntos de demanda principales

    (clientes potenciales importantes). El segundo anlisis determina los centros de distribu-

    cin (es decir, las ubicaciones) que pueden satisfacen a la demanda.

    La siguiente imagen podra representar los puntos de demanda (en forma de poblacin) a

    menos de 15 minutos en coche que satisface cada centro comercial (puntos de color

    naranja).

    Bolsas de poblacin que cubre cada centro comercial

    Fuente: http://www.logistock.cz/en/modul/storage

    16

    Para profundizar este apartado, se recomienda la lectura del captulo 12

    Estadsticas Espaciales del libro Sistemas de Informacin Geogrfica de Victor Olaya que aparece en el apartado de bibliografa.

  • FUOC PID_00000000 55 Geographic Business Intelligence

    7. Fuentes de datos externas

    La informacin propia de una empresa puede satisfacer la toma de decisiones ms comu-

    nes. Sin embargo, en algunos casos se necesita una adaptacin o ampliacin de la infor-

    macin propia para la toma de decisiones geolocalizadas. De hecho, conocer la ubicacin

    de los clientes y de las tiendas de una empresa, normalmente permite explicar la razn

    del comportamiento de los clientes, ya que dicho comportamiento en muchas ocasiones

    puede depender de factores geogrficos externos ligados a su ubicacin, como podran

    ser localizaciones cercanas a carreteras principales o distancia frente al consumidor tipo.

    En el siguiente apartado, se citan mtodos para tratar fuentes de datos externas que enri-

    quecen el fondo de contenido propio de la empresa y permiten ejecutar preguntas analti-

    cas ms potentes. Se cubre tanto la geolocalizacin de las direcciones postales, el entra-

    mado del callejero y datos estadsticos demogrficos o econmicos. Debido a la

    magnitud y a evolucin de las fuentes de datos externas, este captulo presenta slo algu-

    nas opciones disponibles, con el objetivo de invitar al lector a realizar un anlisis de

    mercado en el momento en que sea necesario para su prctica empresarial.

    7.1. Normalizacin para proveer de geolocalizacin

    Los campos direccin postal de una base de datos pueden ser introducidos en una base de

    datos sin ningn control. Esta informacin, en un campo de texto libre, est sujeta a

    errores cuando no existe un proceso que verifique su integridad y que permita aadir las

    direcciones postales de forma normalizada. Un proceso de normalizacin como el pro-

    puesto asegurara la homogenizacin de datos. Es decir, que una direccin postal siempre

    est escrita de forma completa y del mismo modo, facilitando de esta forma que un pro-

    ceso de geolocalizacin encuentre las coordenadas de dichas direcciones.

    Existen numerosas empresas que ofrecen servicios de normalizacin de los datos. La

    siguiente lista muestra algunas de las empresas que ofrecen este servicio basado en la

    geolocalizacin:

    DEYDE17

    es una empresa privada, que provee de un servicio de normalizacin

    de direcciones postales y nombres de clientes. Se basa en distintas fuentes de in-

    formacin: ayuntamientos, correos, Instituto Nacional de Estadstica y otras car-

    tografas digitales. Su mbito de actuacin es: Espaa, Portugal, Italia y Latino-

    amrica.

    17

    DEYDE: http://www.deyde.es/

  • FUOC PID_00000000 56 Geographic Business Intelligence

    EGON18

    es una empresa privada que ofrece un servicio de normalizacin y geo-

    codificacin de direcciones postales a nivel mundial con ms de 250 pases (in-

    cluido Espaa y Amrica Latina).

    Correos19

    tambin ofrece un servicio de normalizacin de direcciones postales.

    Su mbito es Espaa, Europa, Estados Unidos, Canad, Australia y Japn.

    La junta de Andaluca20

    ofrece el servicio de normalizacin (NORDIR) y Geo-

    codificacin (GEODIR) de direcciones postales libremente, por lo que si el mbi-

    to de actuacin empresarial est centrada en esta comunidad autnoma puede ser

    viable esta opcin gratuita. El mtodo es mediante el envo de ficheros KML21

    o

    CSV un servicio Web.

    Google22

    ofrece un servicio de Geocodificacin y normalizacin a nivel mundial

    a travs de un servicio Web. Permite realizar un total de 2.500 geocodificaciones

    diarias de manera gratuita23

    .

    Esri24

    ofrece desde un servicio de Geocodificacin25

    de direcciones a nivel mun-

    dial a travs de un servicio Web. Facilita su uso a travs de las numerosas APIs

    de desarrollo.

    7.2. Servicios de callejero

    El uso de un modelo de red de transporte (un callejero) es muy habitual en entornos de

    geomarketing: Localizar la zona de influencia de un determinado establecimiento, lanzar

    una campaa de marketing en hogares situados a 5 minutos a pie, determinar la zona de

    influencia de una cadena de paquetera postal, etc.

    A continuacin presentamos algunos proveedores de datos para la generacin y/o con-

    sumo de servicios de redes de transporte:

    Nokia / HERE26

    anteriormente conocida como NAVTEQ ofrece un juego de da-

    tos para la composicin y representacin de redes de carreteras, geocodificacin y

    normalizacin. Incluyen informacin del tipo: giros prohibidos, barreras fsicas,

    18

    EGON: http://www.egon.com/

    19 Correos: http://www.correos.es/

    20 Junta de Andaluca: http://www.ideandalucia.es/

    21 KML (Keyhole Markup Language) Estndar geogrfico para la representacin de

    datos geogrficos en tres dimensiones. http://www.opengeospatial.org/standards/kml

    22 URL: https://developers.google.com/maps/documentation/geocoding/?csw=1

    23 Aunque en su contrato de licencia, informan que estas condiciones pueden

    cambiar sin previo aviso.

    24 http//www.esri.com/

    25 http://geocode.arcgis.com/arcgis/index.html

    26 Nokia HERE: http://here.com

  • FUOC PID_00000000 57 Geographic Business Intelligence

    barreras, direcciones nicas, acceso restringido, altura relativa de las carreteras y

    ms de 400 caractersticas adicionales. La representacin cartogrfica es dinmi-

    ca y en tiempo real, tanto en contenidos como en informacin sobre el trfico.

    Adems de los datos de carreteras incluye millones de puntos de que indican in-

    formacin de inters general como la situacin de gasolineras, hoteles, tiendas,

    estadios, hospitales, comisaras de polica, bancos, restaurantes, salas de concier-

    tos, etc.

    Tele Atlas/TomTom27

    empresa holandesa especializada en informacin referente

    a servicios de localizacin que ofrece datos para la composicin y representacin

    de redes de carreteras, geocodificacin y normalizacin. Incluye informacin de-

    tallada del modelo de la red de carreteras as como representacin cartogrfica en

    tiempo real del estado del trfico.

    Provee de servicios avanzados de anlisis de redes como el clculo de rutas pti-

    mas en una flota de transporte y datos complementarios en forma de distintos

    puntos de inters distribuidos en 70 categoras (gasolineras, hoteles, tiendas).

    Google ofrece varios servicios web de clculo de rutas, a travs del ya conocido

    Google Maps28

    . Por otro lado, Google Transit permite calcular rutas a pie, en bi-

    cicleta, en transporte pblico o en coche. Los clculos resultantes se integran con

    el negocio a travs de una API en JavaScript. Junto con el servicio de clculo de

    rutas, tambin ofrece la localizacin y bsqueda de negocios.

    Con cobertura a nivel mundial y anlisis del trfico en tiempo real en ms de 600

    ciudades de 50 pases distintos.

    En el momento de la captura de la siguiente imagen, en Birmingham, la red de

    carreteras presenta mayoritariamente fluidez de trfico a excepcin de los tramos

    marcados en rojo que presentan retenciones. Vemos que tambin proporcionan

    informacin sobre tramos de carretera cortados y/o en obras.

    27

    TOMTOM: http://www.tomtom.com

    28 URL: https://developers.google.com/maps/

  • FUOC PID_00000000 58 Geographic Business Intelligence

    Detalle del servicio de Google donde muestra el trfico en tiempo real en Birmingham.

    Fuente: captura de www.google.com

    OpenStreetMap29

    es un servicio de mapas abierto y colaborativo. Su cartografa

    es libre bajo una licencia Open Database License. Existe una comunidad activa

    de voluntarios que se encargan de revisar, actualizar y expandir el callejero.

    Mltiples desarrollos que funcionan sobre este servicio de mapas, como por

    ejemplo OSRM (Open Source Routing Machine). OSRM es una API para el

    clculo de rutas basado en OpenStreetMap que funciona con una velocidad nota-

    ble.

    OpenStreetMap es una buena alternativa, ya que tiene cobertura a nivel mundial y

    el nivel de detalle es bueno, superando en algunos casos al software comercial.

    En la siguiente imagen muestra la resolucin del camino ms rpido entre dos lo-

    calizaciones en Madrid utilizando OSRM.

    En map.project-osrm.org se puede testar la velocidad de ejecucin en el clculo de rutas.

    7.3. Variables de mercado

    29

    URL: http://www.openstreetmap.org/

  • FUOC PID_00000000 59 Geographic Business Intelligence

    A menudo la toma de decisiones empresariales van ntimamente ligadas al enriqueci-

    miento de los datos de la empresa con datos provenientes de fuentes de datos externas

    que contienen informacin de tipo poblacional, socio-econmica o de mercado.

    Existen varias empresas que se encargan de recolectar y tratar datos y que ofrecen servi-

    cios de datos geolocalizados. Estos datos pueden responder a distintos temas, como son

    informacin empresarial, datos econmicos, informacin relativa a estudios de mercado

    o a variables de poblacin.

    En los siguientes puntos, se describen algunos de los repositorios disponibles en el mer-

    cado.

    AIS30

    es una empresa consultora especialista en la creacin de sistemas de sopor-

    te orientados a la toma de decisiones empresariales. A travs de su producto

    Habits, ofrece un juego de datos con variables social-demogrficas cuantificadas

    como: ingresos y gastos por familia, valor de la vivienda y hbitos de consumo a

    nivel censal.

    Data Centric31

    es una empresa perteneciente al Grupo PDM dedicada al marke-

    ting directo y bases de datos en Espaa. En el apartado de datos, ofrece un reposi-

    torio comercial de tipos de consumidores y negocios por segmento de mercado.

    Ofrece datos como trabajadores por empresas, categorizacin por sector, factura-

    cin o nmero de trabajadores.

    Esri32

    provee de un servicio Saas33

    con informacin de poblacin, negocios y lu-

    gares a nivel mundial. Este servicio se puede consumir utilizando un visor web o

    mediante aplicaciones empresariales de analtica, como pueden ser Excel, Share-

    point, Dynamics, Microstrategy y Cognos o sistemas CRM como Salesforce.

    Esri tambin tiene informacin de callejero para el anlisis de rutas, herramientas

    de anlisis espacial o modelos de elevacin.

    OpenStreetMap aparte de ofrecer los datos del entramado de la red de carreteras

    tambin ofrece informacin sobre localizaciones de puntos de inters, accesibles

    mediante un servicio web.

    30

    AIS: http://www.ais-int.com/

    31 Data