14
Prototype SOLAP appliqué sur des champs continus en mode raster Analyse de hot spots de criminalité Jean-Paul Kasprzyk, doctorant Session démos 24 novembre 2014

Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

Prototype SOLAP appliqué sur des champs continus en mode raster

Analyse de hot spots de criminalité

Jean-Paul Kasprzyk, doctorant

Session démos 24 novembre 2014

Page 2: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Introduction

2

Page 3: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

L’informatique décisionnelle (BI)

• Collecte, consolidation et analyse de données afin d’aider les entreprises dans le processus de prise de décision

• Approche décisionnelle (OLAP) ≠ approche transactionnelle (OLTP) • Le cœur d’une architecture BI est l’entrepôt de données

– Entrepôt présente une structure multidimensionnelle

• Le serveur OLAP (« On Line Analytical Processing ») permet à un utilisateur d’extraire simplement et rapidement de l’information synthétisée hors de l’entrepôt (agrégations des données)

3

Données externes

Entrepôt de données

ETL

Serveur OLAP

Interfaces OLAP

Page 4: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Exemple de structure multidimensionnelle en étoile

4

Fait: délit

Niveau: mois

Niveau: année

Niveau: type de délit

Niveau: province

Niveau: pays

Dimension temporelle

Dimension thématique

Dimension spatiale

Page 5: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

5

OLAP

ROLAP MOLAP

HOLAP

SIG

Vecteur Raster

SOLAP

Information spatiale

Continue Discrète

OLAP dominant SIG dominant

OLAP-SIG intégré

OLAP spatial et question de recherche

Page 6: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Modélisation SOLAP raster

6

Page 7: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

7

Modèle logique: Raster MOLAP

• Raster = tableau multidimensionnel • Fait = pixel indexé (rangée, colonne, bande) • « Rangée » et « colonne » sont les membres des dimensions spatiales X et Y • « Bande » est une dimension sémantique (ou éventuellement Z)

– Toutes les bandes doivent partager les même propriétés géométriques (même domaine spatial) – Bande optimisée pour l’OLAP quand la dimension est ordonnée

Exemple de cube raster

Page 8: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

4

Rast 30

Rast 100

Rast 300

Mois

8

Modèle logique: Raster HOLAP

• 3 dimensions dans le MOLAP (X, Y et bande) – Agrégations très rapide en ligne et en colonne (idem

MOLAP) – Structure optimisée pour le filtrage spatial à la volée car

la proximité géographique des pixels est conservée dans la structure du raster

• Autres dimensions rejetées dans l’architecture ROLAP – Une mesure ROLAP = un raster

– Agrégation par opérations raster (Map algebra) = opérations de « drill across » entre cubes MOLAP

– Optimisé quand mesures raster partagent le même domaine spatial: • Dimensions raster

– Nombre de rangées – Nombre de colonnes – Nombre de bandes

• Géoréférencement – Résolution X, Y – Rotation – Translation

Type de crime

1

2

3

Attributs ou FK des dimensions ROLAP

Mesures raster = cubes MOLAP raster

Exemple de table des faits raster

A

B

C

D

… … … … …

Page 9: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Application: analyse de hot spots de criminalité

9

Page 10: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Cartes de hot spots

• Technique très populaire en cartographie criminelle au niveau stratégique – Offre une bonne visualisation de la distribution spatiale de la criminalité – Egalement utilisée pour de la prédiction

• Ces cartes sont générées par transformations de nuages de points (délits) en surface continue (raster) – « Kernel Density Estimation » (KDE) – Chaque pixel a une valeur dépendant du nombre de délits et de leur proximité

10

KDE Classification

Page 11: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Prototype SOLAP raster

11

Page 12: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Architecture open source

12

Input data

ETL

Geokettle

Entrepôt de

données

PostGIS raster

Serveur

SOLAP

Php

Serveur de

données spatiales

Mapserver

Serveur web

Apache

Interface

Html

Javascript

Carte

OpenLayers Arbre à dimensions et

graphiques

DHTMLX

COTE

SERVEUR

COTE

CLIENT

Page 13: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Démonstration

13

Page 14: Prototype SOLAP appliqué sur des champs continus en mode ...©sentation_new3.pdf · J-P Kasprzyk Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014 L’infomatiue

J-P Kasprzyk

Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014

Conclusions

• Présentation d’un outil SOLAP exploitant le format raster à travers une architecture hybride (multidimensionnelle et relationnelle)

• Avantages: – Agrégations spatiales bénéficient des performances du MOLAP – Stockage bénéficie des performances du ROLAP – Filtres spatiaux intégrés à la volée – Nombreux traitements d’analyse spatiale propres au format raster – Outil adapté à l’analyse de champs continus

• Un outil OLAP-SIG intégré devrait pouvoir combiner les deux approches: vecteur et raster – Vecteur permet l’accès aux données individuelles – Vecteur plus approprié pour les données discrètes et les champs

continus incomplets

14