Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
Prototype SOLAP appliqué sur des champs continus en mode raster
Analyse de hot spots de criminalité
Jean-Paul Kasprzyk, doctorant
Session démos 24 novembre 2014
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
Introduction
2
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
L’informatique décisionnelle (BI)
• Collecte, consolidation et analyse de données afin d’aider les entreprises dans le processus de prise de décision
• Approche décisionnelle (OLAP) ≠ approche transactionnelle (OLTP) • Le cœur d’une architecture BI est l’entrepôt de données
– Entrepôt présente une structure multidimensionnelle
• Le serveur OLAP (« On Line Analytical Processing ») permet à un utilisateur d’extraire simplement et rapidement de l’information synthétisée hors de l’entrepôt (agrégations des données)
3
Données externes
Entrepôt de données
ETL
Serveur OLAP
Interfaces OLAP
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
Exemple de structure multidimensionnelle en étoile
4
Fait: délit
Niveau: mois
Niveau: année
Niveau: type de délit
Niveau: province
Niveau: pays
Dimension temporelle
Dimension thématique
Dimension spatiale
…
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
5
OLAP
ROLAP MOLAP
HOLAP
SIG
Vecteur Raster
SOLAP
Information spatiale
Continue Discrète
OLAP dominant SIG dominant
OLAP-SIG intégré
OLAP spatial et question de recherche
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
Modélisation SOLAP raster
6
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
7
Modèle logique: Raster MOLAP
• Raster = tableau multidimensionnel • Fait = pixel indexé (rangée, colonne, bande) • « Rangée » et « colonne » sont les membres des dimensions spatiales X et Y • « Bande » est une dimension sémantique (ou éventuellement Z)
– Toutes les bandes doivent partager les même propriétés géométriques (même domaine spatial) – Bande optimisée pour l’OLAP quand la dimension est ordonnée
Exemple de cube raster
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
4
Rast 30
Rast 100
Rast 300
Mois
8
Modèle logique: Raster HOLAP
• 3 dimensions dans le MOLAP (X, Y et bande) – Agrégations très rapide en ligne et en colonne (idem
MOLAP) – Structure optimisée pour le filtrage spatial à la volée car
la proximité géographique des pixels est conservée dans la structure du raster
• Autres dimensions rejetées dans l’architecture ROLAP – Une mesure ROLAP = un raster
– Agrégation par opérations raster (Map algebra) = opérations de « drill across » entre cubes MOLAP
– Optimisé quand mesures raster partagent le même domaine spatial: • Dimensions raster
– Nombre de rangées – Nombre de colonnes – Nombre de bandes
• Géoréférencement – Résolution X, Y – Rotation – Translation
Type de crime
1
2
3
Attributs ou FK des dimensions ROLAP
Mesures raster = cubes MOLAP raster
Exemple de table des faits raster
A
B
C
D
… … … … …
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
Application: analyse de hot spots de criminalité
9
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
Cartes de hot spots
• Technique très populaire en cartographie criminelle au niveau stratégique – Offre une bonne visualisation de la distribution spatiale de la criminalité – Egalement utilisée pour de la prédiction
• Ces cartes sont générées par transformations de nuages de points (délits) en surface continue (raster) – « Kernel Density Estimation » (KDE) – Chaque pixel a une valeur dépendant du nombre de délits et de leur proximité
10
KDE Classification
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
Prototype SOLAP raster
11
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
Architecture open source
12
Input data
ETL
Geokettle
Entrepôt de
données
PostGIS raster
Serveur
SOLAP
Php
Serveur de
données spatiales
Mapserver
Serveur web
Apache
Interface
Html
Javascript
Carte
OpenLayers Arbre à dimensions et
graphiques
DHTMLX
COTE
SERVEUR
COTE
CLIENT
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
Démonstration
13
J-P Kasprzyk
Prototype SOLAP appliqué sur des champs continus en mode raster SAGEO 2014
Conclusions
• Présentation d’un outil SOLAP exploitant le format raster à travers une architecture hybride (multidimensionnelle et relationnelle)
• Avantages: – Agrégations spatiales bénéficient des performances du MOLAP – Stockage bénéficie des performances du ROLAP – Filtres spatiaux intégrés à la volée – Nombreux traitements d’analyse spatiale propres au format raster – Outil adapté à l’analyse de champs continus
• Un outil OLAP-SIG intégré devrait pouvoir combiner les deux approches: vecteur et raster – Vecteur permet l’accès aux données individuelles – Vecteur plus approprié pour les données discrètes et les champs
continus incomplets
14