Discovering Relative Importance of Skyline Attributes

Discovering Relative Importance of Skyline

Attributes

Gruppo 8Altobelli Andrea (Relatore)Ciotoli Fabio

Denis Mindolin, Jan Chomicki

Scenario Skyline

Id Make

t1 ford 30k 2007t2 bmw 45k 2008t3 kia 20k 2007t4 ford 40k 2008t5 bmw 50k 2006

≻make : bmw ford kia≻year : dal più nuovo≻price : dal meno costoso

Vorrei una macchina di buona marca, nuova epoco costosa…

Scenario SkylineEquivalenza degli attributi (Pareto

improvement principle): Alto numero di tuple incomparabili

all’aumentare del numero di attributi crescita dello skyline esponenziale

Impossibilità da parte dell’utente di esprimere l’importanza relativa tra attributi

Id Make

≻make : bmw ford kia≻year : dal più nuovo≻price : dal meno costoso

Scenario P-Skyline

Id Make

≻make : bmw ford kia≻year : dal più nuovo

≻price : dal meno costoso

Year più importante di Price e Make

Vorrei una macchina principalmente nuova, poi di buona marca e poco costosa…

Scenario P-SkylineIntroducono il concetto di importanza

tra attributi: Numero maggiore di tuple comparabili

riduzione della dimensione dello skyline Maggiore capacità espressiva da parte

degli utenti

Id Make

P-Skyline relationRelazione di ordinamento totale ≻A

indotto da un attributo singolo A: ≻ = { (t,t’) | t.A >A t’.A }

“Pareto accumulation” di relazioni p-skyline (“≻₁ ha la stessa importanza di ≻₂”):

≻ = ≻₁ & ≻₂“Prioritized accumulation” di relazioni p-

skyline (“≻₁ ha maggiore importanza di ≻₂”):

≻ = ≻₁ ≫ ≻₂

P-Skyline relationRelazione di ordinamento totale ≻A

indotto da un attributo singolo A: ≻ = { (t,t’) | t.A >A t’.A }

≻year : dal più nuovo

P-Skyline relation“Pareto accumulation” di relazioni p-skyline

(“≻₁ ha la stessa importanza di ≻₂”): ≻ = ≻₁ & ≻₂

≻make : bmw > ford > kia≻year : dal più nuovo≻price : dal meno costoso

Year PriceMake

≻₁ = ≻year & ≻make & ≻price

P-Skyline relation“Prioritized accumulation” di relazioni p-

skyline (“≻₁ ha maggiore importanza di ≻₂”): ≻ = ≻₁ ≫ ≻₂

PriceMake

≻2 = ≻year ≫ (≻make & ≻price)

L’interazione con l’utenteBisogna conoscere l’importanza

relativa degli attributi e l’informazione deve essere estratta dagli utenti. Come?

A. L’utente indica esplicitamente l’importanza relativa degli attributi

Per ogni coppia: n*(n-1)/2 confronti!!! Ammesso che l'utente abbia le idee chiare…

B. Uso dei feedback dell'utente: esempi superiori (Great) ed inferiori (Worst)

Great & Worst examplesGreat examples:

Tuple che “piacciono” all’utenteWorst examples:

Tuple che “non piacciono” all’utente

G W𝒪

Come utilizzare tale informazione?!?

Obiettivi

Dati un insieme G e un insieme W:

1. Verificare l'esistenza di almeno una p-skyline relation ≻

2. Costruire la p-skyline relation, ed in particolare quella ottimale tra tutte

Obiettivi1. Verificare l'esistenza di una p-

skyline relation ≻ che: Favorisca le tuple preferite G

Le tuple G devono far parte dell’insieme delle migliori tuple secondo ≻

Sfavorisca quelle non preferite W Le tuple W non devono far parte dell’insieme

delle migliori tuple secondo ≻

Obiettivi2. Costruire la p-skyline relation, ed

in particolare quella ottimale tra tutte:

PriceMake

Id Make

≻2 = ≻year ≫ (≻make & ≻price)

Obiettivi2. Costruire la p-skyline relation, ed

in particolare quella ottimale tra tutte:

Massimizza le relazioni di importanza tra gli attributi Maggior numero di oggetti confrontabili

Minimizza gli oggetti nel risultato Corrispondenza più precisa con le preferenze

dell'utenteYear

PriceMake

Id Make

≻2 = ≻year ≫ (≻make & ≻price)≻ott = ≻year ≫ ≻make ≫ ≻price

Complessità del ProblemaVerifica dell'esistenza:

NP-CompletoCostruzione della relazione:

FNP-CompletoDifficile costruire W…

Versione semplificata del problema, considerando solo l'insieme GComplessità Polinomiale!!!

Il winnow di ogni p-skyline relation è contenuto nel winnow di una skyline relation

Affinchè G possa rappresentare il winnow di una relazione p-skyline deve valere:

G ⊆ 𝒲 skyline 𝒲 p-skyline1 𝒲 p-skyline2

Verifica dell’esistenza

𝒲 skyline

Costruzione: Algoritmo Discover1. A partire dall'insieme G, generazione

di un insieme di vincoli 𝒩(G, 𝒪)2. Costruzione della relazione ottima

Costruzione: Algoritmo Discover1. A partire dall'insieme G, generazione

di un insieme di vincoli 𝒩(G, 𝒪) Garantiscono che gli esempi superiori non

siano dominati da alcun oggettoG = {t3}, da cui t3 non deve essere

dominato: t1≯t3, t2≯t3, t4≯t3 e t5≯t3 Es. t1≯t3Id Make

t1 ford 30kt3 kia 20k

t1.make > t3.maket3.price > t1.price Price

In generale: l’insieme degli attributi in cui t domina t’ non deve essere contenuto nell’insieme dei figli degli attributi in cui t’ domina t…

2. Costruzione della relazione1. Si parte dalla relazione skyline (uguale

importanza degli attributi)2. Si applicano regole di trasformazione al grafo

Ogni trasformazione introduce una sola relazione di importanza tra attributi (estensione minima del grafo)

Una regola può essere applicata solo se rispetta i vincoli!!!

Year PriceMake

Year Make

Year Price

Costruzione: Algoritmo Discover

2. Costruzione della relazione3. Per ogni attributo si itera il punto 2

finché è possibile In questo modo si ottiene il grafo ottimale (con il

massimo numero di connessioni tra attributi) Nel pieno rispetto dei vincoli!!!

Year Price

Make Year

Costruzione: Algoritmo Discover

ComplessitàO(|𝒩| |A|3) dove:

N è l'insieme dei vincoli A è l'insieme degli attributi

Polinomiale!!!

Finora i vincoli 𝒩(G, 𝒪) creati tra ogni elemento di G e tutti gli elementi di 𝒪

|𝒩(G, 𝒪)|= |G|(|𝒪|-1)G è estratto dal winnow della relazione

skyline Gli oggetti di G non possono essere dominati

dagli oggetti al di fuori del winnowNecessari solo i vincoli con il resto del

winnow: |𝒩(G, 𝒪)|= |G|(|𝒲skyline(𝒪)|-1)

Ottimizzazione dei vincoli

𝒪𝒲skyline

Esperimenti: Accuratezza O: database reale,

statistiche giocatori NHL, circa 10K tuple

Attributi rilevanti: |A| = {12, 6}

100 relazioni p-skyline ≻fav generate casualmente

Gfav generato prelevando 5 tuple per volta dal w≻fav(O)

Esperimenti: Accuratezza Quando |Gfav| > 15

l'accuratezza supera l'83%

L'accuratezza converge a 1 velocemente per minor numero di attributi, a causa della minore dimensione dello skyline

Fn-ratio relativamente alto per |Gfav| piccola, poiché con pochi esempi l'algoritmo non riesce a catturare esattamente le preferenze dell'utente nella soluzione ottima

Esperimenti: Efficienza Tre data set da 50K tuple, con dati uniformi,

correlati e anticorrelati |A| = {10, 15, 20} G costruito prendendo tuple “simili” tra loro

(distanza L2) Utilizziamo l’algoritmo Discover per calcolare ≻ che

favorisce G

Esperimenti: EfficienzaTempo di esecuzione:

In funzione di |G|, si stabilizza per valori maggiori di 20 All'aumentare del data set, aumenta la dimensione

dello skyline e quindi il numero vincoli All’aumentare degli attributi:

L’efficienza dell'algoritmo ne risente!!! O(|N| |A|3) Cresce lo skyline e il numero di vincoli

ConclusioniLe p-skyline relation: maggiore

potenza espressivaIl feedback utente: by exampleL’algoritmo Discover: scalabile,

preciso

Grazie per l’attenzione!!!

Discovering Relative Importance of Skyline Attributes

Documents

Fast Algorithm of Pareto Optimal Group-based …Group skyline, multiple skyline layers, concurrent search, subspace skyline, combination queue. 1 INTRODUCTION Skyline, known as Maxima

DBS201: Relational Databases. Agenda Entity Relationship Model Discovering Attributes Identifying Keys Defining Relationships Relational Model

Skyline Charuka Silva. Outline Charuka Silva, Skyline2 Motivation Skyline Definition Applications Skyline Query Similar Interesting Problem

Skyline Presentation

Skyline High School - SKYLINE COUNSELINGskylinecounseling.weebly.com/uploads/9/5/8/1/95811800/skyline... · 5 Earning College Credit at Skyline 2017-2018 There are several ways to

Austin Skyline

Skyline - Fuse Furniturefusefurniture.com.au/wp-content/uploads/2017/02/... · Skyline Skyline Designed by Henry Gurney Skyline has been designed and developed to provide an intelligent

Parallel Computation of Skyline and Reverse Skyline Queries … · 2019-07-12 · Parallel Computation of Skyline and Reverse Skyline Queries Using MapReduce Yoonjae Park Seoul National

Reconciling Skyline and Ranking Queries · P-skyline (or Prioritized skyline) queries [15] are a gener-alization of skyline queries in which the user can specify that some attributes

Nissan Skyline R33 - Skyline.se - Index Skyline R33 - Wiring Nissan Skyline R33 - Wiring - Page 2 Nissan Skyline R33 - Battery Nissan Skyline R33 - Instrument Gauges Nissan Skyline

Discovering the Spatial Extent of Relative Attributesfanyix.cs.ucdavis.edu/project/discovery/files/iccv2015.pdf · Discovering the Spatial Extent of Relative Attributes Fanyi Xiao

Discovering Multi-Relational Latent Attributes by Visual ...vision.cs.tut.fi/data/publications/accv2014ws_similarity_network.pdf · constructed network can be used to automatically

Skyline queries

Efficient Skyline Querying with Variable User Preferences on Nominal Attributes

Discovering the Skyline of Web Databasesasudeh/files/skylinediscovery.pdf · terface introduces novel challenges in designing an efﬁcient skyline discovery algorithm. For the special

P Sensitive K Anonymity with Generalization Constraints · on a set of attributes called quasi‐identifier or key ... skyline privacy [6], (ε, m)‐anonymity ... K‐Anonymity with

Discovering the Skyline of Web Databases · Discovering the Skyline of Web Databases Abolfazl Asudehz, Saravanan Thirumuruganathanz, Nan Zhangyy, Gautam Dasz zUniversity of Texas

Discovering Relative Importance of Skyline Attributes Gruppo 8 Altobelli Andrea (Relatore) Ciotoli Fabio Denis Mindolin, Jan Chomicki

Angia Skyline

SKYLINE CASEMENT - Kell Aluminium Profiles...Skyline Frame W57611 SECTION C-C Rev.1.2 MAR. 2017 Skyline Sash Standard W57608 Skyline Mullion 41 mm W57612 Skyline Mullion 75 mm W57613