Hierarchies in Data Mining

Bellwether Analysis

Raghu Ramakrishnan

ramakris@yahoo-inc.com

Chief Scientist for Audience and Cloud Computing

Yahoo!

2Bee-Chung Chen, Raghu Ramakrishnan, Jude Shavlik, Pradeep TammaHierarchies in Data Mining R. Ramakrishnan

About this Talk

• Common theme—multidimensional view of data:– Reveals patterns that emerge at coarser

granularity• Widely recognized, e.g., generalized association rules

– Helps handle imprecision• Analyzing imprecise and aggregated data

– Helps handle data sparsity• Even with massive datasets, sparsity is a challenge!

– Defines candidate space of subsets for exploratory mining

• Forecasting query results over “future data” • Using predictive models as summaries • Potentially, space of “mining experiments”?

Background: The Multidimensional Data Model

Cube Space

Star Schema

SERVICEpidtimeidlocidrepair

PRODUCTpidpnameCategoryModel

TIMEtimeiddateweekyear

LOCATIONlocidcountryregionstate

“FACT” TABLE

DIMENSION TABLES

Dimension Hierarchies

• For each dimension, the set of values can be organized in a hierarchy:

PRODUCT TIME LOCATION

category week month region

model date state

automobile quarter country

Multidimensional Data Model

• One fact table =(X,M)– X=X1, X2, ... Dimension attributes

– M=M1, M2,… Measure attributes

• Domain hierarchy for each dimension attribute:– Collection of domains Hier(Xi)= (Di

(1),..., Di(k))

– The extended domain: EXi = 1≤k≤t DXi(k)

• Value mapping function: γD1D2(x)

– e.g., γmonthyear(12/2005) = 2005

– Form the value hierarchy graph– Stored as dimension table attribute (e.g., week for a time

value) or conversion functions (e.g., month, quarter)

Civic SierraF150Camry

TruckSedan

Automobile

Hierarchies in Data Mining

Documents

Data Mining and Applications - antoniomucherino.it · Data Mining and Applications Data Mining Why Data Mining? Introduction to Data Mining Example III - text mining Let us suppose

Workshop on Learning Data Representation: Hierarchies and

Data Mining: Introduction. Chapter 1. Introduction zMotivation: Why data mining? zWhat is data mining? zData Mining: On what kind of data? zData mining

Visual Data Mining: An Overview What is Visual Data Mining? Survey of techniques Data Visualization Visualizing Data Mining Results Visual Data Mining

1 Data Mining Chapter 26. 2 Chapter 1. Introduction Motivation: Why data mining? What is data mining? Data Mining: On what kind of data? Data mining functionality

Statistical Data Mining€¦ · 3 Data Mining Data (re-design and maintain existing database) Mining (Analysis) -- our focus Statistical Data Mining What is Data Mining? Data mining

Web Mining – Data Mining im Internet Mining – Data Mining im Internet Vorlesung SS 2014 ... Web Mining is Data Mining for Data on the World-Wide Web Text Mining: Application of

Data linking aspects of combining data including options for various hierarchies (S-DWH context)

UNIT - I Data Mining. UNIT - I Introduction : Fundamentals of data mining, Data Mining Functionalities, Classification of Data Mining systems, Major issues

Data Mining Taylor Statistics 202: Data Mining

T-61.6020 Popular Algorithms in Data Mining and … Balanced Iterative Reducing and Clustering using Hierarchies Sami Virpioja Adaptive Informatics Research Centre Helsinki University

Data Mining-Graph Mining

Data mining week 1 - pengantar data mining

Data Mining BY JEMINI ISLAM. Data Mining Outline: What is data mining? Why use data mining? How does data mining work The process of data mining Tools

How to Import Master Data and Hierarchies into SAP ...a248.g.akamai.net/n/248/420835/723dca89543c7edc07268524a0b09de… · How to Import Master Data and Hierarchies into SAP BusinessObjects

CS590D: Data Mining Chris Clifton - Purdue University · Data Mining: Classification Schemes • General functionality – Descriptive data mining – Predictive data mining ... –

Data visualization with tableau online tutorial working with data - groups & hierarchies

MINING EDUCATIONAL DATA USING DATA MINING … · Educational data mining includes machine learning and data mining techniques. Data related to ... , density based, grid based, model

How to Import Master Data and Hierarchies Into SAP BPC

Data Mining vs. Statistics Pavel Brusilovsky. 2 Objectives 2 Intro to Data Mining Data Mining vs. Statistics Data Mining vs. Text Mining Applications