43
10 BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Pengertian Data Warehouse Berdasarkan Connoly dan Begg (2005, p1151), “ Data Warehouse is a subject-oriented, integrated, time-variant, and non-volatile collection of data in support of management’s decision-making process.” Yang artinya Data Warehouse adalah koleksi data yang mempunyai sifat berorientasi pada subjek, terintegrasi, rentang waktu, dan koleksi datanya tidak mengalami perubahan dalam menudukung proses pengambilan keputusan di manajamen. Menurut Inmon (2005, p29), sebuah data warehouse adalah sebuah kumpulan data yang integrated, subject-oriented, nonvolatile, time variant yang mendukung managemen mengambil keputusan. Data warehouse dibangun dengan cara mengintegrasikan data yang berasal dari berbagai sumber data, yaitu database operasional. Untuk melakukan proses integrasi ini, Data Warehouse memiliki tiga proses utama yang dilaksanakan, yaitu: extraction, data transformation, dan loading (ETL). Sebelum proses transformation terdapat suatu proses yang bernama data cleansing (Watson, 2010). Data warehouse adalah kumpulan pendukung teknologi decision support, yang bertujuan membantu pekerja (eksekutif, manajer, analis) untuk membuat keputusan yang lebih baik dan lebih cepat. Ini berfungsi sebagai pelaksanaan fisik

BAB 2 LANDASAN TEORI - library.binus.ac.idlibrary.binus.ac.id/eColls/eThesisdoc/Bab2/2012-1-01050-SI Bab2001.pdf · LANDASAN TEORI 2.1 Teori Umum 2.1.1 Pengertian Data Warehouse

  • Upload
    doannhu

  • View
    223

  • Download
    2

Embed Size (px)

Citation preview

10

BAB 2

LANDASAN TEORI

2.1 Teori Umum

2.1.1 Pengertian Data Warehouse

Berdasarkan Connoly dan Begg (2005, p1151), “ Data Warehouse is a

subject-oriented, integrated, time-variant, and non-volatile collection of data in

support of management’s decision-making process.” Yang artinya Data

Warehouse adalah koleksi data yang mempunyai sifat berorientasi pada subjek,

terintegrasi, rentang waktu, dan koleksi datanya tidak mengalami perubahan

dalam menudukung proses pengambilan keputusan di manajamen.

Menurut Inmon (2005, p29), sebuah data warehouse adalah sebuah

kumpulan data yang integrated, subject-oriented, nonvolatile, time variant yang

mendukung managemen mengambil keputusan.

Data warehouse dibangun dengan cara mengintegrasikan data yang

berasal dari berbagai sumber data, yaitu database operasional. Untuk melakukan

proses integrasi ini, Data Warehouse memiliki tiga proses utama yang

dilaksanakan, yaitu: extraction, data transformation, dan loading (ETL). Sebelum

proses transformation terdapat suatu proses yang bernama data cleansing

(Watson, 2010).

Data warehouse adalah kumpulan pendukung teknologi decision support,

yang bertujuan membantu pekerja (eksekutif, manajer, analis) untuk membuat

keputusan yang lebih baik dan lebih cepat. Ini berfungsi sebagai pelaksanaan fisik

11

dari decision support data model dan menyimpan informasi pada yang perusahaan

perlu membuat keputusan strategis (Reddy, 2010).

Dari pengertian-pengertian di atas, dapat disimpulkan bahwa data

warehouse adalah sekumpulan data yang diperoleh dari berbagai sumber yang di

gunakan untuk mendukung proses pembuatan management di dalam suatu

perusahaan.

2.1.2 Pengertian OLTP (On-line Transaction Processing)

Menurut Connolly and Begg (2005, p1149), OLTP system adalah sistem

yang dirancang untuk menangani high transaction, dengan transaksi yang secara

khusus membuat perubahan kecil terhadap data operasional organisasi, yaitu data

yang diperlukan organisasi untuk menangani operasi dari hari ke hari.

On-Line Transaction Processing (OLTP) adalah sebuah istilah dalam data

warehouse, OLTP sendiri adalah suatu kegiatan atau sebuah proses database

dalam menyimpan data dalam hal kegiatan operasional transaksi yang dilakuan

setiap hari.

OLTP (Online Transaction Processing Systems) adalah suatu sistem yang

memproses suatu transaksi secara langsung (insert, update, delete) melalui

komputer yang terhubung dalam jaringan. OLTP berorientasi pada proses yang

memproses suatu transaksi secara langsung melalui komputer yang terhubung

dalam jaringan. Seperti misalanya kasir pada sebuah supermarket yang

menggunakan mesin dalam proses transaksinya. OLTP mempunyai karakteristik

beberapa user dapat creating, updating, retrieving untuk setiap record data, lagi

pula OLTP sangat optimal untuk updating data.

12

2.1.3 Perbandingan Data warehouse dan OLTP

Di bawah ini adalah tabel yang menunjukkan karakteristik utama dari

sistem OLTP dan sistem data warehouse (Connolly dan Begg, 2005,

p1153) :

Table 2.1 Perbandingan Sistem OLTP dan Sistem Data warehouse

Sistem OLTP Sistem Data Warehouse

Menangani data sekarang Menangani data historis

Menyimpan detailed data Menyimpan detailed, lightly dan

highly summarized data

Data bersifat dinamis Data bersifat statis

Proses berulang Proses sewaktu – waktu tidak

terstruktur dan heuristic

Jumlah transaksi tinggi Jumlah transaksi rendah sampai

sedang

Transaction driven Analysis driven

Berorientasi aplikasi Berorientasi subjek

Mendukung keputusan harian Mendukung keputusan strategis

Melayani banyak user Melayani sedikit user (manajerial)

13

2.1.4 Data Mart

Adalah suatu bagian pada data warehouse yang mendukung pembuatan

laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu

perusahaan. Menurut Conolly and Begg (2005, p1171), data mart merupakan

subset dari data warehouse yang mendukung kebutuhan informasi dari suatu

departemen atau fungsi bisnis tertentu. Data mart merupakan suatu bagian dari

data warehouse yang dapat mendukung pembuatan laporan dan analisis data pada

suatu unit, bagian atau operasi perusahaan.

Data Mart adalah bentuk atau versi skala kecil (ruang lingkup data mart

lebih kecil) dari Data Warehouse (Gudang Data), yang dirancang untuk unit bisnis

strategis atau Strategic Business Unit (SBU) atau departemen. Karena Data Mart

mengandung informasi yang tidak sebanyak gudang data (Data Warehouse), Data

Mart memberikan respon yang lebih cepat dan lebih mudah navigasikan

dibandingkan gudang data (Data Warehouse).

Perbedaan antara data mart dan data warehouse adalah :

1. Data mart hanya berfokus pada kebutuhan user yang berkaitan dengan

suatu departemen atau fungsi bisnis.

2. Data mart tidak mengandung data operasional secara detil, berbeda

dengan data warehouse.

3. Data yang terdapat didalam data mart lebih sedikit dari data yang ada di

dalam data warehouse.

2.1.5 Karakteristik Datawarehouse

Karakteristik dari data warehouse menurut pendapat Inmon

(2005, p29-32) yaitu subject oriented, integrated, non-volatile, dan time

variant.

14

1. Subject Oriented

Sistem operasi secara klasik diorganisasikan sekitar aplikasi

fungsional dari perusahaan. Untuk perusahaan asuransi, aplikasinya

dapat berupa auto, health, life, dan casuality. Area subyek utama dari

perusahaan asuransi dapat berupa customer, policy, premium, dan

claim. Untuk perusahaan, area subyek utama dapat berupa

product, order vendor, bill of material, dan raw goods. Untuk

pedagang eceran, area subyek utama dapat berupa product, sale,

vendor.

Gambar 2.1 Aspek Subject Oriented Dari Data Warehouse

(Sumber : Inmon, 2005, p30)

15

2. Integrated

Data diambil dari banyak sumber berbeda kemudian dimasukkan

ke dalam data warehouse. Selama data diambil, data tersebut diubah,

dilakukan format kembali, diurutkan, diringkas dan seterusnya.

Hasilnya, data terletak dalam data warehouse yang memiliki

pandangan terpadu dan terintegrasi.

Untuk menciptakan subyek area yang berguna, sumber data yang

berasal dari beberapa sistem yang berbeda, terlebih dahulu

harus terintegrasi sebelum digabungkan ke dalam sebuah data

warehouse. Sebagai contoh, terdapat 4 aplikasi yang menyimpan

kode jenis kelamin dalam database secara berbeda. Aplikasi A

menyimpan kode jenis kelamin dalam bentuk 'm' untuk laki-laki

dan ‘ f ’ untuk perempuan, sedangkan aplikasi V dalam bentuk 'I'

dan '0', aplikasi C dalam bentuk 'x' dan 'y', aplikasi D dalam

bentuk 'male' dan 'female'. Melalui proses integrasi dihasilkan kode

jenis kelamin yang seragam untuk data warehouse yaitu 'm' dan

‘f’ . Untuk lebih jelasnya dapat dilihat pada gambar berikut ini :

16

Gambar 2.2 Aspek Integrated dari Data Warehouse

(Sumber : Inmon, 2005, p31)

3. Non-volatile

Data dalam lingkungan operasional di-update secara teratur, tetapi

data pada data warehouse menunjukkan karakteristik yang berbeda.

Data pada data warehouse di-load dan diakses tetapi tidak di-

update. Ketika data pada data warehouse di-load, data di-load di

dalam sebuah snapshot (static format). Ketika terjadi perubahan

selanjutnya, snapshot record yang baru akan ditulis.

17

Gambar 2.3 Aspek Non-volatility dari Data Warehouse

(Sumber : Inmon, 2005, p32)

4. Time Variant

Data yang tersimpan dalam data warehouse bersifat time-variant

atau bersifat akurat pada periode tertentu. Karakteristik dasar data

dalam data warehouse sangat berbeda dengan data pada OLTP,

dimana data hanya akurat untuk waktu sesaat setelah data diakses,

sedangkan data pada data warehouse, data akurat selama periode

waktu tertentu, maka dikatakan memiliki perbedaan waktu/ rentang

waktu (time variant).

Aspek yang menunjukkan karakteristik time variant dalam data

warehouse adalah sebagai berikut :

• Data warehouse mempresentasikan data untuk

kurun waktu 5-10 tahun. Sedangkan pada OLTP

mempresentasikan data untuk jangka waktu yang lebih

18

singkat mulai dari 60-90 hari, karena pada OLTP, aplikasi

yang digunakan harus memiliki response time yang singkat

maka data yang diproses harus optimal.

• Secara implisit maupun eksplisit, setiap struktur

data pada data warehouse mengandung elemen waktu

seperti hari, minggu, bulan, dan sebagainya. Elemen waktu

ini hampir selalu menjadi dasar yang mengintegrasikan data

dalam data warehouse.

• Data pada data warehouse merupakan serangkaian

snapshot, yaitu potongan data yang dikelompokkan sesuai

dengan urutan waktu.

Gambar 2.4 Aspek Time Variant dari Data Warehouse

(Sumber : Inmon, 2005, p32)

19

2.1.5.1. Struktur Data Warehouse

A. Current Detail Data

Current detail data merupakan data detil yang aktif saat ini,

mencerminkan keadaan yang sedang berjalan dan merupakan level terendah

dalam data warehouse. Didalam area ini warehouse menyimpan seluruh detail

data yang terdapat pada skema basis data. Jumlah data sangat besar sehingga

memerlukan storage yang besar pula dan dapat diakses secara cepat. Dampak

negatif yang ditimbulkan adalah kerumitan untuk mengatur data menjadi

meningkat dan biaya yang diperlukan menjadi mahal. Berikut ini beberapa

alasan mengapa current detail data menjadi perhatian utama :

1. Menggambarkan kejadian yang baru terjadi dan selalu menjadi

perhatian utama.

2. Sangat banyak jumlahnya dan disimpan pada tingkat

penyimpanan terendah.

3. Hampir selalu disimpan dalam storage karena cepat di akses

tetapi mahal dan kompleks dalam pengaturannya.

4. Bisa digunakan dalam membuat rekapitulasi sehingga current

detail data harus akurat.

B. Older Detail Data Warehouse

Data ini merupakan data historis dari current detail data, dapat berupa

hasil cadangan atau archive data yang disimpan dalam storage terpisah.

Karena bersifat back-up (cadangan), maka biasanya data disimpan dalam

storage alternatif seperti tape-desk.

20

Data ini biasanya memilki tingkat frekuensi akses yang rendah.

Penyusunan file atau directory dari data ini di susun berdasarkan umur dari

data yang bertujuan mempermudah untuk pencarian atau pengaksesan

kembali.

C. Lightly Summarized Data

Data ini merupakan ringkasan atau rangkuman dari current detail data.

Data ini dirangkum berdasar periode atau dimensi lainnya sesuai dengan

kebutuhan. Ringkasan dari current detail data belum bersifat total summary.

Data-data ini memiliki detail tingkatan yang lebih tinggi dan mendukung

kebutuhan warehouse pada tingkat departemen. Tingkatan data ini disebut

juga dengan data mart. Akses terhadap data jenis ini banyak digunakan untuk

view suatu kondisi yang sedang atau sudah berjalan.

D. Hightly Summarized Data

Data ini merupakan tingkat lanjutan dari Lightly summarized data,

merupakan hasil ringkasan yang bersifat totalitas, dapat di akses misal untuk

melakukan analisis perbandingan data berdasarkan urutan waktu tertentu dan

analisis menggunakan data multidimensi.

E. Metadata

Metadata bukan merupakan data hasil kegiatan seperti keempat jenis data

diatas. Menurut Poe, metadata adalah ‘data tentang data’ dan menyediakan

informasi tentang struktur data dan hubungan antara struktur data di dalam

atau antara storage (tempat penyimpanan data). Metadata berisikan data yang

menyimpan proses perpindahan data meliputi database structure, contents,

21

detail data dan summary data, matrics, versioning,aging criteria, versioning,

transformation criteria. Metadata khusus dan memegang peranan yang sangat

penting dalam data warehouse.

Metadata sendiri mengandung :

• Struktur data

Sebuah direktori yang membantu user untuk melakukan

analisis Decission Support System dalam pencarian letak/ lokasi

dalam data warehouse.

• Algoritma

Algoritma digunakan untuk summary data. Metadata sendiri

merupakan panduan untuk algoritma dalam melakukan pemrosesan

summary data antara current detail data dengan lightly summarized

data dan antara lightly summarized data dengan hightly summaried

data.

• Mapping

Sebagai panduan pemetaan (mapping) data pada saat data di

transform/ diubah dari lingkup operasional menjadi lingkup data

warehouse.

22

2.1.5.2. Anatomi Data Warehouse

a) Data Warehouse Fungsional

Kata operasional disini merupakan database yang diperoleh dari kegiatan

sehari-hari. Data warehouse dibuat lebih dari satu dan dikelompokkan

berdasar fungsi-fungsi yang ada di dalam perusahaan seperti fungsi keuangan

(financial), marketing, personalia dan lain-lain. Keuntungan dari bentuk data

warehouse seperti ini adalah, sistem mudah dibangun dengan biaya relatif

murah sedangkan kerugiannya adalah resiko kehilangan konsistensi data dan

terbatasnya kemampuan dalam pengumpulan data bagi pengguna.

Gambar 2.5 Bentuk Data Warehouse Fungsional

(Sumber : Gustiarahman, 2006)

b) Data warehouse terpusat

Bentuk ini terlihat seperti bentuk data warehouse fungsional, namun

terlebih dahulu sumber data dikumpulkan dalam satu tempat terpusat,

kemudian data disebar ke dalam fungsinya masing-masing, sesuai kebutuhan

persuhaan. Data warehouse terpusat ini, biasa digunakan oleh perusahaan

yang belum memiliki jaringan eksternal. Keuntungan dari bentuk ini adalah

23

data benar-benar terpadu karena konsistensinya yang tinggi sedang

kerugiannya adalah biaya yang mahal serta memerlukan waktu yang cukup

lama untuk membangunnya.

Gambar 2.6 Bentuk Data Warehouse Terpusat

(Sumber : Gustiarahman, 2006)

c) Data warehouse terdistribusi

Pada data warehouse terdistribusi ini, digunakan gateway yang berfungsi

sebagai jembatan penghubung antara data warehouse dengan workstation

yang menggunakan sistem beraneka ragam. Dengan sistem terdistribusi seperti

ini memungkinkan perusahaan dapat mengakses sumber data yang berada

diluar lokasi perusahaan (eksternal). Keuntungannya adalah data tetap

konsisten karena sebelum data digunakan data terlebih dahulu di sesuaikan

atau mengalami proses sinkronisasi. Sedangkan kerugiannya adalah lebih

kompleks untuk diterapkan karena system operasi dikelola secara terpisah juga

biaya nya yang paling mahal dibandingkan dengan dua bentuk data warehouse

lainnya.

24

Gambar 2.7 Bentuk Data Warehouse Terdistribusi

(Sumber : Gustiarahman, 2006)

Tiga tipe dari data warehouse terdistribusi:

1. Data warehouse yang terdistribusi secara geografi terdiri dari

data warehouse lokal dan data warehouse global.

2. Data warehouse yang terdistribusi dalam banyak prosesor, secara

logis ada satu data warehouse tetapi secara fisiknya ada banyak data

warehouse yang saling berhubungan.

3. Data warehouse yang tumbuh dalam sumber yang tidak terkoordinasi.

2.1.5.3. Arsitektur Data Warehouse

Arsitektur data warehouse menurut Conolly dan Begg (2005, p1162)

sebagai berikut :

25

Gambar 2.8 Arsitektur Data Warehouse (Conolly and Begg, 2005,

p1162)

Menurut Connolly and Begg (2005, p11556), arsitektur data

warehouse terdiri atas:

a. Operational Data

Sumber data untuk data warehouse disediakan dari :

• Mainframe data operasional disimpan dalam generasi pertama

database hirarkis dan database jaringan. Itu diperkirakan bahwa

mayoritas dari data operasioanal perusahaan adalah berada dalam

sistem ini.

• Data-data antar bagian departemen yang tersimpan dalam beraneka

ragam sistem penyimpanan file seperti VSAM, RMS, dan

relational DBMS seperti Informix dan Oracle.

• Data internal yang tersimpan di workstation dan private server.

26

• Sistem eksternal seperti internet , database komersial, atau

database yang berhubungan dengan pelanggan atau supplier dari

organisasi.

b. Operational Data Store

Suatu operational data store (ODS) adalah suatu media

penyimpanan atas data operational yang terbaru dan terintegrasi

yang digunakan untuk analisis. ODS menstrukturkan dan

menyediakan data dengan cara yang sama seperti data warehouse,

tetapi sesungguhnya bertindak secara sederhana sebagai tempat

penampungan sementara sebelum data dipindahkan ke warehouse.

ODS diciptakan ketika sistem operasional ditemukan tidak mampu

untuk mencapai keberhasilan sistem pelaporan. ODS menyediakan

manfaat yang berguna dari suatu relational database dalam

mengambil keputusan yang mendukung fungsi data warehouse.

c. Load Manager

Load manager melakukan semua operasi yang berhubungan

dengan extract dan load data ke dalam data warehouse. Data di-

extract secara langsung dari sumber data atau umumnya dari

penyimpanan data operasional. Operasi yang dilakukan oleh load

manager dapat meliputi transformasi data yang sederhana untuk

mempersiapkan data tersebut agar dapat dimasukan ke dalam

warehouse.

d. Warehouse Manager

Warehouse manager melaksanakan semua operasi yang

berhubungan dengan pengelolaan atas data dalam warehouse.

27

Operasi-operasi yang dilaksanakan oleh warehouse manager

meliputi :

o Analisa atas data untuk memastikan konsistensinya.

o Transformasi dan penggabungan sumber data dari

tempat penyimpanan sementara ke dalam tabel-tabel

data warehouse.

o Pembuatan index dan view pada tabel-tabel dasar.

o Menghasilkan denormalisasi (jika diperlukan).

o Menghasilkan agregasi (jika diperlukan).

o Backup dan archieve data.

e. Query Manager

Query manager melakukan semua operasi yang berkaitan

dengan pengelolaan dari query user. Komponen ini secara khusus

dibangun menggunakan tool akses data end-user, tool pengontrol

data warehouse, fasilitas database, dan custom built program.

Kompleksitas query manager ditentukan oleh fasilitas yang

disediakan oleh tool akses end-user dan database.

Operasi yang dilakukan komponen ini meliputi pengarahan

query pada tabel yang sesuai dan penjadwalan pelaksanaan query.

Dalam beberapa kasus, terkadang query manager juga

menghasilkan profil query yang mengijinkan warehouse manager

menentukan kesesuaian index dan agregasi.

f. Detailed Data

Area ini menyimpan semua data detail di dalam skema

database, yang bertujuan untuk melengkapkan kumpulan data

28

untuk data warehouse. Dalam banyak kasus, data yang terperinci

tidaklah disimpan secara online tetapi dapat disediakan melalui

agregasi data pada tingkatan detil berikutnya.

g. Lightly dan Highly Summarized Data

Area ini menyimpan semua lightly dan highly summarized

(aggregated) data yang dihasilkan oleh warehouse manager. Area

ini adalah tempat penampungan sementara sebelum dilakukan

perubahan secara berkelanjutan untuk merespon perubahan profil

query.

Tujuan ringkasan informasi ini adalah untuk mempercepat

penyampaian query. Meskipun biaya operasi akan meningkat

sehubungan dengan proses peringkasan data tersebut, ini akan

diseimbangkan dengan menghapus keperluan untuk secara terus

menerus melakukan operasi ringkasan dalam menjawab query user.

Ringkasan data di-update secara terus menerus ketika ada data baru

terisi ke dalam warehouse.

h. Archieve/ Backup Data

Area ini menyimpan semua detail dan ringkasan data untuk

kepentingan archiving dan backup. Walaupun ringkasan data

dihasilkan dari detail data, itu akan mungkin untuk membutuhkan

backup ringkasan data secara online jika data ini disimpan melebihi

periode penyimpanan untuk data yang terinci. Data ditransfer ke

arsip penyimpanan seperti magnetic tape atau optical disk.

29

i. Meta-data

Area ini menyimpan semua definisi metadata yang digunakan

oleh semua proses di dalam warehouse. Metadata digunakan untuk

berbagai tujuan termasuk :

o Proses extract dan load atas metadata digunakan untuk

memetakan sumber data ke dalam pandangan umum data dalam

warehouse.

o Sebagai proses pengelolaan warehouse, metadata

digunakan untuk mengotomatisasi pembuatan atas tabel ringkasan.

o Sebagai bagian proses pengelolaan query, metadata

digunakan untuk mengarahkan suatu query dengan sumber data

yang tepat.

j. End-User Access Tools

Tujuan yang utama dari data warehouse adalah menyediakan

informasi kepada user untuk mendukung pengambilan keputusan.

Para user ini berinteraksi dengan warehouse menggunakan end-

user access tools. Menurut para ahli end-user access tools dapat

dikategorikan menjadi 5 kelompok utama:

1. Reporting dan query tools

Reporting tools meliputi alat pelaporan (production

reporting tools) dan penulis laporan (reporting writers).

Production reporting tools digunakan untuk menghasilkan

laporan operasional reguler, atau daya pemicu kerja yang

tinggi. Seperti order customer, invoice, dan gaji karyawan.

30

Query tools untuk relational data warehouse, dirancang

untuk menerima SQL dan syntax-nya, untuk query

penyimpanan data, untuk data warehouse. Tools ini

melindungi end user dari kompleksitas SQL dan struktur

database.

2. Application Development Tools

Kebutuhan dari end user, kemampuan membuat

informasi yang built-in dan tools query yang tidak

mencukupi, dikarenakan kebutuhan analisis tidak bisa

dilakukan, atau karena interaksi user membutuhkan tingkat

professional yang tinggi.

3. Executive Information System (EIS) Tools

EIS lebih dikenal sebagai ‘Everybody’s information

system’ yang semula dikembangkan untuk mendukung

strategi kebutuhan tingkat tinggi. Tools EIS mulanya

terasosiasi dengan mainframe, sehingga memungkinkan

user membuat aplikasi pendukung pengambilan keputusan,

dalam menyediakan overview data organisasi dan

mengakses sumber data eksternal.

4. Online Analitical Proccessing (OLAP) Tools

Online analytical processing tools berbasis pada konsep

basis data multidimensi dan memperbolehkan user untuk

menganalisis data menggunakan view yang kompleks dan

multidimensional. Tools ini mengasumsikan bahwa data

diatur dalam model multidimensi yang didukung oleh

31

special multidimensional database (MDDB) atau oleh basis

data relasional yang dirancang untuk mendapatkan

multidimensional queries.

2.1.5.4. Data Flow dalam Data Warehouse

Menurut Conolly dan Begg (2005,p1161-1165), data warehouse fokus

pada managemen lima arus data primer, yaitu :

Gambar 2.9 Aliran Data pada Data Warehouse

A. Inflow Proses yang berhubungan dengan pengekstrakan (extraction),

pembersihan (cleansing), dan pemuatan (loading) data dari sumber

data ke dalam data warehouse.

B. Upflow Proses yang terhubung dengan menambahkan nilai ke data di

dalam warehouse, melalui peringkasan, pemadatan, dan

pendistribusian data.

32

C. Downflow Proses yang berhubungan dengan penyimpanan dan backup

datan dalam data warehouse.

D. Outflow Proses yang berhubungan dengan membuat data tersedia agar

tersedia bagi end user.

E. Metaflow Proses managemen metadata. Metaflow merupakan proses

yang memindahkan metadata (data tentang flow yang lainnya).

2.1.5.5. Sketsa Data Warehouse

A. Tabel Fakta

Berdasarkan Connoly dan Begg (2005, p1183), setiap model

dimensional (Dimensional Model) disusun dalam satu tabel

dengan campuran primary key dan dinamakan tabel fakta.

Sebagaimana bagian besar data dalam data warehouse disajikan

sebagai fakta, tabel fakta dapat berhubungan erat dengan tabel

dimensi. Dengan demikian, sangat penting untuk memperlakukan

tabel fakta sebagai data referensi read-only yang tidak akan

berubah seiring waktu. Tabel fakta mengandung satu atau lebih

ukuran yang dinyatakan dengan angka atau fakta yang terdapat

pada setiap record.

Fakta yang paling berguna dalam tabel fakta adalah numerik

karena aplikasi data warehouse tidak mengakses record tunggal.

Sebaliknya, data warehouse mengakses ratusan, ribuan, bahkan

jutaan record pada satu waktu dan hal yang paling penting

dilakukan pada record yang begitu banyak adalah

mengagregasikan mereka.

33

B. Tabel Dimensi

Serangkaian tabel yang lebih kecil dinamakan tabel dimensi.

Tabel dimensi umumnya terdiri dari deksripsi informasi tekstual.

Atribut dimensi digunakan sebagai pembatas dalam queries data

warehouse.

C. Pemodelan dalam Dimensional

Model dimensional merupakan rancangan logikal yang

bertujuan untuk menampilkan data dalam bentuk standar dan

intuitif yang memperbolehkan akses dengan performa yang tinggi.

Model dimensional menggunakan konsep model hubungan

antar entity (ER) dengan beberapa batasan yang penting. Setiap

model dimensi terdiri dari sebuah tabel dengan sebuah komposit

primary key, disebut dengan table fakta, dan satu set table yang

lebih kecil disebut table dimensi. Setiap table dimensi memiliki

sebuah simple primary key yang merespon tepat pada satu

komponen primary key pada tabel fakta. Dengan kata lain primary

key pada table fakta terdiri dari dua atau lebih foreign key. Struktur

karakteristik ini disebut dengan skema bintang atau join bintang.

Fitur terpenting dalam model dimensional ini adalah semua

natural keys diganti dengan kunci pengganti (surrogate keys).

Maksudnya yaitu setiap kali join antar tabel fakta dengan tabel

dimensi selalu didasari kunci pengganti. Kegunaan dari kunci

pengganti adalah memperbolehkan data pada data warehouse

34

untuk memiliki beberapa kebebasan dalam penggunaan data, tidak

seperti halnya yang diproduksi oleh sistem OLTP.

Sebuah sistem OLTP memerlukan normalisasi untuk

mengurangi redudansi, validasi untuk input data, mendukung

volume yang besar dari transaksi yang bergerak sangat cepat.

Model OLTP sering terlihat seperti jaring laba-laba yang terdiri

atas ratusan bahkan ribuan tabel sehingga sulit untuk dimengerti.

Sebaliknya, dimension model yang sering digunakan pada data

warehouse adalah skema bintang atau snowflake yang mudah

dimengerti dan sesuai dengan kebutuhan bisnis, mendukung query

sederhana dan menyediakan performa query yang superior dengan

meminimalisasi tabel-tabel join. Berikut contoh perbandingan

diagram antara model data OLTP dengan dimension table data

warehouse :

35

Gambar 2.10 Model Data OLTP

(Sumber : Gustiarahman, 2006)

D. Perancangan Data Warehouse dengan Skema Bintang

Skema bintang (Connoly dan Begg, 2005, p1183) adalah

struktur logikal yang memiliki tabel fakta yang mengandung data

faktual pada pusatnya dan dikelilingi oleh tabel dimensi yang

mengandung data referensi (yang dapat didenormalisasi).

Skema bintang merupakan tabel fakta yang terdapat di tengah,

yang terhubung pada serangkaian tabel dimensi. Skema bintang

mengeksploitasi karakteristik dari data faktual seperti fakta yang

dihasilkan oleh kejadian pada masa lampau, dan tak mungkin

untuk berubah, tanpa mempedulikan bagaimana mereka dianalisis.

36

Gambar 2.11 Skema Bintang (Conolly dan Begg, 2005, p1184)

a) Keuntungan mengggunakan Skema Bintang :

Skema bintang memiliki beberapa keuntungan yang

tidak terdapat dalam struktur relational biasa. Keuntungan

menggunakan skema bintang yaitu :

a. Respon data yang lebih cepat dihasilkan dari

perancangan database.

b. Kemudahan dalam mengembangkan atau

memodifikasi data yang terus berubah.

37

c. End user dapat menyesuaikan cara berpikir dan

menggunakan data, konsep ini dikenal juga dengan

istilah pararel dalam perancangan database.

d. Menyederhanakan pemahaman dan penelusuran

metadata bagi pemakai dan pengembang.

E. Skema Bintang Sederhana

Dalam skema ini, setiap table harus memiliki primary key yang

terdiri dari satu kolom atau lebih. Primary key dari table fakta

terdiri dari satu atau lebih foreign key. Foreign key merupakan

primary key pada table lain.

Gambar di bawah ini menggambarkan hubungan antara tabel

fakta dan dimensi dalam skema bintang sederhana.

Gambar 2.12 Skema Bintang Sederhana (Poe et al., 1998, p195)

F. Skema Bintang dengan banyak Tabel Fakta

Konsep skema bintang dengan banyak tabel fakta sama

dengan skema bintang sederhana. Perbedaannya adalah skema

bintang dengan banyak tabel fakta memiliki lebih dari satu tabel

fakta yang saling berhubungan dengan tabel dimensi yang sama.

38

Berikut ini adalah gambar skema bintang dengan banyak tabel

fakta:

Gambar 2.13 Skema Bintang dengan Banyak Tabel fakta

(Poe et al., 1998, p196)

G. Skema Bintang Majemuk

Tabel fakta dalam skema majemuk memiliki dua kumpulan

foreign key, yang pertama mengandung suatu referensi dengan

tabel dimensi sedangkan sisanya adalah primary key yang

merupakan gabungan dari satu atau lebih kolom yang

menghasilkan suatu identifikasi unik untuk setiap barisnya. Dalam

skema bintang majemuk, tabel faktanya memiliki sekumpulan

foreign key yang mengacu pada tabel dimensi dan primary key.

Primary key ini terdiri dari satu atau lebih kolom yang

menyediakan identifier yang unik untuk setiap barisnya. Dalam

skema bintang majemuk, primary key dan foreign key tidaklah

identik. Inilah yang membedakan skema bintang majemuk

dengan skema bintang sederhana. Skema bintang majemuk dapat

39

digambarkan seperti di bawah ini :

Gambar 2.14 Skema Bintang Majemuk (Poe et al., 1998, p200)

H. Skema SnowFlake

Skema snowflake adalah variasi dari skema bintang yang tabel

dimensinya tidak mengandung data denormalisasi. Skema

snowflake mengijinkan dimensi memiliki dimensi. (Connoly dan

Begg, 2005, p1184)

Skema snowflake merupakan perbaikan skema bintang yang

beberapa hirarki dimensionalnya dinormalisasi menjadi

serangkaian tabel dimensi yang lebih kecil. Berikut adalah

gambar skema snowflake.

40

Gambar 2.15 Skema Snowflake

Keuntungan dan Kerugian Skema Snowflake :

1. Kecepatan memindahkan data dari data OLTP ke dalam

metadata.

2. Sebagai kebutuhan dari alat pengambil keputusan

tingkat tinggi dimana dengan tipe yang seperti ini,

seluruh struktur dapat digunakan sepenuhnya.

Kerugian dari skema snowflake adalah :

1. Skemanya kurang jelas dan end user terhambat oleh

kompleksitas.

2. Sulit untuk mencari isi skema karena terlalu kompleks.

3. Performa query menurun karena adanya tambahan

gabungan tabel.

4. Mempunyai masalah yang besar dalam hal kinerja, hal

ini disebabkan semakin banyaknya join antar tabel-tabel

yang dilakukan dalam skema snowflake.

41

Ciri-ciri snowflake adalah :

a) Tabel dimensi dinormalisasi dengan dekomposisi pada

tingkat atribut.

b) Setiap dimensi mempunyai satu key untuk setiap tingkat

pada hirarki dimensi.

c) Kunci tingkat terendah menghubungkan tabel dimensi

dengan tabel fakta dan tabel atribut bertingkat rendah.

I. Keuntungan Pemodelan Dimensional

Berikut ini adalah keuntungan menggunakan

pemodelan dimensional dalam lingkungan data warehouse

(Connoly dan Begg, 2005, p1185-1186):

1. Efisiensi

Konsistensi struktur database pokok

memperbolehkan akses yang lebih efisien ke data oleh

alat yang beragam termasuk report writers dan query

tools.

2. Kemampuan untuk menangani kebutuhan yang selalu

berubah

Skema bintang dapat mengadaptasi terhadap

perubahan dalam kebutuhan pengguna, sebagaimana

semua dimensi ekuivalen dalam hal penyediaan akses

ke tabel fakta. Hal ini berarti rancangan dapat lebih baik

mendukung ad hoc user queries.

42

3. Pemrosesan query yang dapat diprediksi

Aplikasi drill down data warehouse akan

secara sederhana menambah atribut dimensi yang lebih

banyak dari dalam skema bintang tunggal. Drill across

application akan menghubungkan tabel fakta yang

terpisah melalui dimensi yang terbagi. Walaupun

keseluruhan rangkaian skema bintang dalam model

dimensional perusahaan kompleks, pemrosesan query

dapat diprediksi karena pada tingkat terendah, setiap tabel

fakta harus di-query secara mandiri.

4. Dapat mempersempit lingkup data untuk pemrosesan

Decision Support Systems sehingga lebih sederhana dalam

mengakses dan menganalisisnya.

2.1.5.6. Metadata

Menurut Inmon (2005, p102), metadata adalah sebuah

komponen penting dari lingkungan data warehouse. Metadata

telah menjadi bagian dari lingkungan pemrosesan informasi selama

telah ada program dan data. Tetapi dalam dunia data warehouse,

metadata mendapatkan tingkat kepentingan yang baru, untuk

segala usaha yang paling efektif digunakan pada data warehouse.

Metadata memungkinkan end user atau decision support

system analyst untukmenavigasi melalui beberapa kemungkinan.

Ketika user akan menggunakan data warehouse yang tidak

memiliki metadata, maka user tidak tahu darimana akan memulai

analisa. Dengan adanya metadata, maka user dapat dengan cepat

43

mencari data yang penting atau menentukan data yang tidak ada

dalam data warehouse. Metadata bertindak sebagai index untuk isi

dari data warehouse.

Metadata adalah informasi terstruktur yang

mendeskripsikan, menjelaskan, menemukan, atau setidaknya

membuat menjadikan suatu informasi mudah untuk ditemukan

kembali, digunakan, atau dikelola. Metadata sering disebut sebagai

data tentang data atau informasi tentang informasi. Metadata ini

mengandung informasi mengenai isi dari suatu data yang dipakai

untuk keperluan manajemen file/ data itu nantinya dalam suatu

basis data.

Metadata items menyimpan hal-hal sebagai berikut:

� Struktur data bagi programmer

� Struktur data bagi DSS Analyst

� Sumber data untuk data warehouse

� Transformasi data ke data warehouse

� Data model

� Relationship antara data model dan data warehouse

� Histori extracts

2.1.5.7. Proses Transfer Data dari Lingkungan Operasional

ke Data Warehouse

Tiga proses pemindahan data dari lingkungan operasional ke data

warehouse, yaitu :

44

1. Extraction

Data ditemukan dan dipindahkan dari sistem

operasional ke data warehouse atau platform transformasi.

2. Transformation

Suatu program special atau software tool yang

membersihkan data operasional agar sesuai dengan definisi

awal aturan transformasi untuk data warehouse.

3. Loading

Suatu program atau tool-tool seringkali yang sama

dengan yang digunakan untuk transformasi memindahkan data

ke dalam tabel data warehouse.

Gambar 2.16 Extraction, Transformation, and Loading

45

2.1.5.8. Metodologi Perancangan Data Warehouse

Berdasarkan kutipan dari Connolly dan Begg (2005, p1187-1193),

metodologi yang dikemukakan oleh Kimball dalam membangun data

warehouse ada 9 tahapan, yang dikenal dengan Nine-step Methodology.

Sembilan tahap tersebut adalah :

Langkah 1 : Pemilihan proses

� Data mart yang pertama kali dibangun haruslah data mart yang

dapat dikirim tepat waktu dan dapat menjawab semua pertanyaan

bisnis yang penting.

� Pilihan terbaik untuk data mart yang pertama adalah yang

berhubungan dengan sales, misal property sales, property

leasing,property advertising.

Langkah 2 : Pemilihan sumber

� Untuk memutuskan secara pasti apa yang diwakili atau

direpresentasikan oleh sebuah tabel fakta.

� Misal, jika sumber dari sebuah tabel fakta properti sale adalah

properti sale individual maka sumber dari sebuah dimensi

pelanggan berisi rincian pelanggan yang membeli properti utama.

Langkah 3 : Mengidentifikasi dimensi

� Set dimensi yang dibangun dengan baik, memberikan kemudahan

untuk memahami dan menggunakan data mart.

� Dimensi ini penting untuk menggambarkan fakta-fakta yang

terdapat pada tabel fakta.

46

� Misal, setiap data pelanggan pada tabel dimensi pembeli dilengkapi

dengan

id_pelanggan,no_pelanggan,tipe_pelanggan,tempat_tinggal, dan

lain sebagainya.

� Jika ada dimensi yang muncul pada dua data mart, kedua data

mart tersebut harus berdimensi sama, atau paling tidak salah

satunya berupa subset matematis dari yang lainnya.

� Jika sebuah dimensi digunakan pada dua data mart atau lebih,dan

dimensi ini tidak disinkronisasi, maka keseluruhan data warehouse

akan gagal, karena dua data mart tidak bisa digunakan secara

bersama-sama.

Langkah 4 : Pemilihan fakta

� Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa

digunakan dalam data mart.

� Semua fakta harus diekspresikan pada tingkat yang telah

ditentukan oleh sumber.

Langkah 5 : Menyimpan pre-kalkulasi di tabel fakta

Setelah fakta-fakta dipilih maka dilakukan pengkajian ulang untuk

menentukan apakah fakta-fakta yang dapat diterapkan kalkulasi awal

dan melakukan penyimpanan pada tabel fakta. Contoh umum dari

kebutuhan untuk penyimpanan kalkulasi awal muncul ketika fakta

berisi pernyataan untung atau rugi. Situasi ini akan meningkat ketika

tabel fakta didasarkan pada invoice atau sales.

47

Langkah 6 : Melengkapi tabel dimensi

� Pada tahap ini kita menambahkan keterangan selengkap-

lengkapnya pada tabel dimensi.

� Keterangannya harus bersifat intuitif dan mudah dipahami oleh

Pengguna.

Langkah 7 : Pemilihan durasi database

Durasi mengukur waktu dari pembatasan data yang diambil dan

dipindahkan ke tabel fakta. Sebagai contoh perusahaan asuransi

memiliki kebutuhan untuk menyimpan data dalam jangka waktu 5

tahun atau lebih.

Langkah 8 : Menelusuri perubahan dimensi yang perlahan

• Ada tiga tipe perubahan dimensi yang perlahan, yaitu :

o Tipe 1. Atribut dimensi yang telah berubah tertulis

ulang.

o Tipe 2. Atribut dimensi yang telah berubah

menimbulkan

sebuah dimensi baru.

o Tipe 3. Atribut dimensi yang telah berubah

menimbulkan alternatif sehingga nilai atribut lama dan

yang baru dapat diakses secara bersama pada dimensi

yang sama.

48

Langkah 9 : Menentukan prioritas dan mode query

Mempertimbangkan pengaruh dari rancangan fisik, seperti

penyortiran urutan tabel fakta pada disk pdan keberadaan dari

penyimpanan awal ringkasan atau penjumlahan. Selain itu, masalah

administrasi, backup, kinerja indeks, dan keamanan juga merupakan

faktor yang harus dipertahankan.

Dengan langkah-langkah tadi, seharusnya kita bisa membangun

sebuah data warehouse yang baik.

2.1.5.9. Keuntungan Penggunaan Data Warehouse

Menurut Connolly dan Begg (2005, p1152), data warehouse yang

telah diimplementasikan dengan baik dapat memberikan keuntungan

yang besar bagi organisasi, yaitu:

• Potensi nilai kembali yang besar pada investasi Sebuah

organisasi harus mengeluarkan uang dan sumber daya dalam

jumlah yang cukup besar untuk memastikan kalau data

warehouse telah diimplementasikan dengan baik, biaya yang

dikeluarkan tergantung dari solusi teknikal yang diinginkan.

Akan tetapi, setelah data warehouse digunakan, maka

kemungkinan didapatkannya ROI (Return on Investment)

relative lebih besar.

• Keuntungan kompetitif

Keuntungan kompetitif didapatkan apabila pengambil

keputusan mengakses data yang dapat mengungkapkan

49

informasi yang sebelumnya tidak diketahui, tidak tersedia,

misalnya informasi mengenai konsumen, tren, dan permintaan.

• Meningkatkan produktivitas para pengambil keputusan

perusahaan data warehouse meningkatkan produktivitas para

pengambil keputusan perusahaan dengan menciptakan sebuah

database yang terintegrasi secara konsisten, berorientasi pada

subjek, dan data historis.

• Data warehouse mengintegrasikan data dari beberapa sistem

yang tidak compatible ke dalam bentuk yang menyediakan satu

pandangan yang konsisten dari organisasi. Dengan mengubah

data menjadi informasi yang berguna, maka seorang manajer

bisnis dapat membuat analisa yang lebih akurat dan konsisten.

50

2.2. Teori Khusus

2.2.1 Penjualan (Sales)

Penjualan merupakan sebuah proses dimana kebutuhan

pembeli dan kebutuhan penjualan dipenuhi, melalui antar

pertukaran informasi dan kepentingan. Jadi konsep penjualan

adalah cara untuk mempengaruhi konsumen untuk membeli

produk yang ditawarkan. (Kotler, and Armstrong, 2006).

Penjualan adalah dengan menjual barang dagangannya,

maka perusahaan akan menghasilkan pendapatan sejumlah

harga barang yang dibebankan kepada pembeli. Transaksi ini

diikuti syarat jual beli yang mengikat kedua belah pihak.

(Suranto, 2002)

Penjualan adalah suatu usaha yang terpadu untuk

mengembangkan rencana-rencana strategis yang diarahkan

pada usaha pemuasan kebutuhan dan keinginan pembeli, guna

mendapatkan penjualan yang menghasilkan laba. Penjualan

merupakan sumber hidup suatu perusahaan, karena dari

penjualan dapat diperoleh laba serta suatu usaha memikat

konsumen yang diusahakan untuk mengetahui daya tarik

mereka sehingga dapat mengetahui hasil produk yang dihasikan

(Iskandar, 2009a).

51

2.2.2 Promosi (Promotion)

Promosi merupakan teknik komunikasi yang secara

penggunaannya atau penyampaiannya dengan menggunakan media

seperti: pers, televisi, radio, papan nama, poster dan lain-lain yang

bertujuannya untuk menarik minat konsumen terhadap hasil produksi

suatu perusahaan. Promosi sebagai media untuk menjembatani

kepentingan produsen dengan konsumen (Musliadi, 2012).

Sedangkan pengertian promosi menurut Alma (2006 : 179)

adalah: Promosi adalah sejenis komunikasi yang memberi penjelasan

dan meyakinkan calon konsumen mengenai barang dan jasa dengan

tujuan untuk memperoleh perhatian, mendidik, mengingatkan dan

meyakinkan calon konsumen.

Promosi merupakan alat komunikasi dan penyampaian pesan

yang dilakukan baik oleh perusahaan maupun perantara dengan tujuan

memberikan informasi mengenai produk, harga dan tempat. Informasi

itu bersifat memberitahukan, membujuk, mengingatkan kembali

kepada konsumen, para perantara atau kombinasi keduanya. Dalam

promosi juga, terdapat beberapa unsur yang mendukung jalannya

sebuah promosi tersebut yang biasa disebut bauran promosi (Iskandar,

2009b).

52

2.2.3 Biaya (Cost)

Biaya didefinisikan sebagai kas atau nilai ekuivalen kas yang

dikorbankan untuk mendapatkan barang atau jasa yang diharapkan

memberikan manfaaf saat ini atau di masa yang akan datang bagi

organisasi (Hansen & Mowen, 2006).

Biaya merupakan kas atau nilai ekuivalen kas yang dikeluarkan

oleh perusahaan untuk mendapatkan barang atau jasa yang diharapkan

guna untuk memberikan suatu manfaat yaitu peningkatan laba

(Iskandar, 2009a).