Upload
dangmien
View
240
Download
13
Embed Size (px)
Citation preview
IMPLEMENTASI BUSINESS INTELIGENCE (BI) UNTUK ANALISA DAN PRAKIRAAN CUACA MARITIM
Subekti Mujiasih, S.Si, M.TISubekti Mujiasih, S.Si, M.TISub bidang Bina Operasi Meteorologi MaritimSub bidang Bina Operasi Meteorologi Maritim
[email protected]@bmkg.go.id
Seminar Jurnal Club 24 Mei 2011
1
PendahuluanLatar BelakangKajian PustakaSumber DataRancangan Business IntelligenceRancangan Arsitektur FisikPenerapan Business IntelligencePenerapan Data MiningKesimpulanSaran
2
3
4
Reporting data Cuaca dari AWS
5
6
Definisi BI (Bapepam,2007) : BI merupakan sistem pendukung
pengambilan keputusan yang berbasiskan data-data. “Business
Intelligence menjelaskan tentang suatu konsep dan metode
bagaimana untuk meningkatkan kualitas pengambilan keputusan
bisnis berdasarkan sistem yang berbasiskan data. BI seringkali
dipersamakan sebagaimana briefing books, report and query tools,
dan sistem informasi eksekutif.”
7
Manfaat BI :
• Meningkatkan nilai data dan informasi organisasi
• Memudahkan pemantauan kinerja organisasi
• Meningkatkan nilai investasi TI yang sudah ada
• Menciptakan pegawai yang memiliki akses informasi yang baik
(well-informed workers)
• meningkatkan layanan kepada pengguna jasa dengan melakukan
pemrosesan permintaan dan penyelesaian masalah yang tepat
waktu
• membantu mengidentifikasi waktu yang diperlukan untuk sebuah
bagian proses tertentu
Keakuratan, ketepatan dan kecepatan akses informasi BMKG masih menjadi kendala.
Data belum seluruhnya terintegrasi dengan baik dimana masih terkumpul dalam aplikasi-aplikasi yang berbeda.
Seringnya keterlambatan pembuatan dan pelaporan prakiraan cuaca karena ketika akan mengakses, prakirawan harus berpindah-pindah sumber data
Prediksi Cuaca sangat sulit karena melibatkan banyak sumber data:data pengamatan, data model aplikasi cuaca, data gambar kondisiawan dari satelit, data kondisi awan dari radar
Prakiraan cuaca maritim umumnya mengandalkan kemampuan dari Prakirawan (Human Expert)
8
Peneliti Judul Data Tool
Nan Ma,et.al.2010. Perancangan Data Warehouse untuk data pengamatan cuaca stasiun
Data Curah hujan, Temperature dan Kelembaban Relative
SQL Server Analysis 2005 dan SQL Server Reporting 2005
Wijaya, Ferry 2010. Business Intelligence:Desain dashboard dan Scorecard untuk meningkatkan Kinerj EPC-Studi Kasus PT.TriPatra
Material Proyek, Jumlah Pegawai, waktu kerja dan jadwal
SQL Server 2008, SSAS,SSIS
Gultom,Arthur.SH.2009 Implementasi Business Intelligence untuk Pengenalan Pola Bisnis di daerah Jakarta Selatan (berbasis GIS(lokasi)
Data bisnis di Jakarta Selatan
Birt
Albaar Rubhasy.2008 Implementasi Business Intelligence Dalam Pengambilan Keputusan di Bappenas
Data Perencanaan dari BPS
Pentaho
Iqbal. 2008 PenerapanData mining di Badan Meteorologi dan Geofisika untuk memprediksi cuaca di Jakarta
Data Curah hujan di Stasiun-stasiun Jakarta
Weka
Badan Pengawas Pasar Modal dan Lembaga Keuangan. 2007
Laporan Tim Studi tentang Implementasi Business Intelligence
UCAR, 2007 Prediksi
Hurricane Dean Data Konveksi
TRMM Data Mining
9
Data sinoptik dari 9 stasiun meteorologi maritim selama tahun 2009 dari aplikasi CMSS (19761 raw data)
Data gelombang harian dari pengamatan satelit selama tahun 2009 pada domain wilayah 23 N – 23 S dan 80 – 160 E.(1385748 raw data)
Data gelombang hasil running windwave harian selama tahun 2009 dengan domain 15 N – 15 S, 90 – 150 E. Format data berupa txt. Tidak semua parameter digunakan, jadi hanya arah dan kecepatan angin, arah dan tinggi gelombang h10, h100, htot, tinggi swell dan periode swell. (127643 raw data)
Data pasang surut di 13 stasiun Maritim selama tahun 2009 dari aplikasi AWS (55769 raw data)
1
0
Data Warehouse
Client Server
Database
AWS Maritim
(MySQL)
Database
Sinoptik
(Oracle)
Database
Sinoptik
(Oracle)
Data
Windwaves‐05
(text)
Data
Windwaves‐05
(text)
Database
Wave Satelit
(Netcdf)
Database
Wave Satelit
(Netcdf)
Data Mart
Maritim
(SQL Server
Database 2008
Data Mart
Maritim
(SQL Server
Database 2008
OLAP/
Dimensional Cube
(SQL Server Analysis Services
2008)
OLAP/
Dimensional Cube
(SQL Server Analysis Services
2008)
Reporting
Dashboard
Reporting
Dashboard
Data Mining
(Orange Lab)
Data Mining
(Orange Lab)
End User
Bidang
Metmar
End User
Bidang
Metmar
Business Intelligence Tools
ETL
C#,.Net Framework 3.5
ETL
C#,.Net Framework 3.5
Bidang
Meteorologi
Maritim
Bidang Sistem
Operasi
Jaringan
Komunikasi
External Data
AVISO
Data SourceUnit Organisasi User
1
1
(SQL Server Reporting
Services
2008)
12
13
14
15
16
17
Tabel data Cuaca Sinoptik Tahun 2009
18Hal 67
Grafik Perbandingan Kecepatan angin, Suhu Udara, suhu Titik embun dan tutupan Awan
19
Grafik Kecepatan angin
20
Grafik Perbandingan Tinggi gelombang satelit dan model Windwaves-05
21
Grafik Pola Tinggi gelombang selama Tahun 2009 di Wilayah Enggano
22
Report Tinggi gelombang selama Tahun 2009 di semua lokasi
23
Analisis Data Cuaca dari AWS
24
Reporting data Cuaca dari AWS
25
Analisis data Pasang Surut dan kinerja AWS
Data Warehouse
Client Server
Database
AWS Maritim
(MySQL)
Database
Sinoptik
(Oracle)
Database
Sinoptik
(Oracle)
Data
Windwaves‐05
(text)
Data
Windwaves‐05
(text)
Database
Wave Satelit
(Netcdf)
Database
Wave Satelit
(Netcdf)
Data Mart
Maritim
(SQL Server
Database 2008
Data Mart
Maritim
(SQL Server
Database 2008
OLAP/
Dimensional Cube
(SQL Server Analysis Services
2008)
OLAP/
Dimensional Cube
(SQL Server Analysis Services
2008)
Reporting
Dashboard
Reporting
Dashboard
Data Mining
(Orange Lab)
Data Mining
(Orange Lab)
End User
Bidang
Metmar
End User
Bidang
Metmar
Business Intelligence Tools
ETL
C#,.Net Framework 3.5
ETL
C#,.Net Framework 3.5
Bidang
Meteorologi
Maritim
Bidang Sistem
Operasi
Jaringan
Komunikasi
External Data
AVISO
Data SourceUnit Organisasi User
26
(SQL Server Reporting
Services
2008)
27
28Hal 69
Association Rule : Metode untuk memeriksa semua kemungkinan hubungan if-then antar item dan memilih hanya yang paling mungkin sebagai indikator dari hubungan ketergantungan antar item
Classification (Iqbal,2007) adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.(studi kasus menggunakan Classification Tree dan Random Forest)
29Hal 69
No. Model
Prediksi Support ConfidenceLift
Ratio
1 f_aw f_te stationID dateID f_ws ‐> f_ch 1 1 1
2 f_ws f_aw stationID dateID f_te f_tp ‐> f_ch 0.999 1 1
3 f_ws f_te stationID dateID ‐> f_aw 1 1 1
4 f_tp f_te stationID f_ws dateID ‐> f_aw 0.999 1 1
Kelompok
Rule
Jumlah Rule Min Support Confidence Lift Ratio
1 2059 97‐97% 97‐97% 100%
2 2059 97‐97% 100% 100%
3 1932 100‐100% 100% 100%
Association Rule : Kebergantungan antar dataMinimum Support : 53%, minimum Confidence : 89%
Metode Classification Tree dan Random Forest untuk Prediksi cuaca awan dari masukan tutupan awan, kecepatan angin, Suhu udara dan suhu titik embun
30
31Hal 72 revisi
Metode Classification Tree dan Random Forest untuk Prediksi cuaca awan dari masukan tutupan awan, kecepatan angin, Suhu udara dan suhu titik embun
32Hal 72 revisi
Metode Classification Tree dan Random Forest untuk Prediksi cuaca awan dari masukan tutupan awan, kecepatan angin, Suhu udara dan suhu titik embun
33
Metode Classification Tree dan Random Forest untuk Prediksi cuaca awan dari masukan nilai Suhu udara dan suhu titik embun
34Hal 72 revisi
Menampilkan nilai statistik dari ribuan data Gelombang
35
1.
Ketersediaan data mart yang berisi gabungan data maritim sangat membantu analisa parameter cuaca harian selama satu tahun, dalam waktu yang sangat cepat karena adanya fasilitas drill down, roll up, slice dan dice pada reporting dan dashboard.
2.
Presentasi dashboard memudahkan analisa yang bersifat spasial seperti koordinat lintang dan bujur, posisi stasiun atau posisi AWS.
3.
Kemampuan data mining yang menggabungkan kemampuan database dan statistika membantu analisa 4 atribut data gelombang selama tahun 2009 yang bervolume besar.
4. Model prediksi cuaca yang dihasilkan oleh metode data mining, hanya memerlukan sebagian komponen data cuaca sebagai masukan yakni suhu udara, suhu titik embun, kecepatan angin dan tutupan awan.
36
5.
Penggunaan dashboard sangat memudahkan analisa kesamaan pola antara komponen data cuaca pada wilayah dan waktu tertentu seperti analisa pola cuaca dari data sinoptik
dan AWS.
6.
Pola
komponen
data cuaca
suatu
wilayah
yang diperoleh
dari
dashboard dapat
dijadikan
dasar
untuk
membuat model prediksi
pada
proses
data mining.
7. Model prediksi cuaca hasil metode Classification Tree dan Random Forest memberikan batas nilai yang lebih spesifik daripada hasil metode Association Rule.
8.
Data yang kurang valid bisa tidak dihapuskan untuk keperluan monitoring kondisi alat pengamatan yang rusak atau sarana komunikasi yang kurang mendukung.
9.
Rancangan arsitektur Business Intelligence yang dikembangkan dilakukan dengan pendekatan bottom up agar rancangan dapat segera diterapkan dalam kegiatan operasional sehari-hari.
37
1.
Kajian Business Intelligence
yang menampilkan informasi analysis secara spasial sangat diperlukan
2.
Data sebaiknya dibersihkan dulu atau dilakukan pengecekan di lapangan karena kemungkinan alat pengamatan rusak.
3.
Perlunya kajian lanjutan pada parameter cuaca lain dari setiap level ketinggian atmosfer.
4.
Perlunya kajian Image mining seperti identifikasi jumlah tutupan
awan dan jenis awan agar tidak bergantung pada pengamatan manual
38
Diadopsi dari : Bayu I Dwisetyo, 2010
39Hal 36
http://www.element61.be/e/compete.asp?ServiceId=126Microsoft Business Intelligence & SQL Server ArchitectureMicrosoft has a strong suite for as well the back-end
as the front-end functionality
of a Business Intelligence & Performance Management architecture. Element61 expertise covers the complete end-to-end technology stack.
BACK-END ARCHITECTURESQL Server database: To provide an optimal storage for all data warehousing needs. Integration Services: Integration Services is the ETL tool from Microsoft. It's an enterprise grade tool for extracting, transforming and loading your data warehouseAnalysis Services: composed the OLAP/cubes solution of Microsoft.
FRONT-END ARCHITECTUREReporting Services: the Microsoft solutions for all your reporting needs. Report Builder: delivers intuitive report authoring capabilities to end users. In addition to offering an enhanced authoring experience for business users, Report Builder
2.0 benefits power users that are looking for a more sophisticated authoring environment. Microsoft Excel:
is the most commonly used "Business Intelligence"
solution today. It is a powerful application that provides all the functionality you need in order
to create spreadsheets, analyze data, and share information in a manageable environment. On top of Analysis Services one can easily create and use reports that include formatted
tables, graphs and rich data visualization. MS Excel
nowadays also has -
quite unknown-
easy-to-use data mining capabilities, which
enable predictive analysis at every desktop. By harnessing the data mining algorithms of Microsoft SQL Server 2005 Analysis Services, business users can quickly gain valuable insight into complex sets of data with just a few mouse clicks. All this information can then be shared and viewed in your corporate SharePoint
environment.SharePoint: From all
knowledge management functionalities
Microsoft SharePoint
offers, for Business Intelligence probably the most important feature
is to facilitate the collaboration between individuals and teams
in your organization.
40
Mendukung berbagai teknologi basis data seperti oracle, sql server , IBM db2 dllMemiliki data integration tool yang mendukung proses ETLMemiliki analysis (OLAP) tools untuk melakukan analisa berdasarkan queryMemiliki reporting tools yang terintegrasi dengan OLAP tools dan mampu menghasilkan laporan dalam berbagai formatMemiliki dashboard yang terintegrasi dengan OLAP dan analystics tools untuk monitoring kinerja operasional organisasi.
41Hal 27
42
43
44Hal 44
Gambar
2.6
Kedudukan
OLAP dalam
BISumber : Rubhasy, 2008
45Hal 20
46
47
Data suhu dari pengamatan permukaan di 9 stasiun meteorologi maritim dari aplikasi CMSS (19641 raw data)
Kelompok data synop Bentuk sandi data synop adalah sebagai berikut :MiMiMjMj YYGGiw IiiiiiRixhVV Nddff 1SnTTT 2 SnTdTdTd 3PoPoPo 4PPPP 5appp6RRRtr 7wwW1W2 8NhCLCH 9GGgg
Sample data Synop
48Hal 47
49Hal 86
50Hal 87
Metode Association Rule (rule antar komponen data cuaca)Metode untuk memeriksa semua kemungkinan hubungan if-then antar item dan memilih hanya yang paling mungkin sebagai indikator dari hubungan ketergantungan antar item◦
Support (%) : jumlah transaksi yang mengandung item baik dalam entecedent (X:sebab) maupun consequent (Y:akibat)
◦
Confidence (%)Conf( X Y) = supp (X U Y)/supp(X)Confidence = jumlah transaksi dengan item dalam antecedent dan consequent
jumlah transaksi dengan item dalam antecedentConfidence benchmark = jumlah transaksi dengan item dalam consequent
jumlah transaksi dalam database
◦
Lift Ratio (%) = confidenceConfidence benchmark
Lift ratio > 1 kekuatan asosiasinya lebih besar
51Hal 22-24
52Hal 69-70
Classification (Iqbal,2007) adalah proses untuk menemukan model atau fungsi yang menjelaskan atau membedakan konsep atau kelas data, dengan tujuan untuk dapat memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.Salah satunya C4.5
Decison tree adalah salah satu metode classification yang paling mudah untuk diintrepretasikan manusia. Decision tree sesuai digunakan untuk kasus-kasus dimana outputnya bernilai diskrit.
Prediksi tutupan awan dari infomasi suhu udara (bola kering) dan suhu titik embun (bola basah)
Cuaca
Ya
Ya
Ya
Ya
Ya
Ya
Tidak
Tidak
Ya
Ya
Tidak
Tidak
Tidak
HujanCerah Mendung
Gambar 1.2. Semua kemungkinan pemilihan atribut
Sumber : Budi Santoso,2007
Temperatur
Ya
Ya
Ya
Ya
Tidak
Tidak
Ya
Ya
Ya
Tidak
Ya
Ya
Tidak
Tidak
DinginPanas Sedang
53Hal 24-25
Orange adalah perangkat lunak opensource yang dapat digunakan untuk visualisasi dan analisis data. Data mining dapat dilakukan dengan menggunakan pemrograman visual maupun script python.
Orange memungkinkan pengguna yang tidak memahami sedikitpun tentang pemrograman melakukan visualisasi dan analisis data.
Orange mendukung visualisasi data seperti scatterplots, bar charts, trees, dendrograms, networks dan heatmaps. Hingga saat ini tersedia lebih dari 100 widget untuk melakukan visualisasi dan analisis data, yang dibagi menjadi beberapa kelompok yakni: Data, Visualize, Classify, Regression, Evaluate, Unsupervised, Associate, Prototypes, Bioinformatics dan TextMining.
Orange dapat diperoleh secara gratis di http://www.ailab.si/orange/nightly_builds.html, dengan dukungan penuh terhadap sistem operasi Windows, Linux maupun MacOSX (Materi Kuliah DMBI,2010).
54Hal 27