Upload
awrago
View
3.618
Download
1
Tags:
Embed Size (px)
Citation preview
Data scraping is a technique in which a computer program extracts data from human-readable output coming from another program
Source: https://en.wikipedia.org/wiki/Data_scraping
Source: http://www.nytimes.com/interactive/2015/05/03/upshot/the-best-and-worst-places-to-grow-up-how-your-area-compares.html?_r=0&abt=0002&abg=1
OPEN DATA
is data that can be freely used,
reused, and redistributed by anyone –
subject only, at most, to the requirement
to attribute and share alike
Open Definition
“
”
Menjadikan data terbuka sebagai
pendorong terciptanya pemerintah yang
akuntabel dan pertumbuhan dunia
usaha di Indonesia
VISI
penciptaan
lapangan kerja
kebijakan
berbasis data
akses informasi
publik
Ada 2 buah bola, yang satu berwarna merah yangsatu berwarna putih. Diameter kedua bolatersebut adalah 2.5 cm dan 3 cm
nama_benda warna_benda diameter (cm)
Bola 1 Merah 2.5
Bola 2 Putih 3
3 Prinsip Data Bersih
Data terstruktur dan diformat sesuai dengan kebutuhandan tool yang anda gunakan
Berisi hal yang benar-benar penting dan hilangkandata atau informasi yang tidak diperlukan
Konsisten dalam penamaan, tipe, dan konteks data
RAPI
INFORMATIF
KONSISTEN
★ Tersedia dalam situs saja
★★ Tersedia dalam bentuk yang terstruktur
★★★ Tersedia dalam bentuk terstruktur danmenggunakan format terbuka
★★★★ Menggunakan URI untuk penyajian data
★★★★★ Data sudah bertautan antara satu denganyang lainnya
Fungsi Utama Metadata
Metadata membantu untuk menyusundata sehingga memudahkan pencariandan penggunaan
Jika terjadi kesalahan atau kekurangan padadata, metadata dapat diandalkan untukmencari sumber permasalahan tersebut
KATALOG
AUDIT
• Get Started with Scraping -http://schoolofdata.org/2013/06/18/get-started-with-scraping-extracting-simple-tables-from-pdf-documents/
• How to Extract Data from PDF -http://www.interhacktives.com/2014/03/12/extract-data-pdf/
• Scraping PDF - https://blog.scraperwiki.com/tag/pdf/
• Data Science Resource - http://www.datascienceweekly.org/data-science-resources
Referensi