DARK DATA AND DIRTY DATA
Dwie ciemne strony danych - Big Data
26.04.2016
Kontakt Dane rejestrowe
Cloud Technologies S.A.Kruczkowskiego 200-412 Warszawa
+48.22.535.30.50biuro@cloudtechnologies.plwww.cloudtechnologies.pl
Cloud Technologies S.A.ul. Żeromskiego 705-075 Warszawa
KRS: 0000405842NIP: 9522106251REGON: 142886479
Kapitał zakładowy: 460.000,00 złSąd Rejonowy dla m.st. Warszawy w Warszawie XIII Wydział Gospodarczy Krajowego Rejestru Sądowegoul. Czerniakowska 100, 00-454 Warszawa
26.04.2016
Dark & Dirty Data
Według IDC
90% danych w internecie to Dark Data
Pozostałe 10% to Dirty Data
26.04.2016
Implozja Big Data
W 2020 roku internet będzie kilka razy większy. Dzisiaj liczy 6 ZB (zetaba-jtów) danych.
Za 5 lat internet będzie liczył 45 ZB.
Według Oracle internet rozrasta się w dane 40% rocznie.
kilobajtmegabajtgigabajtterabajtpetabajteksabajtzettabajt
kBMBBGTBPBEBZB
10 = 100010 = 1000 10 = 100010 = 100010 = 100010 = 100010 = 1000
Wielokrotność bajtów
26.04.2016
Digital Dark Age
Era Dark Data
czyli danych nieuporzadko- wanych, nieustrukturyzowanych, nieprzetworzonych, surowych jest dziś największym wyz-waniem.
Nie wiadomo co w sobie kryją i co możemy odkryć. Może to być puszka pandory lub jak garnek złota na końcu tęczy.
26.04.2016
Na zaś, na zapas, na wszelki wypadek...
Często firmy gromadzą dane na wszelki wypadek, na zapas, na później łudząc sie ze przyjdzie czas na ich analizę. Równie czesto ignorują dark data i nie wiedzą jak się do nich zabrać lub widząc w takim przedsięwzięciu syzyfową pracę...
26.04.2016
1Dane, o których istnieniu przed-siębiorstwo nie zdaje sobie sprawy, więc ich nie gromadzi, ani nie przetwarza.
2Dane, o których przedsiębior- stwo wie i je gromadzi ale nie ma pojęcia jak je przetworzyć.
3Dane, o których przedsiębior- stwo wie i je gromadzi a nawet dysponuje narzędziami do ich analizy lecz nie podejmuje się ich analizy, ponieważ uznaje ją za zbyt kosztowną lub obawia się, że rezultaty będą nie- współmierne z nakładem pracy.
Dark Data wg Cloud Technologies
26.04.2016
Zmarnowany potencjał, cy-frowy bełkot, jak brudna plama na tkaninie, którą jest Big Data. Dirty Data zanieczyszczają wartościowe Big Data, takie jak informacje o gustach, inten- cjach, zainteresowaniach czy zachowaniach internautów.
Dirty Data
26.04.2016
Źródła Dirty Data
Najciemniej pod latarnią… Facebook (lajki, komentarze, tagi, hashtagi z fanpage’y).
Dirty Data wprowadzaja w błąd i dostarczaja pesudo wiedzy.
26.04.2016
Baaaaaaardzo dużo danych...
Każdej minuty, każdego dnia...
Facebookużytkownicy polubili 4,166,667 postów
Twitterużytkownicy wysłali 347,222 tweetów
Youtubeużytkownicy wgrali 300 godzin filmów
Skypeużytkownicy wykonali 110,040 telefonów
Instagramużytkownicy polubili 1,736,111 zdjęć
Źródło: https://www.domo.com/blog/2015/08/data-never-sleeps-3-0/
26.04.2016
Data Management Platform
Behavioralengine.com
to platforma zarządzania danymi (Data Management Platform).
Zwiększa skuteczność reklamy internetowej.
Pozwala zdobyć wiedzę o użytkownikach.
Optymalizuje sprzedaż on-line.
Wzbogaca systemy CRM.
Przykładowe segmenty:
biznes (np. podatek, umowa, pit, dokument, zus, rynek...)
dom (np. dom, kuchnia, gaz, dach, schody, architektura...)
edukacja (np. matematyka, nauczyciel, matura, profesor, sprawdzian, studia...)
agd (agd kuchenne, agd gos-podarcze)
26.04.2016
Cloud Technologies w liczbach
43 pracowników
500K+ witryn internetowych
100M+ plików cookie
322M+ PLNaktualna kapitalizacja
33,5M PLN przychodów ‘15
15M PLNzysku netto ‘15