A Wolfram Alpha tudásgép
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 0.
https://www.wolframalpha.com/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 1.
Témakörök
Bevezetés
Történeti háttér – az idevezető út
Technológia – a négy komponens
Technológia – Érdekes tények
Konklúzió
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 2.
Bevezetés
Nem egy – alapvetően szintaktikai - keresőprogram, mint pl. a Google, vagy a Bing
Nem olyan statikus ismerethalmaz, mint a Wikipédia, vagy az Encyclopédia
Valós idejű számítási válaszadó rendszer
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 3.
Bevezetés
Cél: „A Wolfram Alpha hosszútávú célja minden rendszerezett tudás azonnali számíthatóságának és elérhetőségének biztosítása mindenki számára.”
Rendszerezett tudás: - Tárgyszerű adatok - Modellek - Módszerek - Algoritmusok - Képletek
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 4.
Bevezetés
Már kidolgozott területek: - Matematika - Statisztika és adatelemzés - Fizika - Kémia - Anyagok - Műszaki tudományok - Csillagászat - Földtudományok - Élettudományok - Számítástudomány - Egységek és mértékek - Dátumok és időpontok - Időjárás - Helyszínek és geográfia - Emberek és történelem - Kultúra és média - Zene
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
- Szavak és nyelvészet - Sport és játékok - Színek - Pénz és üzlet - Szocio-ökonómiai adatok - Egészség és gyógyászat - Étel és táplálkozás - Oktatás - Szervezetek - Szállítás - Technológiák - Web- és komputerrendszerek
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 5.
Történeti háttér – az idevezető út
A névadó és projektvezető: Stephen Wolfram
Öt éves munka betetőződése és 25 éves megelőző fejlesztésé
Stephen a Wolfram Research céget 1987-ben indította, elsősorban a Mathematica szoftverre összpontosítva
A szoftver a Mathematicán alapul és 2009-ben 7 millió programsorból állt.
CPU-k ezrein fut 4 helyszínre szétosztva (2009).
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 6.
Történeti háttér – az idevezető út
2002-ben Stephen publikálta az „A New Kind of Science” c. könyvét Ingyenes elérés a weben!
A könyvben lefektetett elveken alapuló terméket 2004-ben kezdték fejleszteni Wolfram Alpha néven
A Wolfram Alpha hivatalosan 2009-ben jelent meg a közönség számára.
https://www.wolframscience.com/nksonline/toc.html
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 7.
Történeti háttér – számítható tudás
A Rendszerezett Adatok és a Kiszámítható Tudás története Krisztus előtt 20 000-re nyúlik vissza az aritmetika feltalálásával. Lásd: http://www.wolframdatasummit.org/2010/timeline.html
Tudományos könyvek, enciklopédiák, népszámlálások, térképek már az Ősi Mezopotámia óta gyűjtik az adatokat.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 8.
Technológia – a négy komponens
Hogyan épül fel és működik a Wolfram Alpha?
A felépítés négy modulon alapszik
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 9.
1. modul - Adatgyűjtés
Területek szakértői segítik a teamet a legjobb adatok megtalálásában és ellenőrzésében.
Külső, szervezeten kívülről jövő adatfelajlánlás szintén lehetséges, de az összes ilyen adatot szigorúan ellenőrzik.
Az adatok gyakorlatilag 100%-a nem az Internetről származik.
Az adatgyűjtés és ellenőrzés a munka kb. 5%-a.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 10.
1. modul - Adatgyűjtés
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 11.
2. modul – Formalizálás
A gyűjtött adatok szervezése, hogy feldolgozhatóvá váljon.
Az adat jelöléseinek, egységeinek, és a többi adathoz való kapcsolődásának meghatározása
Az adatok algoritmikus kódolása, hogy amikor szükség van rájuk, rendelkezésre álljanak – kiszámítható adatok.
Az algoritmusok, modellek és egyenletek kódolása a Mathematica program nyelvén, mely egyben a Wolfram Alpha programozási nyelve is.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 12.
2. modul – Formalizálás..
A Mathematica nyelvén tetszőleges strukturált kifejezések reprezentálhatók.
Eredményként a kód tömörebb, mint pl. a Java, vagy Python nyelveknél.
A Mathematica hatalmas függvény- és algoritmuskészlettel bír, melyen új, akár összetettebb algoritmusok is implementálhatók.
Az új függvényekkel még könnyebb az új algoritmusok implementálása.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 13.
2. modul – Formalizálás..
Példa egy formalizálásra
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 14.
2. modul – Formalizálás..
Példa egy másik formalizálásra
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 15.
3. modul – Természetes nyelv feldolgozás (NLP)
A rendszer és a felhasználók közti interakció legkényelmesebb eszköze a természetes emberi nyelv.
A probléma abban van, hogy a rendszer csak kis szövegrészletekkel találkozik az input során, és ezeknek kell egyértelmű jelentést tulajdonítania. Nagyobb szövegmennyiséggel éppen könnyebb lenne a feladat.
Az implementált megoldások általában jó eredménnyel működnek.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 16.
3. modul – Természetes nyelv feldolgozás (NLP)
Példa: szöveges kérdés
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 17.
3. modul – Természetes nyelv feldolgozás (NLP)
2. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 18.
3. modul – Természetes nyelv feldolgozás (NLP)
3. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 19.
3. modul – Természetes nyelv feldolgozás (NLP)
4. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 20.
4. modul – Vizualizálás
A Wolfram Alfa egyik vonzó tulajdonsága az eredmények vizuális megjelenítése.
A Mathematicának több eszköze is van erre a kihívásra, hogy az igényes „számítási esztétikának” megfeleljen.
Egy adott specifikus szimbolikus reprezentálás esetére ez automatizálja, mi és hogyan legyen prezentálva.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 21.
4. modul – Vizualizálás
1. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 22.
4. modul – Vizualizálás
2. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 23.
4. modul – Vizualizálás
3. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 23.
4. modul – Vizualizálás
3. Példa (ellenőrizve)
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 24.
4. modul – Vizualizálás
4. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 25.
4. modul – Vizualizálás
5. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 26.
4. modul – Vizualizálás
6. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 27.
4. modul – Vizualizálás
7. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 28.
4. modul – Vizualizálás
8. Példa
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 29.
Technológia – Érdekes tények
Több mint 10 trillió adat.
Több mint 50 000 algoritmus és modellfajta.
Több mint 1 000 felhasználói nyelv.
Több mint 8 millió sornyi szimbolikus Mathematica kód.
Szuperszámítógépek clusterein fut, beleértve a világ 44. legnagyobb gépét, az R Smarr-t is.
Sok száz terabájtnyi tároló.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 30.
Amikor nem tud valamit
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 31.
Konklúzió
Az adatreprezentálás és a dolgok halmazára vonatkozó lekérdezések leképezésének lényege hogy ezek számításra is képesek.
A lekérdezéseknél a válasz megadásához egy belső, előre strukturált adatbázist alkalmaz.
A számítás, feldolgozás egy halom adatot hoz fel a Google keresőgépeihez viszonyítva.
Kevés, vagy semmi információ nincs arról, hogyan dolgozik a rendszer belül.
Forrás: Pedro Gaspar: SIGC 2010/2011 Wolfram Alpha . An introduction to the underlying technology
http://www.strath.ac.uk/research/subjects/speechlanguagetherapy/
Alkalmazott Informatikai Intézeti Tanszék MŰSZAKI INFORMATIKA Dr.Dudás László 31.
Források, hivatkozások
Wolfram Alpha weboldal: http://www.wolframalpha.com/
Wolfram Alpha blog: http://blog.wolframalpha.com/
A Wolfram Alpha készítésének története: http://www.stephenwolfram.com/publications/making-wolfram-alpha/
Vélemények: Wolfram alpha: hogy működik? http://www.computerweekly.com/opinion/Opinion-Wolfram-Alpha-How-does-it-work; http://www.techradar.com/news/internet/how-the-hell-does-wolfram-alpha-work--599561
A Wolfram Alpha architektúrája: http://highscalability.com/wolfram-alpha-architecture
Wolfram Data Summit konferencia: http://www.wolframdatasummit.org/2010/
Wolfram Alpha a youtubon: https://www.youtube.com/user/WolframAlpha