15
RDF БАЗИ ОТ ДАННИ Доц. д-р Цветанка Георгиева-Трифонова

RDF бази от данни

Embed Size (px)

Citation preview

RDF БАЗИ ОТ ДАННИ

Доц. д-р Цветанка Георгиева-Трифонова

RDF БАЗИ ОТ ДАННИ – СЪДЪРЖАНИЕ

Характеристики на RDF (Resource Description

Framework) базите от данни

Предимства на RDF бази от данни

Сравняване на RDF с XML и релационни бази от

данни

2 2 Цветанка Георгиева Моделиране на информационни системи

ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ

RDF системите за бази от данни

са стандартизирани NoSQL решения, които се основават

на:

прост, единен модел на данни;

мощен, декларативен език за заявки.

предлагат преносимост на данните и съвместимост между

конкурентни приложения.

3 3 Цветанка Георгиева Моделиране на информационни системи

ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ

RDF системите за бази от данни формират подмножество на

графовите бази от данни – една от категориите NoSQL бази

от данни.

Примери за RDF бази от данни са:

AllegroGraph, Virtuoso, Stardog, др.;

както и такива с отворен код: ARC, 4store, др.

RDF данните могат да бъдат разглеждани като насочен граф,

където дъгите:

започват с URI на субектите;

имат етикети с URI на предикатите;

завършват, като сочат URI на обектите или скаларни

стойности.

4 4 Цветанка Георгиева Моделиране на информационни системи

ХАРАКТЕРИСТИКИ НА RDF БАЗИТЕ ОТ ДАННИ

Пример

5 5 Цветанка Георгиева Моделиране на информационни системи

ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ

Прост и единен стандартен модел на данните

NoSQL базите от данни имат специфични модели на

данните и възможности, предназначени специално за

всяка реализация;

Като правило, тези модели на данните не са нито

съвместими, нито стандартизирани и обикновено са

описани в документацията на съответната версия на

конкретния програмен продукт;

В сравнение с тях системите за RDF бази от данни

използват един добре дефиниран и W3C-стандартизиран

модел на данните.

6 6 Цветанка Георгиева Моделиране на информационни системи

ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ

Стандартизирани формати за обмен на информация

Някои NoSQL бази от данни имат възможност за

импорт/експорт от/към структури, специфични за

реализацията, представени в XML или JSON формат.

От друга страна всички RDF бази от данни имат

възможност за импорт/експорт въз основа на добре

дефинирани, стандартизирани формати за сериализиране

като RDF/XML, N-Triples, N-Quads, др.

7 7 Цветанка Георгиева Моделиране на информационни системи

ОСНОВНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ ДАННИ

Мощен стандартен език за заявки

NoSQL базите от данни обикновено не предоставят

декларативен език за заявки от високо ниво, подобен на

SQL;

Изпълняването на заявки при тези бази от данни се

програмира според конкретния модел на данните, според

конкретния език и дори според конкретно приложение;

Ако е налице език за заявки, той е напълно специфичен

за реализацията (например SimpleDB или GQL);

SPARQL е голямо предимство за RDF базите от данни, тъй

като представлява стандартен език за заявки, който има

възможности, сравними с тези на SQL и е дефиниран при

запазване на голяма част от познатия синтаксис.

8 8 Цветанка Георгиева Моделиране на информационни системи

ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ

ДАННИ

Преносимост на данните

При използване на различни конкуриращи се системи за

бази от данни, за да се:

включат множество различни решения едновременно;

обменят данни с външни организации,

данните могат да бъдат предавани, без да се налага да се

пише и използва допълнителен потребителски код за

преобразуване на някои формати и структури от данни в

други несъвместими формати и структури от данни.

9 9 Цветанка Георгиева Моделиране на информационни системи

ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ

ДАННИ

Съвместимост (Toolchain interoperability)

Библиотеките и инструментите (toolchains) за RDF

обикновено не са или са слабо свързани с конкретната

реализация на СУБД;

По принцип не е от значение с коя специално RDF-

базирана система се осъществява връзката, ако

например се използва и програмира с Jena или Sesame

за Java и Scala, RDFLib за Python, ARC за PHP или RDF.rb

за Ruby;

Подобно на релационните бази от данни, RDF-базираният

код не трябва да се променя, само защото е нужно да се

направи еквивалент на преминаване от MySQL към

PostgreSQL.

10 10 Цветанка Георгиева Моделиране на информационни системи

ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ

ДАННИ

Липсва зависимост от доставчика (No vendor lock-in)

Ако дадено приложение използва RDF базата от данни X,

но по някаква причина възникнат проблеми, то може да

се извърши преминаване към RDF база от данни Y или Z

или някоя друга от наличните съвместими решения;

Тази задача не толкова тежка, в сравнение с

превключване между две не-RDF решения.

11 11 Цветанка Георгиева Моделиране на информационни системи

ДОПЪЛНИТЕЛНИ ПРЕДИМСТВА НА RDF БАЗИ ОТ

ДАННИ

Гарантирано бъдеще

RDF е дефиниран стандарт за публикуване на свързани

данни (linked data) в интернет и е изцяло построен въз

основа на утвърдени стандарти като URI адреси;

Напълно основателно може да се предположи, че RDF

данните ще бъдат използваеми в бъдеще;

Не може да се твърди същото за някои от другите NoSQL

решения, много от които неизбежно ще се окажат по-

скоро краткотрайни.

12 12 Цветанка Георгиева Моделиране на информационни системи

СРАВНЯВАНЕ НА RDF С XML

XML се използва за представяне на модел на

полуструктурираните данни

Йерархична структура с вложени елементи, която е дърво,

но в общия случай може да представлява граф;

Служи за представяне на структурата и семантиката на

данните.

Моделите на XML данните и RDF данните са различни

Моделът на RDF данните:

е граф (съвкупност от субект/предикат/обект изрази);

служи за представяне на семантиката на данните;

е абстрактен модел с няколко формати за

сериализиране, един от които е RDF/XML.

13 13 Цветанка Георгиева Моделиране на информационни системи

СРАВНЯВАНЕ НА RDF С РЕЛАЦИОННИ БАЗИ ОТ

ДАННИ

RDF данните могат да бъдат представени с помощта на

релационния модел.

Отделните твърдения в RDF се изразяват като триплети от

субект, предикат, обект.

Множества от триплети с общ предикат могат да бъдат

съпоставени с бинарните връзки в релационния модел чрез

таблица от две колони.

14 14 Цветанка Георгиева Моделиране на информационни системи

СРАВНЯВАНЕ НА RDF С РЕЛАЦИОННИ БАЗИ ОТ

ДАННИ

В релационния модел, даден ред в таблица всъщност

представлява твърдението, че релацията е валидна за

стойностите в реда.

Една SELECT заявка избира твърдения, които са верни за

дадените условия.

Релационната СУБД поддържа логически съгласуваността

между всички данни, които съдържа.

По този начин релационната база от данни може да се

разглежда като машина за разсъждения (reasoning engine).

15 15 Цветанка Георгиева Моделиране на информационни системи