83
1 XML: eXtensible Markup Language Tema 3 (no entra ni Schemas XML Path)

XML: eXtensible Markup Language

  • Upload
    callia

  • View
    44

  • Download
    0

Embed Size (px)

DESCRIPTION

XML: eXtensible Markup Language. Tema 3 (no entra ni Schemas XML Path). Introducción Histórica (I). XML se constituyó como estándar de la W3C en el año 1998. En 2000 se aprueba su versión 1.0 Se trata de un lenguaje de marcas , igual que HTML o su precursor SGML - PowerPoint PPT Presentation

Citation preview

Page 1: XML: eXtensible Markup Language

1

XML eXtensible Markup Language

Tema 3

(no entra ni Schemas XML Path)

2

Introduccioacuten Histoacuterica (I)

XML se constituyoacute como estaacutendar de la W3C en el antildeo 1998 En 2000 se aprueba su versioacuten 10

Se trata de un lenguaje de marcas igual que HTML o su precursor SGML

Se diferencia de SGML por su sencillez Se diferencia de HTML por su flexibilidad el

nuacutemero de etiquetas que puede incluir un documento XML es ilimitado

Al igual que HTML es portable a cualquier plataforma

3

Introduccioacuten Histoacuterica (II)

4

Introduccioacuten Histoacuterica (III)

Objetivos principalesndash Directamente utilizable en Internetndash Soporte para una amplia variedad de aplicaciones

para transferencia de datosndash Compatible con SGMLndash Posibilidad de crear sencillos procesadores de XMLndash Documentos XML legibles y medianamente claros

(depende de la definicioacuten)ndash Disentildeo raacutepido del lenguajendash Simple pero perfectamente formalizadondash Documentos XML faacuteciles de crear

5

XML vs HTML

HTML carece de un chequeo sintaacutectico Paacuteginas con errores son mostradas en los navegadores

HTML carece de estructura HTML no es orientado a objeto HTML mezcla contenido y representacioacuten Por todo esto

ndash HTML no puede ser faacutecilmente leiacutedo por una maacutequinandash HTML nunca seraacute un estaacutendar de intercambio de datos

XML cubre todo esto con un lenguaje de sencillez extrema

6

Caracteriacutesticas de XML (I)

Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma

estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento

Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva

La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)

A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica

7

Documento HTML (I)

8

Documento HTML (II)

En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt

ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra

ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor

1048698 XML erradica todos estos problemas

9

Documento XML

10

Reglas Generales de XML

Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de

apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre

comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 2: XML: eXtensible Markup Language

2

Introduccioacuten Histoacuterica (I)

XML se constituyoacute como estaacutendar de la W3C en el antildeo 1998 En 2000 se aprueba su versioacuten 10

Se trata de un lenguaje de marcas igual que HTML o su precursor SGML

Se diferencia de SGML por su sencillez Se diferencia de HTML por su flexibilidad el

nuacutemero de etiquetas que puede incluir un documento XML es ilimitado

Al igual que HTML es portable a cualquier plataforma

3

Introduccioacuten Histoacuterica (II)

4

Introduccioacuten Histoacuterica (III)

Objetivos principalesndash Directamente utilizable en Internetndash Soporte para una amplia variedad de aplicaciones

para transferencia de datosndash Compatible con SGMLndash Posibilidad de crear sencillos procesadores de XMLndash Documentos XML legibles y medianamente claros

(depende de la definicioacuten)ndash Disentildeo raacutepido del lenguajendash Simple pero perfectamente formalizadondash Documentos XML faacuteciles de crear

5

XML vs HTML

HTML carece de un chequeo sintaacutectico Paacuteginas con errores son mostradas en los navegadores

HTML carece de estructura HTML no es orientado a objeto HTML mezcla contenido y representacioacuten Por todo esto

ndash HTML no puede ser faacutecilmente leiacutedo por una maacutequinandash HTML nunca seraacute un estaacutendar de intercambio de datos

XML cubre todo esto con un lenguaje de sencillez extrema

6

Caracteriacutesticas de XML (I)

Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma

estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento

Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva

La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)

A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica

7

Documento HTML (I)

8

Documento HTML (II)

En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt

ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra

ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor

1048698 XML erradica todos estos problemas

9

Documento XML

10

Reglas Generales de XML

Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de

apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre

comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 3: XML: eXtensible Markup Language

3

Introduccioacuten Histoacuterica (II)

4

Introduccioacuten Histoacuterica (III)

Objetivos principalesndash Directamente utilizable en Internetndash Soporte para una amplia variedad de aplicaciones

para transferencia de datosndash Compatible con SGMLndash Posibilidad de crear sencillos procesadores de XMLndash Documentos XML legibles y medianamente claros

(depende de la definicioacuten)ndash Disentildeo raacutepido del lenguajendash Simple pero perfectamente formalizadondash Documentos XML faacuteciles de crear

5

XML vs HTML

HTML carece de un chequeo sintaacutectico Paacuteginas con errores son mostradas en los navegadores

HTML carece de estructura HTML no es orientado a objeto HTML mezcla contenido y representacioacuten Por todo esto

ndash HTML no puede ser faacutecilmente leiacutedo por una maacutequinandash HTML nunca seraacute un estaacutendar de intercambio de datos

XML cubre todo esto con un lenguaje de sencillez extrema

6

Caracteriacutesticas de XML (I)

Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma

estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento

Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva

La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)

A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica

7

Documento HTML (I)

8

Documento HTML (II)

En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt

ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra

ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor

1048698 XML erradica todos estos problemas

9

Documento XML

10

Reglas Generales de XML

Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de

apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre

comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 4: XML: eXtensible Markup Language

4

Introduccioacuten Histoacuterica (III)

Objetivos principalesndash Directamente utilizable en Internetndash Soporte para una amplia variedad de aplicaciones

para transferencia de datosndash Compatible con SGMLndash Posibilidad de crear sencillos procesadores de XMLndash Documentos XML legibles y medianamente claros

(depende de la definicioacuten)ndash Disentildeo raacutepido del lenguajendash Simple pero perfectamente formalizadondash Documentos XML faacuteciles de crear

5

XML vs HTML

HTML carece de un chequeo sintaacutectico Paacuteginas con errores son mostradas en los navegadores

HTML carece de estructura HTML no es orientado a objeto HTML mezcla contenido y representacioacuten Por todo esto

ndash HTML no puede ser faacutecilmente leiacutedo por una maacutequinandash HTML nunca seraacute un estaacutendar de intercambio de datos

XML cubre todo esto con un lenguaje de sencillez extrema

6

Caracteriacutesticas de XML (I)

Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma

estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento

Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva

La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)

A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica

7

Documento HTML (I)

8

Documento HTML (II)

En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt

ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra

ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor

1048698 XML erradica todos estos problemas

9

Documento XML

10

Reglas Generales de XML

Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de

apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre

comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 5: XML: eXtensible Markup Language

5

XML vs HTML

HTML carece de un chequeo sintaacutectico Paacuteginas con errores son mostradas en los navegadores

HTML carece de estructura HTML no es orientado a objeto HTML mezcla contenido y representacioacuten Por todo esto

ndash HTML no puede ser faacutecilmente leiacutedo por una maacutequinandash HTML nunca seraacute un estaacutendar de intercambio de datos

XML cubre todo esto con un lenguaje de sencillez extrema

6

Caracteriacutesticas de XML (I)

Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma

estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento

Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva

La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)

A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica

7

Documento HTML (I)

8

Documento HTML (II)

En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt

ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra

ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor

1048698 XML erradica todos estos problemas

9

Documento XML

10

Reglas Generales de XML

Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de

apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre

comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 6: XML: eXtensible Markup Language

6

Caracteriacutesticas de XML (I)

Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma

estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento

Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva

La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)

A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica

7

Documento HTML (I)

8

Documento HTML (II)

En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt

ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra

ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor

1048698 XML erradica todos estos problemas

9

Documento XML

10

Reglas Generales de XML

Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de

apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre

comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 7: XML: eXtensible Markup Language

7

Documento HTML (I)

8

Documento HTML (II)

En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt

ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra

ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor

1048698 XML erradica todos estos problemas

9

Documento XML

10

Reglas Generales de XML

Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de

apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre

comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 8: XML: eXtensible Markup Language

8

Documento HTML (II)

En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt

ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra

ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor

1048698 XML erradica todos estos problemas

9

Documento XML

10

Reglas Generales de XML

Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de

apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre

comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 9: XML: eXtensible Markup Language

9

Documento XML

10

Reglas Generales de XML

Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de

apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre

comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 10: XML: eXtensible Markup Language

10

Reglas Generales de XML

Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de

apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre

comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 11: XML: eXtensible Markup Language

11

Documentos Bien Formados y Vaacutelidos

Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas

estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto

Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 12: XML: eXtensible Markup Language

12

Elementos (I) Comentarios

ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt

Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt

Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 13: XML: eXtensible Markup Language

13

Elementos (II)

Proacutelogo ltxml version=10 encoding=utf-8

standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute

utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no

es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres

ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 14: XML: eXtensible Markup Language

14

Elementos (III)

DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el

nombre (MiDTD) del elemento raiacutez de la misma

ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte

ndash El documento XML deberaacute cumplir con el contenido del DTD

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 15: XML: eXtensible Markup Language

15

Elementos (IV)

Etiquetasndash Deben ir correctamente anidadas apertura y cierre

ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt

ndash Etiqueta de cierre ltLibrogt

ndash Etiqueta vaciacutea ltLibro gt

ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros

ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo

ndash El nombre debe comenzar por una letra o un ldquo_rdquo

ndash No puede comenzar por ldquoxmlrdquo

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 16: XML: eXtensible Markup Language

16

Elementos (V)

Elementondash Es el conjunto de la etiqueta (marcador) de apertura su

contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por

entidades o se incluyen en secciones CDATA

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 17: XML: eXtensible Markup Language

17

Elementos (VI) Atributos

ndash Cada elemento puede contener 0 oacute maacutes atributos

ndash Su valor debe ir siempre entrecomillado

ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas

ndash El mismo atributo no puede aparecer repetido en la misma etiqueta

ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento

ndash No puede contener ninguna referencia a entidad externa

ndash Son siempre tratados como cadenas de texto

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 18: XML: eXtensible Markup Language

18

Elementos (VII)

ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt

ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son

atributos)

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 19: XML: eXtensible Markup Language

19

DTDs (I) (Declaracioacuten de tipos)

ltDOCTYPE Libros SYSTEM Libros1dtdgt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la

ManchaltTitulogtltAutorgtMiguel de

CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es

suentildeoltTitulogtltAutorgtCalderon de la

BarcaltAutorgtltLibrogtltLibrosgt

ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt

ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 20: XML: eXtensible Markup Language

20

DTDs (II)

Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)

Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE

Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 21: XML: eXtensible Markup Language

21

DTDs (III) (Elemento Raiacutez)

A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt

ltELEMENT Libro (Titulo Autor)gt

ltELEMENT Titulo (PCDATA)gt

ltELEMENT Autor (PCDATA)gt

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 22: XML: eXtensible Markup Language

22

DTDs (IV) (Contenido de los Elementos)

Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)

ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento

o incluso contenido textualltELEMENT IMAGEN ANYgt

ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)

ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt

ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos

ltELEMENT LIBRO (PCDATA | AUTOR)gt

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 23: XML: eXtensible Markup Language

23

DTDs (V)

Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre

pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 24: XML: eXtensible Markup Language

24

DTDs (VI)

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 25: XML: eXtensible Markup Language

25

DTDs (VII) (Ejemplo)

ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director

Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |

Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 26: XML: eXtensible Markup Language

26

DTDs (VIII)

Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt

ltPersonagtltAgendagt

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 27: XML: eXtensible Markup Language

27

DTDs (IX) (Atributos)

Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo

Modificadorgt Los atributos de un elemento pueden

incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 28: XML: eXtensible Markup Language

28

DTDs (X) (Tipos de Atributos) Tipo de un atributo

ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico

bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento

bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo

bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas

bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 29: XML: eXtensible Markup Language

29

DTDs (XI) (Modificadores de Atributos)

Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido

ltATTLIST Pelicula Titulo CDATA REQUIREDgt

ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto

ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt

ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt

ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor

ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 30: XML: eXtensible Markup Language

30

DTDs (XII) (Recomendaciones para modelado de Atributos)

Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar

Atributosbull Normalmente se trata de objetos cuya existencia no tiene

sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma

bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo

Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)

bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 31: XML: eXtensible Markup Language

31

DTDs (XIII) (Recomendaciones para modelado de Atributos)

Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes

del elemento principal o sus especiacuteficos)

bull Permiten crear viacutenculos

bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)

bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten

bull Tienen entidad propia independientemente del resto de elementos

Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 32: XML: eXtensible Markup Language

32

DTDs (XIV) (Problemas)

Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers

No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)

No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100

(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas

(Esquemas)

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 33: XML: eXtensible Markup Language

33

Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento

XML Basado en el conjunto de caracteres ISOIEC 10646

(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal

ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 34: XML: eXtensible Markup Language

34

Entidades (I) Las entidades permiten

ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)

ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo

ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como

por ejemplo ampamp

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 35: XML: eXtensible Markup Language

35

Entidades (II)

Entidades predefinidasndash Signo menor lt lt amplt

ndash Signo mayor gt gt ampgt

ndash Ampersand amp amp ampamp

ndash Apoacutestrofe apos lsquo ampapos

ndash Comilla doble quot ldquo ampquot

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 36: XML: eXtensible Markup Language

36

Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse

dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena

entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de

insercioacuten1048698 No Analizada no seraacute parseada

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 37: XML: eXtensible Markup Language

37

Ejercicio de Atributos Hacer una DTD utilizando atributos

ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt

ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt

ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt

ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt

ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt

ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 38: XML: eXtensible Markup Language

38

XML Schemas (I)

Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML

XML Schemas

Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe

una gran cantidad de documentos definidos con DTDs

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 39: XML: eXtensible Markup Language

39

XML Schemas (II) (Ejemplo)

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 40: XML: eXtensible Markup Language

40

XML Schemas vs DTDs (I)

Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden

definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante

entities () estaacuten poco desarrolladasVentajas de las DTDs

bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados

en ellasbull Faacutecil de aprender

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 41: XML: eXtensible Markup Language

41

XML Schemas vs DTDs (II)

Ventajasbull Permite multitud de tipos de datos (pe

xsdate xsint xslanguage )

bull Amplio uso de los namespaces

bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 42: XML: eXtensible Markup Language

42

La Familia XML (I)

XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML

XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer

elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de

Informacioacuten XSLT Lenguaje para transformacioacuten de documentos

XML XSL-FO Expresa semaacutentica de formateado de

documentos provee los medios para producir impresiones de alta calidad

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 43: XML: eXtensible Markup Language

43

XPath (II) (Ejemplo)ltcatalogogt

ltlibrogtlttitulogtProfessional

XMLlttitulogtltautorgtDidier Martin et

alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt

ltlibrogtltlibrogt

lttitulogtXML Developerrsquos Guidelttitulogt

ltautorgtFabio Arciniegasltautorgt

lteditorialgtMcGraw-Hilllteditorialgt

ltanyogt2001ltanyogtltlibrogt

ltcatalogogt

bull Todos los autores

catalogolibroautor

catalogoautor

autor

bull Todos los autores con condicioacuten

catalogolibro[anyogt2001]autor

bull El texto de los elementos autor

catalogolibroautortext()

bull El primer libro

catalogolibro[0]

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 44: XML: eXtensible Markup Language

44

XPath (III)

Expresiones numeacutericas

+ - div mod Expresiones booleanas

and or Expresiones de comparacioacuten

= = lt lt= gt gt=

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 45: XML: eXtensible Markup Language

45

XPath (IV)

Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 46: XML: eXtensible Markup Language

46

XPath (V) (Unioacuten)

ldquo|rdquo sirve para calcular la unioacuten de

conjunto de nodos especificados por

medio de location paths Ejemplos

libro[anyo=2000]|libro[anyo=2001]

libro[anyo=2000 or anyo=2001]

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 47: XML: eXtensible Markup Language

47

Presentacioacuten en XML

La presentacioacuten en HTML esta baacutesicamente en los navegadores

Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)

Surgen las hojas de estilo

ndash CSS Cascading Style Sheets (HTML)

ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 48: XML: eXtensible Markup Language

48

XSL

Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css

Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl

href=ldquonombreficheroxsl gt

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 49: XML: eXtensible Markup Language

49

METADATOS Y XML

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 50: XML: eXtensible Markup Language

50

Namespaces (I)

XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres

Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas

Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones

Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 51: XML: eXtensible Markup Language

51

Namespaces (II) (Definicioacuten)

Un namespace se identifica por su prefijoPor ejemploltxslstylesheet

xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes

informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 52: XML: eXtensible Markup Language

52

Namespaces y qualified names (Qnames)

Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 53: XML: eXtensible Markup Language

53

Ejemplo NameSpace ltxml version=10gt

lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 54: XML: eXtensible Markup Language

54

Metadatos Registros repositorios para gestionar recuperar

referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados

con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que

recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)

Perfiles de Aplicacioacuten

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 55: XML: eXtensible Markup Language

55

Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y

relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs

RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages

Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y

colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de

metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 56: XML: eXtensible Markup Language

56

Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento

HEAD de una paacutegina HTML para identificar indizar y catalogar documentos

Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)

ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 57: XML: eXtensible Markup Language

57

Editores metadatos

httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met

ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools

adv_metatag_generatorhtml

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 58: XML: eXtensible Markup Language

58

Dublin Core elementos (1)

Subject Title Author Publisher OtherAgent DateType

ObjectType Form Identifier Relation Source Language CoverageScheme

Los 15 elementos

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 59: XML: eXtensible Markup Language

59

ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt

Ejemplo de un documento DC HTML

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 60: XML: eXtensible Markup Language

60

Calificadores DC (1)

Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-

elemento = ldquovalorrdquo

bullDCCreatorpersonalName =rdquoScott Adamsrdquo

Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de

utilizacioacuten

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 61: XML: eXtensible Markup Language

61

Elemento DCMES

Elemento refinado

Sistema de codificacioacuten

Title Alternative

Creator

Subject

LCSH MeSH DDC LCC UDC

Description Table Of Contents Abstract

Publisher

Contributor

Date

Created Valid Available Issued Modified

DCMI Period W3C-DTF

Type DCMI Type Vocabulary

Extent Format

Medium IMT

Identifier URI

Cualificadores DC

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 62: XML: eXtensible Markup Language

62

Source URI

Language I SO 639-2 RFC 1766

Relation

I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format

URI

Spatial

DCMI Point ISO 3166 DCMI Box TGN Coverage

Temporal DCMI Period W3C-DTF

Rights

Cualificadores DC

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 63: XML: eXtensible Markup Language

63

Interoperatibilidad

El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente

La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML

La alineacioacuten puede ser estructural o linguumliacutestica

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 64: XML: eXtensible Markup Language

64

RDF (Resource Description Framework)

Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones

de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos

bull Coleccioacuten de propiedades=RDF

bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 65: XML: eXtensible Markup Language

65

El modelo RDF

Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen

como ldquodescripcionesrdquo

RecursoTipoPropiedad

Valor

Propiedad

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 66: XML: eXtensible Markup Language

66

RDF ndash ejemplo baacutesico

ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo

SujetoResource la URI VerboPropiedad autor

PredicadoValues Pepe Peacuterez

ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt

httpwwwuc3mes~pepeAutor

Pepe Peacuterez

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 67: XML: eXtensible Markup Language

67

Ejemplo de RDFltxml version=10 gt

ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt

ltDescription about = httpwwwamazoncom gt

ltDCTitlegt Ontologia ltDCTitlegt

ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt

ltDCDategt 1999-12-31 ltDCDategt

ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt

ltDescriptiongt

ltRDFgt

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 68: XML: eXtensible Markup Language

68

RDF - estructuracioacuten

Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades

httpwwwuc3mes~soniaAutor

Sonia Saacutenchez soniauc3mes

Nombre Email

ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 69: XML: eXtensible Markup Language

69

RDF - reification

Posibilidad de introducir diferentes capas de propiedades dentro de un recurso

httpwwwamazoncomCost

pound005

1999-12-31

ValidUntil

ltDescription about = httpwwwamazoncom

bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt

ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 70: XML: eXtensible Markup Language

70

RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip

ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt

ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 71: XML: eXtensible Markup Language

71

RDF - namespaces

Utilizados en XML para representar atributos

Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos

bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt

Tienen asociados un URI

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 72: XML: eXtensible Markup Language

72

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogt

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt

ltDescriptiongtltRDFgt

Ejemplo RDF

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 73: XML: eXtensible Markup Language

73

ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo

xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo

ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica

ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet

ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt

RDF con varios vocabularios de metadatos

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 74: XML: eXtensible Markup Language

74

iquestQueacute es RSS

RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo

Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 75: XML: eXtensible Markup Language

75

Posibilidades

Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip

La principal ventaja La fuente informa cuando se producen cambios

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 76: XML: eXtensible Markup Language

76

Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen

metadatos sobre una fuente de noticias determinada y su contenido

Consta fundamentalmente de

bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal

Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 77: XML: eXtensible Markup Language

77

Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt

ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt

ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt

ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 78: XML: eXtensible Markup Language

78

iquestCoacutemo funciona RSS

El autor crea un fichero RSS Los usuarios se suscriben al fichero a

traveacutes de un lector de noticias o agregador

Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 79: XML: eXtensible Markup Language

79

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 80: XML: eXtensible Markup Language

80

iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de

weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS

Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales

Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 81: XML: eXtensible Markup Language

81

iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que

periodicamente lee un conjunto de fuentes o canales en formato XML

Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno

La aplicacioacuten necesaria para leer ficheros RSS

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 82: XML: eXtensible Markup Language

82

Tipos de agregadores Clientesagentes independientes

bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)

bull Pluck NewsGator intraVnews Complementos de Navegador

bull Firefox 10 Sage Sitios Web

bull Bloglines NewsIsFree

Listado de agregadoreshttpwwwlightscomweblogsrsshtml

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo

Page 83: XML: eXtensible Markup Language

83

Mas informacioacuten Introduccioacuten a RSS

httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec

cANALES

Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo