View
239
Download
0
Category
Tags:
Preview:
Citation preview
1
XML eXtensible Markup Language
Tema 3
(no entra ni Schemas XML Path)
2
Introduccioacuten Histoacuterica (I)
XML se constituyoacute como estaacutendar de la W3C en el antildeo 1998 En 2000 se aprueba su versioacuten 10
Se trata de un lenguaje de marcas igual que HTML o su precursor SGML
Se diferencia de SGML por su sencillez Se diferencia de HTML por su flexibilidad el
nuacutemero de etiquetas que puede incluir un documento XML es ilimitado
Al igual que HTML es portable a cualquier plataforma
3
Introduccioacuten Histoacuterica (II)
4
Introduccioacuten Histoacuterica (III)
Objetivos principalesndash Directamente utilizable en Internetndash Soporte para una amplia variedad de aplicaciones
para transferencia de datosndash Compatible con SGMLndash Posibilidad de crear sencillos procesadores de XMLndash Documentos XML legibles y medianamente claros
(depende de la definicioacuten)ndash Disentildeo raacutepido del lenguajendash Simple pero perfectamente formalizadondash Documentos XML faacuteciles de crear
5
XML vs HTML
HTML carece de un chequeo sintaacutectico Paacuteginas con errores son mostradas en los navegadores
HTML carece de estructura HTML no es orientado a objeto HTML mezcla contenido y representacioacuten Por todo esto
ndash HTML no puede ser faacutecilmente leiacutedo por una maacutequinandash HTML nunca seraacute un estaacutendar de intercambio de datos
XML cubre todo esto con un lenguaje de sencillez extrema
6
Caracteriacutesticas de XML (I)
Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma
estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento
Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva
La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)
A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica
7
Documento HTML (I)
8
Documento HTML (II)
En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt
ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra
ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor
1048698 XML erradica todos estos problemas
9
Documento XML
10
Reglas Generales de XML
Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de
apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre
comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
2
Introduccioacuten Histoacuterica (I)
XML se constituyoacute como estaacutendar de la W3C en el antildeo 1998 En 2000 se aprueba su versioacuten 10
Se trata de un lenguaje de marcas igual que HTML o su precursor SGML
Se diferencia de SGML por su sencillez Se diferencia de HTML por su flexibilidad el
nuacutemero de etiquetas que puede incluir un documento XML es ilimitado
Al igual que HTML es portable a cualquier plataforma
3
Introduccioacuten Histoacuterica (II)
4
Introduccioacuten Histoacuterica (III)
Objetivos principalesndash Directamente utilizable en Internetndash Soporte para una amplia variedad de aplicaciones
para transferencia de datosndash Compatible con SGMLndash Posibilidad de crear sencillos procesadores de XMLndash Documentos XML legibles y medianamente claros
(depende de la definicioacuten)ndash Disentildeo raacutepido del lenguajendash Simple pero perfectamente formalizadondash Documentos XML faacuteciles de crear
5
XML vs HTML
HTML carece de un chequeo sintaacutectico Paacuteginas con errores son mostradas en los navegadores
HTML carece de estructura HTML no es orientado a objeto HTML mezcla contenido y representacioacuten Por todo esto
ndash HTML no puede ser faacutecilmente leiacutedo por una maacutequinandash HTML nunca seraacute un estaacutendar de intercambio de datos
XML cubre todo esto con un lenguaje de sencillez extrema
6
Caracteriacutesticas de XML (I)
Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma
estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento
Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva
La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)
A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica
7
Documento HTML (I)
8
Documento HTML (II)
En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt
ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra
ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor
1048698 XML erradica todos estos problemas
9
Documento XML
10
Reglas Generales de XML
Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de
apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre
comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
3
Introduccioacuten Histoacuterica (II)
4
Introduccioacuten Histoacuterica (III)
Objetivos principalesndash Directamente utilizable en Internetndash Soporte para una amplia variedad de aplicaciones
para transferencia de datosndash Compatible con SGMLndash Posibilidad de crear sencillos procesadores de XMLndash Documentos XML legibles y medianamente claros
(depende de la definicioacuten)ndash Disentildeo raacutepido del lenguajendash Simple pero perfectamente formalizadondash Documentos XML faacuteciles de crear
5
XML vs HTML
HTML carece de un chequeo sintaacutectico Paacuteginas con errores son mostradas en los navegadores
HTML carece de estructura HTML no es orientado a objeto HTML mezcla contenido y representacioacuten Por todo esto
ndash HTML no puede ser faacutecilmente leiacutedo por una maacutequinandash HTML nunca seraacute un estaacutendar de intercambio de datos
XML cubre todo esto con un lenguaje de sencillez extrema
6
Caracteriacutesticas de XML (I)
Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma
estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento
Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva
La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)
A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica
7
Documento HTML (I)
8
Documento HTML (II)
En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt
ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra
ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor
1048698 XML erradica todos estos problemas
9
Documento XML
10
Reglas Generales de XML
Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de
apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre
comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
4
Introduccioacuten Histoacuterica (III)
Objetivos principalesndash Directamente utilizable en Internetndash Soporte para una amplia variedad de aplicaciones
para transferencia de datosndash Compatible con SGMLndash Posibilidad de crear sencillos procesadores de XMLndash Documentos XML legibles y medianamente claros
(depende de la definicioacuten)ndash Disentildeo raacutepido del lenguajendash Simple pero perfectamente formalizadondash Documentos XML faacuteciles de crear
5
XML vs HTML
HTML carece de un chequeo sintaacutectico Paacuteginas con errores son mostradas en los navegadores
HTML carece de estructura HTML no es orientado a objeto HTML mezcla contenido y representacioacuten Por todo esto
ndash HTML no puede ser faacutecilmente leiacutedo por una maacutequinandash HTML nunca seraacute un estaacutendar de intercambio de datos
XML cubre todo esto con un lenguaje de sencillez extrema
6
Caracteriacutesticas de XML (I)
Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma
estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento
Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva
La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)
A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica
7
Documento HTML (I)
8
Documento HTML (II)
En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt
ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra
ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor
1048698 XML erradica todos estos problemas
9
Documento XML
10
Reglas Generales de XML
Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de
apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre
comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
5
XML vs HTML
HTML carece de un chequeo sintaacutectico Paacuteginas con errores son mostradas en los navegadores
HTML carece de estructura HTML no es orientado a objeto HTML mezcla contenido y representacioacuten Por todo esto
ndash HTML no puede ser faacutecilmente leiacutedo por una maacutequinandash HTML nunca seraacute un estaacutendar de intercambio de datos
XML cubre todo esto con un lenguaje de sencillez extrema
6
Caracteriacutesticas de XML (I)
Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma
estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento
Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva
La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)
A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica
7
Documento HTML (I)
8
Documento HTML (II)
En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt
ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra
ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor
1048698 XML erradica todos estos problemas
9
Documento XML
10
Reglas Generales de XML
Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de
apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre
comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
6
Caracteriacutesticas de XML (I)
Es un subconjunto del lenguaje SGML Al igual que eacutel se utiliza para representar datos de forma
estructurada (Jeraacuterquica) Se basa en una gramaacutetica de obligado cumplimiento
Esto facilita el desarrollo de parsers y por lo tanto su utilizacioacuten masiva
La estructura interna de un documento XML puede reflejarse en otro documento denominado DTD (Document Type Definition)
A diferencia de HTML separa radicalmente la semaacutentica del documento de su representacioacuten graacutefica
7
Documento HTML (I)
8
Documento HTML (II)
En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt
ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra
ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor
1048698 XML erradica todos estos problemas
9
Documento XML
10
Reglas Generales de XML
Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de
apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre
comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
7
Documento HTML (I)
8
Documento HTML (II)
En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt
ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra
ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor
1048698 XML erradica todos estos problemas
9
Documento XML
10
Reglas Generales de XML
Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de
apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre
comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
8
Documento HTML (II)
En apariencia el documento HTML anterior es correcto sin embargondash Existen etiquetas que nunca se cierran ltPgt
ndash Algunas etiquetas no estaacuten bien anidadas el primer ltIgt nunca se cierra
ndash Para un lector no humano no se sabe queacute es un libro y queacute es un autor
1048698 XML erradica todos estos problemas
9
Documento XML
10
Reglas Generales de XML
Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de
apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre
comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
9
Documento XML
10
Reglas Generales de XML
Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de
apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre
comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
10
Reglas Generales de XML
Un uacutenico elemento raiacutez Todo elemento debe tener etiquetas de
apertura y cierre Distincioacuten entre mayuacutesculasminuacutesculas Anidamiento perfecto entre elementos Los valores de atributos siempre van entre
comillas Los espacios en blanco se conservan Los caracteres CRLF se transforman en LF
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
11
Documentos Bien Formados y Vaacutelidos
Se dice que un documento es bien formado cuandondash Cumple con todas las reglas anteriormente expuestasndash Contiene uno o maacutes elementosndash Hay un uacutenico elemento raiacutez (elemento documento)ndash Si el documento consta de maacutes de una parte todas
estaacuten bien formadasndash No se encuentran caracteres prohibidos en el texto
Un documento es vaacutelido cuando ademaacutes de ser lsquobien formadorsquo cumple con las especificaciones semaacutenticas expuestas en su plantilla (DTD o XML Schema)
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
12
Elementos (I) Comentarios
ndash lt -- Esto es un comentario y no puedo incluir un dobleguioacuten--gt
Instrucciones de procesamientondash lt Instruccioacuten gtndash La instruccioacuten no puede incluir los caracteres gt
Secciones CDATAndash lt[CDATA[Este texto no seraacute tratado puede incluirldquocualquierrdquo ampcaraacutecter lt gt]]gtndash No son tratadas por el parserndash Pueden incluir cualquier caraacutecter prohibido (ldquo lsquo amp gt lt)ndash No puede incluir la cadena ]]gt
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
13
Elementos (II)
Proacutelogo ltxml version=10 encoding=utf-8
standalone=yes gtndash Es una instruccioacuten de procesamiento obligatoriandash Version indica la versioacuten de XML que se estaacute
utilizando (10 en la actualidad) Es obligatoriandash Encoding indica coacutemo se codificoacute el documento y no
es obligatoria (por defecto UTF-8) Vaacutelido para otros juegos de caracteres
ndash Standalone ldquoyesrdquo indica que el documento no va acompantildeado de DTDs externos ldquonordquo indica que posee DTD interno No es un atributo obligatorio
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
14
Elementos (III)
DOCTYPE ltDOCTYPE MiDTD SYSTEM ldquoCMiDTDdtdrdquogtndash Indica la referencia (URI) al DTD asiacute como el
nombre (MiDTD) del elemento raiacutez de la misma
ndash La DTD podriacutea ir incorporada en el propio documento XML sin requerir otro fichero aparte
ndash El documento XML deberaacute cumplir con el contenido del DTD
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
15
Elementos (IV)
Etiquetasndash Deben ir correctamente anidadas apertura y cierre
ndash Etiqueta de apertura comienza por lt maacutes el nombre de la etiqueta y terminan por gt Ejemplo ltLibrogt
ndash Etiqueta de cierre ltLibrogt
ndash Etiqueta vaciacutea ltLibro gt
ndash No puede iniciar el nombre con ldquordquo ldquordquo ldquo-rdquo nuacutemeros
ndash Luego de la primera letra pueden colocarse ldquordquo nuacutemeros ldquo-rdquo
ndash El nombre debe comenzar por una letra o un ldquo_rdquo
ndash No puede comenzar por ldquoxmlrdquo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
16
Elementos (V)
Elementondash Es el conjunto de la etiqueta (marcador) de apertura su
contenido y la de cierrendash Por ejemplo ltLibrogtDon Quijote de la ManchaltLibrogtndash Hay algunos caracteres reservados (prohibidos)1048698 Signo de mayor gt1048698 Signo de menor lt1048698 Ampersand amp1048698 Apoacutestrofe lsquo1048698 Comilla ldquondash Estos caracteres prohibidos se reemplazan por
entidades o se incluyen en secciones CDATA
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
17
Elementos (VI) Atributos
ndash Cada elemento puede contener 0 oacute maacutes atributos
ndash Su valor debe ir siempre entrecomillado
ndash Soacutelo pueden aparecer en etiquetas de apertura o vaciacuteas
ndash El mismo atributo no puede aparecer repetido en la misma etiqueta
ndash Si el documento incluye DTD cada atributo debe estar definido como atributo del presente elemento
ndash No puede contener ninguna referencia a entidad externa
ndash Son siempre tratados como cadenas de texto
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
18
Elementos (VII)
ltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgt (Sin atributos)ltPreciogt 1123 euros ltPreciogtltEditorialgt Santillana ltEditorialgtltLibrogt
ltLibro Precio = 1123 euros Editorial = SantillanagtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogt (Dos elementos son
atributos)
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
19
DTDs (I) (Declaracioacuten de tipos)
ltDOCTYPE Libros SYSTEM Libros1dtdgt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la
ManchaltTitulogtltAutorgtMiguel de
CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es
suentildeoltTitulogtltAutorgtCalderon de la
BarcaltAutorgtltLibrogtltLibrosgt
ltDOCTYPE Libros [ltELEMENT Libros (Libro)+gtltELEMENT Libro (Titulo Autor)gtltELEMENT Titulo (PCDATA)gtltELEMENT Autor (PCDATA)gt]gt
ltLibrosgtltLibrogtltTitulogtDon Quijote de la ManchaltTitulogtltAutorgtMiguel de CervantesltAutorgtltLibrogtltLibrogtltTitulogtLa vida es suennoltTitulogtltAutorgtCalderon de la BarcaltAutorgtltLibrogtltLibrosgt
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
20
DTDs (II)
Toda DTD debe tener uno y soacutelo un elemento raiacutez (tambieacuten conocido como elemento documento)
Este documento raiacutez debe coincidir con el nombre que aparece a continuacioacuten del DOCTYPE
Un documento DTD puede contenerndash Declaraciones de elementosndash Declaraciones de atributos para un elementondash Declaraciones de entidadesndash Declaraciones de notacionesndash Instrucciones de procesamientondash Comentariosndash Referencias a entidades de paraacutemetro
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
21
DTDs (III) (Elemento Raiacutez)
A partir del elemento raiacutez pueden opcionalmente colgar (de forma jeraacuterquica) otros elementosltELEMENT Libros (Libro)+gt
ltELEMENT Libro (Titulo Autor)gt
ltELEMENT Titulo (PCDATA)gt
ltELEMENT Autor (PCDATA)gt
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
22
DTDs (IV) (Contenido de los Elementos)
Contenido de un elementondash EMPTY el elemento estaacute vaciacuteo (puede contener atributos)
ltELEMENT IMAGEN EMPTYgtndash ANY el elemento puede contener a cualquier otro elemento
o incluso contenido textualltELEMENT IMAGEN ANYgt
ndash Otros elementos un elemento puede contener uno o maacutes elementos hijos en una cierta secuencia (Ej Libro)
ndash PCDATA texto parseado ltELEMENT LIBRO (PCDATA)gt
ndash Mixto el elemento puede incluir secuencias de caracteres opcionalmente mezcladas con elementos hijos
ltELEMENT LIBRO (PCDATA | AUTOR)gt
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
23
DTDs (V)
Secuencias de hijos de un elementondash Secuencia1048698 Secuencia en orden hijos separados por comas1048698 Opciones hijos separados por | (barra)1048698 Conjuntos de elementos pueden agruparse entre
pareacutentesisndash Cardinalidad un elemento o un conjunto de ellospuede repetirse 0 1 oacute maacutes veces1048698 elemento Elemento repetido 1 uacutenica vez1048698 Elemento repetido 0 oacute 1 vez1048698 Elemento repetido 0 oacute maacutes veces1048698 + Elemento repetido 1 oacute maacutes veces
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
24
DTDs (VI)
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
25
DTDs (VII) (Ejemplo)
ltELEMENT LIBRO (Autor Editorial)gtltELEMENT Autor (PCDATA)gtltELEMENT PELICULA (Actor|Actriz|Director)+gtltELEMENT PELICULA ((Actor | Actriz) Director
Maquillaje)gtltELEMENT PELICULA (PCDATA | Actor)gtltELEMENT PELICULA (Titulo Genero (Actor | Actriz |
Narrador))gtltELEMENT FICHA (Nombre+ Apellido+ Direccion fotoTelFijo|TelMovil)
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
26
DTDs (VIII)
Ejercicio Hacer una DTDltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltEmailgt afragaieinfuc3mes ltEmailgtltOficinagt 21 B18 ltOficinagtltTelefonogt 5555555 ltTelefonogtltMovilgt 5557777 ltMovilgt
ltPersonagtltAgendagt
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
27
DTDs (IX) (Atributos)
Un elemento puede opcionalmente declarar uno o maacutes atributosltATTLIST Elemento Atributo Tipo
Modificadorgt Los atributos de un elemento pueden
incluirse en una o maacutes declaraciones ltATTLIST gt Si se hace en la misma declaracioacuten basta con separar con un espacio (espacio tabulador retorno de carro)
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
28
DTDs (X) (Tipos de Atributos) Tipo de un atributo
ndash Tipo cadena CDATAltATTLIST Autor Nacionalidad CDATAgtndash Tipo enumeradoltATTLIST Pelicula Genero (Ficcion | Terror | Humor)gtndash Tipo simboacutelico
bull ID valdraacute como identificador en el resto del documento soacutelo un atributo ID por cada elemento
bull IDREF IDREFS su valor debe coincidir con alguacuten otro atributo de tipo ID en el resto del documento XML IDREFS separa las referencias por espacio ldquoID1 ID2 ID3rdquo
bull ENTITY ENTITIES su valor debe coincidir con una o maacutes entidades no analizadas
bull NMTOKEN NMTOKENS su valor ha de ser una cadena de tipo token
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
29
DTDs (XI) (Modificadores de Atributos)
Modificadoresndash REQUIRED este atributo debe ser obligatoriamenteintroducido
ltATTLIST Pelicula Titulo CDATA REQUIREDgt
ndash IMPLIED indica que el atributo es opcionalndash ValorPredeterminado si se omitiese el atributo losprocesadores recogeriacutean este valor por defecto
ltATTLIST Pelicula Genero (Ficcion | Terror | Humor) ldquoHumorrdquogt
ltATTLIST Autor Nacionalidad CDATA ldquoEspantildeolardquogt
ndash FIXED se incluya o no se incluya el atributo losprocesadores siempre obtendraacuten este mismo valor
ltATTLIST Autor Nacionalidad CDATA FIXED ldquoEspanolardquogt
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
30
DTDs (XII) (Recomendaciones para modelado de Atributos)
Frecuentemente un mismo objeto se puede disentildear como un atributo o un elemento sin peacuterdida de semaacutentica pero existen criterios para decantar
Atributosbull Normalmente se trata de objetos cuya existencia no tiene
sentido fuera del objeto al que describen (peadjetivos) metadatos identificadores uacutenicos el idioma
bull En general todo aquello por lo que existe mayor intereacutes en filtrarlo que en mostrarlo
Ventajasbull Maacutes faacutecil de procesar por el software (mayor eficiencia)
bull Maacutes legible los atributos estaacuten proacuteximos al elemento al que pertenecen
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
31
DTDs (XIII) (Recomendaciones para modelado de Atributos)
Elementos se deberiacutea optar por ellosbull Siempre que se quiera definir sub-elementos (ya sean partes
del elemento principal o sus especiacuteficos)
bull Permiten crear viacutenculos
bull Siempre que queramos repetir el mismo elemento con distinto valor (los atributos tienen un uacutenico valor como maacuteximo)
bull Siempre que el contenido sea mayor que una palabra (oraciones paacuterrafos ) y sobre todo si se quiere mostrar el texto en cuestioacuten
bull Tienen entidad propia independientemente del resto de elementos
Los documentos que priman a los atributos pueden ser maacutes breves al no tener una etiqueta propia que abrir y cerrar
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
32
DTDs (XIV) (Problemas)
Una DTD no sigue el formato de un documento XML estaacutendar Esto representa un problema para los parsers
No se soportan distintos tipos de datos al estilo de los lenguajes de programacioacuten (CDATA PCDATA)
No se pueden crear tipos de datos personalizados No se soportan los espacios de nombres (namespaces) El nuacutemero de ocurrencias no se puede controlar al 100
(Ej 2 ocurrencias) Por estas y otras razones surgen los XML Schemas
(Esquemas)
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
33
Referencias a Caracteres Permiten incluir cualquier caraacutecter dentro de un documento
XML Basado en el conjunto de caracteres ISOIEC 10646
(httpxmlcoverpagesorgxml-ISOentstxt) Dos formatosndash ampxvalor valor representado en decimalndash ampxvalor valor representado en hexadecimal
ltxml version=10 encoding=utf-8 standalone=yes gtltLibrosgtltLibro Precio = 658 euros Editorial = AnayagtltTitulogtLa vida es sueamp241oltTitulogt (DECIMAL)ltAutorgtCalderamp243n de la BarcaltAutorgt (DECIMAL)ltLibrogtltLibrosgt
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
34
Entidades (I) Las entidades permiten
ndash Dar modularidad al texto evitando tener que escribir algo de forma repetitiva (Re-uso)
ndash Incluir caracteres prohibidos amp gt lt ldquo lsquo
ndash Incluir caracteres de otros idiomas entildee Comienzan por amp y terminan en ldquordquo Como
por ejemplo ampamp
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
35
Entidades (II)
Entidades predefinidasndash Signo menor lt lt amplt
ndash Signo mayor gt gt ampgt
ndash Ampersand amp amp ampamp
ndash Apoacutestrofe apos lsquo ampapos
ndash Comilla doble quot ldquo ampquot
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
36
Entidades (III) Tipos de entidadesndash General y de Paraacutemetro1048698 General contiene texto XML u otros caracteres1048698 De Paraacutemetro contiene texto XML que puede insertarse
dentro de una DTDndash Interna y Externa1048698 Interna contiene el texto dentro de una cadena
entrecomillada1048698 Externa hace referencia a un archivo externondash Analizada y no Analizada1048698 Analizada texto XML que seraacute parseado en su punto de
insercioacuten1048698 No Analizada no seraacute parseada
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
37
Ejercicio de Atributos Hacer una DTD utilizando atributos
ltxml version=10 encoding=utf-8 gtltAgendagtltPersonagt
ltNombregt Anabel ltNombregtltApellidogt Fraga ltApellidogtltSexogt Femenino ltSexogtltDNIgt 44444444-O ltDNIgtltNacionalidadgt Espantildeola ltNacionalidadgtltEmailgt anabel_fragamydomaines ltEmailgt
ltEmailgt anabel_fragafragaes ltEmailgtltOficinagt
ltDireccion CP=rdquo28911rdquogt Av Universidad 30 ltDirecciongtltDespachogt 21 B18 ltDespachogtltEmailgt afragaieinfuc3mes ltEmailgtltTelefonogt 5555555 ltTelefonogtltTelefonogt 5555556 ltTelefonogt
ltOficinagt ltTelefonogt 5555558 ltTelefonogt ltTelefonogt 5555559 ltTelefonogt
ltMovilgt 5557777 ltMovilgtltPersonagtltAgendagt
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
38
XML Schemas (I)
Actualmente existe una nueva recomendacioacuten de W3C de Mayo 2001 para definiciones de XML
XML Schemas
Uso de notacioacuten XML para definiciones Limitacioacuten de uso Actualmente existe
una gran cantidad de documentos definidos con DTDs
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
39
XML Schemas (II) (Ejemplo)
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
40
XML Schemas vs DTDs (I)
Desventajas de las DTDsbull No escritas en sintaxis XMLbull Poco uso de namespacesbull Pocos tipos de datos (y lo que es peor no se pueden
definir nuevos tipos de datos)bull Aunque se puede agrupar elementos mediante
entities () estaacuten poco desarrolladasVentajas de las DTDs
bull Muchas herramientas que lo soportanbull Existen muchos documentos DTDs y XMLs basados
en ellasbull Faacutecil de aprender
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
41
XML Schemas vs DTDs (II)
Ventajasbull Permite multitud de tipos de datos (pe
xsdate xsint xslanguage )
bull Amplio uso de los namespaces
bull Permite agrupar elementos para su reutilizacioacuten permite herencia (Ejemplo Datos Personales en distintos Dominios de uso)
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
42
La Familia XML (I)
XPointerXLink permiten referenciar a diferentes recursos dentro o fuera del documento XML
XPath lenguaje de consulta para recorrer ficheros XML XQL (XML Query Language) uacutetil para localizar y extraer
elementos de un documento XML XIRQL Una extensioacuten de XQL para Recuperacioacuten de
Informacioacuten XSLT Lenguaje para transformacioacuten de documentos
XML XSL-FO Expresa semaacutentica de formateado de
documentos provee los medios para producir impresiones de alta calidad
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
43
XPath (II) (Ejemplo)ltcatalogogt
ltlibrogtlttitulogtProfessional
XMLlttitulogtltautorgtDidier Martin et
alltautorgtlteditorialgtWroxlteditorialgtltanyogt2000ltanyogt
ltlibrogtltlibrogt
lttitulogtXML Developerrsquos Guidelttitulogt
ltautorgtFabio Arciniegasltautorgt
lteditorialgtMcGraw-Hilllteditorialgt
ltanyogt2001ltanyogtltlibrogt
ltcatalogogt
bull Todos los autores
catalogolibroautor
catalogoautor
autor
bull Todos los autores con condicioacuten
catalogolibro[anyogt2001]autor
bull El texto de los elementos autor
catalogolibroautortext()
bull El primer libro
catalogolibro[0]
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
44
XPath (III)
Expresiones numeacutericas
+ - div mod Expresiones booleanas
and or Expresiones de comparacioacuten
= = lt lt= gt gt=
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
45
XPath (IV)
Funciones numeacutericasndash round ceiling floorndash count number sum Funciones booleanasndash boolean false true not Funciones de cadenas de caracteresndash string string-length substringndash substring-after substring-beforendash contains starts-with concatndash normalize translate
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
46
XPath (V) (Unioacuten)
ldquo|rdquo sirve para calcular la unioacuten de
conjunto de nodos especificados por
medio de location paths Ejemplos
libro[anyo=2000]|libro[anyo=2001]
libro[anyo=2000 or anyo=2001]
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
47
Presentacioacuten en XML
La presentacioacuten en HTML esta baacutesicamente en los navegadores
Seriacutea interesante programar la presentacioacuten (re-uso de coacutedigo)
Surgen las hojas de estilo
ndash CSS Cascading Style Sheets (HTML)
ndash XSL eXtensible Style Language (XML) (XML + DTD o XML Schema + Fichero de Estilo XSL)
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
48
XSL
Xsl es el lenguaje basado en xpath para poner hojas de estilos en xml es decir sustituye a las css
Para hacer referencia a un fichero xsl basta con escribir en el documento xml tras el proacutelogo la fraseltxml-stylesheet type=textxsl
href=ldquonombreficheroxsl gt
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
49
METADATOS Y XML
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
50
Namespaces (I)
XML permite crear etiquetas lsquocasirsquo sin ninguna limitacioacuten en sus nombres
Esto implica que mezclar dos documentos con diferentes etiquetas podriacutea resultar en una duplicidad de etiquetas
Mediante la definicioacuten de espacios de nombres se pueden evitar estas colisiones
Tecnologiacuteas como XSL y otras muchas hacen uso de Namespaces
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
51
Namespaces (II) (Definicioacuten)
Un namespace se identifica por su prefijoPor ejemploltxslstylesheet
xmlnsxsl=ldquohttpwwww3orgXSLTransform10rdquogtdondendash xsl es el prefijo del namespacendash Stylesheet es el nombre completo del namespacendash httpwww es la URI donde se puede encontrar maacutes
informacioacuten sobre el estaacutendarndash Puede incluir otros atributos como versionndash Como todo elemento XML ha de cerrarse ltxslstylesheetgt
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
52
Namespaces y qualified names (Qnames)
Para escribir en XML metadatos hay que definir previamente la ubicacioacuten del vocabulario de metadatos (Namespaces) y un prefijo para hacer referencia al vocabulario empleado (Qname)
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
53
Ejemplo NameSpace ltxml version=10gt
lt-- initially the default namespace is books --gtltbook xmlns=urnlocgovbookslsquo xmlnsdc=ldquohttppurlorgDCrdquo xmlnsisbn=urnISBN0-395-36341-6gt lttitlegtXML el futurolttitlegt ltdccreatorgtyo mismoltdccreatrogt ltisbnnumbergt1568491379ltisbnnumbergt ltnotesgt lt-- esto es un comentario en el ejemplo y html --gt ltpgtThis is a ltigtfunnyltigt book ltpgt ltnotesgtltbookgt
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
54
Metadatos Registros repositorios para gestionar recuperar
referenciar y reutilizar vocabularios de metadatos existentes Estos registros suelen facilitar informacioacuten sobre la definicioacuten origen y localizacioacuten del recurso Actualmente estaacutendar ISO 11179 bull Proyecto Schemas para RDF(S) y namespaces relacionados
con proyectos de la UE (httpwwwschemas-forumorg) bull Open Metadata Registry y ULIS son otros proyectos que
recopilan metadatos relacionados con la Dubliacuten Core Metadata Iniciative (httpdublincoreorgdcregistrynavigateServlet y httpavalonulisacjpregistry)
Perfiles de Aplicacioacuten
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
55
Metadatos famosos DC (Dubliacuten Core) para la descripcioacuten de documentos Con cualificadores FOAF (Friend of a Friend) vocabulario sobre informacioacuten personal y
relaciones interpersonales Sin vocabulario estable para realizar extensiones Es generado automaacuteticamente en websites que trabajan con blogs
RSS (RDF Site Summary una de las siglas hay pa gustos) tiene un conjunto de metadatos multipropoacutesito suele ser utilizado principalmente para describir sitios web Sindicate pages
Text Encoding Initiative (TEI) (httpwwwtei-corg) marcado de e-text Encoded Archival Description (EAD) para descripcioacuten de archivos y
colecciones especialesSeguacuten Swoogle en Junio de 2004 que los NS asociados a vocabularios de
metadatos maacutes utilizados eran FOAF (1126002 documentos) DC (1126002) MCVB (8838) RSS(7560 Junio 80000 septiembre de 2004) vCard (6229) y Bio (6183 )
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
56
Etiqueta META en HTMLLa etiqueta META se utiliza dentro del encabezamiento
HEAD de una paacutegina HTML para identificar indizar y catalogar documentos
Los atributos de esta etiqueta se encuentran indicados en el RFC 1866 bajo la siguiente DTD (Document Type Definition)
ltELEMENT METAgtltATTLIST META http-equiv NAME IMPLIED name NAME IMPLIED content CDATA REQUIRED gt
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
57
Editores metadatos
httpwwwukolnacukcgi-bindcdotpl httpvancouver-webpagescomMETAmk-met
ashtml httpwwwlublusecgi-binnmdcpl Reggie metadatanetdstc httpwwwukolnacukmetadatanew-dcdot httprainbowarchscriptmaniacomtools
adv_metatag_generatorhtml
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
58
Dublin Core elementos (1)
Subject Title Author Publisher OtherAgent DateType
ObjectType Form Identifier Relation Source Language CoverageScheme
Los 15 elementos
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
59
ltMETA NAME=Title CONTENT=FrontOffice selects Verity for Microsoft Exchange basad document management systemgtltMETA NAME=ldquoDCAuthor CONTENT=Padovani MargueritegtltMETA NAME=ldquoDCAuthor CONTENT=Siegel GailgtltMETA NAME= DCPublisher CONTENT=Verity IncgtltMETA NAME= DCDate CONTENT=1996gtltMETA NAME= DCObject CONTENT=Press ReleasegtltMETA NAME= DCForm CONTENT=1 ASCII filegtltMETA NAME= DCLanguage CONTENT=Englishgt
Ejemplo de un documento DC HTML
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
60
Calificadores DC (1)
Propuestos en DC4 como Canberra QualifiersbullEsquemanombre_de_elementonombre_de_sub-
elemento = ldquovalorrdquo
bullDCCreatorpersonalName =rdquoScott Adamsrdquo
Aprobacioacuten el 17-04-00 de Dublin Core Qualifiers (qDC)bullLista no cerrada que formaliza el meacutetodo de
utilizacioacuten
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
61
Elemento DCMES
Elemento refinado
Sistema de codificacioacuten
Title Alternative
Creator
Subject
LCSH MeSH DDC LCC UDC
Description Table Of Contents Abstract
Publisher
Contributor
Date
Created Valid Available Issued Modified
DCMI Period W3C-DTF
Type DCMI Type Vocabulary
Extent Format
Medium IMT
Identifier URI
Cualificadores DC
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
62
Source URI
Language I SO 639-2 RFC 1766
Relation
I s Version Of Has Version I s Replaced By Replaces I s Required By Requires I s Part Of Has Part I s Referenced By References I s Format Of Has Format
URI
Spatial
DCMI Point ISO 3166 DCMI Box TGN Coverage
Temporal DCMI Period W3C-DTF
Rights
Cualificadores DC
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
63
Interoperatibilidad
El teacutermino interoperabilidad ha sido definido (ALA 2000) como la capacidad que tienen algunos sistemas para intercambiar y utilizar informacioacuten procedente de otro sistema diferente
La forma maacutes usual de que exista es alineando vocabularios de metadatos y esquemas XML
La alineacioacuten puede ser estructural o linguumliacutestica
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
64
RDF (Resource Description Framework)
Validadores httpzoemathematikuni-osnabrueckdeRDFparserhtmlhttpwwww3orgRDFValidatorObjetivos de RDF interoperabilidad de metadatos a traveacutes de diferentes descripciones
de recursos Web e intercambio de Metadatos RDF trata de hacer compatibles diferentes estaacutendares Marco geneacuterico de descripcioacuten de recursos
bull Coleccioacuten de propiedades=RDF
bull Cada propiedad tiene un tipo de propiedad y un valor Formato de metadatos Interoperabilidad entre aplicaciones Intercambio de descripciones de recursos
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
65
El modelo RDF
Basado en un modelo matemaacutetico=triple Recursos Web representados por nodos URI Los conjuntos de propiedades se conocen
como ldquodescripcionesrdquo
RecursoTipoPropiedad
Valor
Propiedad
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
66
RDF ndash ejemplo baacutesico
ldquoPepe es el autor del recurso identificado por httpwwwuc3mes~peperdquo
SujetoResource la URI VerboPropiedad autor
PredicadoValues Pepe Peacuterez
ltrdfdescription rdfabout=ldquowwwuc3mesrdquo dccreator=ldquoPeperdquogt
httpwwwuc3mes~pepeAutor
Pepe Peacuterez
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
67
Ejemplo de RDFltxml version=10 gt
ltRDF xmlns = httpw3orgTR1999PR-rdf-syntax-19990105 xmlnsDC = httppurlorgDC gt
ltDescription about = httpwwwamazoncom gt
ltDCTitlegt Ontologia ltDCTitlegt
ltDCCreatorgt Ruben Prieto-Diaz ltDCCreatorgt
ltDCDategt 1999-12-31 ltDCDategt
ltDCSubjectgt Metadata RDF Dublin Core ltDCSubjectgt
ltDescriptiongt
ltRDFgt
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
68
RDF - estructuracioacuten
Reemplazar valores con un nodo (sin URI=anonymous) con dos tipos de propiedades
httpwwwuc3mes~soniaAutor
Sonia Saacutenchez soniauc3mes
Nombre Email
ltDCCreator parseType=Resourcegt ltvCardFNgt Pepe ltvCardFNgt ltvCardTITLEgt profe ltvCardTITLEgt ltvCardEMAILgt soniauc3mes ltvCardEMAILgtltDCCreatorgt
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
69
RDF - reification
Posibilidad de introducir diferentes capas de propiedades dentro de un recurso
httpwwwamazoncomCost
pound005
1999-12-31
ValidUntil
ltDescription about = httpwwwamazoncom
bagID = ID001 gt ltDCTitlegt Ontologias ltDCTitlegt ltDCCreatorgt Ruben PrietoltDCCreatorgt ltECOMMPricegtpound005ltECOMMPricegtltDescriptiongt
ltDescription aboutEach = ID001 gt ltADMINValidFromgt 1998-01-01 ltADMINValidFromgt ltADMINValidTogt 1999-12-31 ltADMINValidTogtltDescriptiongt
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
70
RDF ndash muacutetiples propiedadesltDCCreatorgt ltBaggt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltBaggtltDCCreatorgthellip
ltDCCreatorgt ltSeqgt ltligt Maddie Azzurii ltligt ltligt Corky Brown ltligt ltligt Jacky Crystal ltligt ltSeqgtltDCCreatorgt
ltSOFTLocationgt ltAltgt ltligt ftpsoft-salescomusabcexe ltligt ltligt ftpsoft-salescomauabcexe ltligt ltligt ftpsoft-salescomdeabcexe ltligt ltligt ftpsoft-salescomukabcexe ltligt ltAltgtltSOFTLocationgt
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
71
RDF - namespaces
Utilizados en XML para representar atributos
Identifican Tipos de PropiedadesDeben especificarse previamentePrecedidos de dos puntos
bull ltDCTitlegtTiacutetulo del recursoltDCTitlegt
Tienen asociados un URI
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
72
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogt
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltDCDescriptiongt Resumen del contenido delsitioltDCDescriptiongt
ltDescriptiongtltRDFgt
Ejemplo RDF
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
73
ltxml version=ldquo10rdquoltRDF xmlns=ldquohttpw3orgTR1999PR-rdf-syntax-19990222rdquo
xmlnsDC=ldquohttppurlorgDCrdquogtxmlnsAGLS=ldquohttpnagovauAGLSrdquo
ltDescription about=ldquohttpwwwugresrdquogtltDCTitlegt Web de la Universidad de GranadaltDCTitlegtltDCCreatorgtServicio de informaacutetica
ltDCCreatorgtltDCDategt 1998-02-08 ltDCDategtltAGLSFunctiongt Information managemen ndash Internet
ltAGLSFunctionDescriptiongt ltDescriptiongtltRDFgt
RDF con varios vocabularios de metadatos
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
74
iquestQueacute es RSS
RSS = ldquoReally Simple Syndicationrdquo RSS = ldquoRich Site Summaryrdquo RSS = ldquoRDF Site Summaryrdquo
Baacutesicamente RSS es un lenguaje XML para publicar simultaneamente (sindicate) noticias en Internet
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
75
Posibilidades
Noticias (prensa anuncios) Eventos Informacioacuten de proyectos Bibliografiacuteas Informacioacuten de contacto hellip
La principal ventaja La fuente informa cuando se producen cambios
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
76
Un poco maacutes teacutecnico Los archivos RSS se actualizan de forma regular y contienen
metadatos sobre una fuente de noticias determinada y su contenido
Consta fundamentalmente de
bull Channel que representa la fuente de las noticiasbull Title titulo del canalbull Link viacutenculo del canalbull Description descripcioacuten del canal
Ademaacutes consta de uno o varios elementos item que representan elementos de noticias individuales cada uno de los cuales debe disponer de un campo title link o description
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
77
Ejemploltxml version=10 encoding=UTF-8 gtltrss version=20gt ltchannelgt lttitlegt BCR The Third Indicatorlttitlegt ltlinkgthttpwwwbcrorgpublicationsthirdindltlinkgt ltdescriptiongtThe Third Indicator includedltdescriptiongt ltlastBuildDategtTue 21 Sep 2004 213739 GMTltlastBuildDategt ltgeneratorgtListGarden Program 101ltgeneratorgt ltdocsgthttpblogslawharvardedutechrssltdocsgt ltitemgt lttitlegtWorldCat Resource Sharing Traininglttitlegt
ltlinkgthttpwwwbcrorgpublicationsthirdind2004augustaugsharetrain04htmlltlinkgt
ltdescriptiongtIf youd like to see what WorldCat Resource Sharing hellip wwwoclcorgillmigration or view the WorldCat Resource Sharing tutorialltdescriptiongt
ltpubDategtTue 21 Sep 2004 192947 GMTltpubDategt ltguid isPermaLink=falsegtthirdind-2004-08-21-19-29-47ltguidgt ltitemgt ltchannelgtltrssgt
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
78
iquestCoacutemo funciona RSS
El autor crea un fichero RSS Los usuarios se suscriben al fichero a
traveacutes de un lector de noticias o agregador
Cuando el autor actualiza el fichero RSS los nuevos elementos se notifican automaacuteticamente a los usuarios quedando a su disposicioacuten para su lectura
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
79
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
80
iquestQueacute es un canal Un canal bitaacutecora o blog (abreviatura de
weblog pronunciado ldquowe blogrdquo) es un conjunto de noticias online representadas en orden cronoloacutegico inverso e incluidas en un fichero RSS
Tambieacuten se utiliza para denominar el sistema que aloja y sirve un conjunto de canales
Tiacutepicamente este tipo de sistemas incluyen enlaces entre ellos proporcionando informacioacuten adicional sobre los temas que incluyen
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
81
iquestQueacute es un agregador Una aplicacioacuten o un servicio remoto que
periodicamente lee un conjunto de fuentes o canales en formato XML
Cuando detecta nuevos elementos muestra un resumen de los mismos en un listado ordenado cronoloacutegicamente comenzando por el maacutes moderno
La aplicacioacuten necesaria para leer ficheros RSS
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
82
Tipos de agregadores Clientesagentes independientes
bull FeedReader Radio UserLand Complementos PIM (Personal Information Manager)
bull Pluck NewsGator intraVnews Complementos de Navegador
bull Firefox 10 Sage Sitios Web
bull Bloglines NewsIsFree
Listado de agregadoreshttpwwwlightscomweblogsrsshtml
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
83
Mas informacioacuten Introduccioacuten a RSS
httpwwwmaestrosdelwebcomeditorialsindicacion RSS esquema httpwwwclikearcomxsdrss2xsd RDF Site Summary httpwebresourceorgrss10spec
cANALES
Librariannet wwwlibrariannet Librarianrsquos Rant lblogjalcornnet LISNews wwwlisnewscom The Shifted Librarian wwwtheshiftedlibrariancom Travelinrsquo Librarian travelinlibrarianblogspotcom Unshelved wwwoverduemediacom Free Range Librarian freerangelibrariancom Crime in the Library crimeinthelibraryblogspotcom Tame the Web wwwtamethewebcomttwblog LibraryTechtonics wwwlibrarytechtonicsinfo
Recommended