Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
1
Ripa in XML:Ripa in XML: un software per la ricercaun software per la ricercatestualetestuale
http://dinamico2.unibg.it/ripa-iconologia/index.html2
http://dinamico2.unibg.it/cartari/
3
4
XML: eXtensible Markup Language
XML è un meta-linguaggio per definire la struttura di documenti e dati.
Un documento XML è un file di testo che contiene dati strutturati in tag.
I files XML devono essere:ben formati validi
5
DOCUMENTO XML<?xml version="1.0" encoding="ISO-8859-1"?><utenti>
<utente id=“001”> <nome>Sara</nome> <cognome>Del Giudice</cognome> <indirizzo>Latina</indirizzo>
</utente> <utente id=“002”>
<nome>Giulio</nome> <cognome>Paoli</cognome> <indirizzo>Pisa</indirizzo>
</utente></utenti>
TAG
ATTRIBUTO
TESTO
6
DTD: Document Type Definition
Un Dtd è un documento che definisce le regole a cui deve attenersi un documento XML per soddisfare il requisito della validità. Un Dtd descrive i tag ammissibili, le loro reciproche relazione e altre informazioni sugli attributi di ciascun tag.
7
TEI:Text Encoding and Interchange
È il Dtd su cui è stato strutturato il documento XML relativo al testo di Cesare Ripa.
Finalità del TEI:fornire un formato standard per l’interscambio di informazionifornire una guida per la codifica in questo formatosupportare la codifica di tutti i tipi di caratteristiche di ogni genere di testoessere indipendente dalle applicazioni
8
XSLT: eXtensible Stylesheet Language Transformations
È un linguaggio che consente di trasformare documenti XML in altri formati tra cui HTML
XML XSLT HTML
9
Parte del file XML del Ripa (1)
<pb n="019"/><lb n="1"/><figure entity="ripa1603\n\R19.gif" id="R19_fig" n="14"><head>Amor di virtù</head><interp value="illustr"/><figDesc><c type="capital">A</c>MOR DI VIRTÙ</figDesc></figure> riso, quanto infelice et ridicolosa fu da i poeti antichi finta la favola di<lb n="2"/><c type="capital">N</c>arciso, però disse l'<c type="capital">A</c>lciato:<lb n="3a"/>
10
Parte del file XML del Ripa (2)
<cit><bibl><author>Alciato, Andrea</author><title>Emblematum Liber</title><biblScope>LXIX, 1-8</biblScope></bibl><quote lang="vlg"> Sì come rimirando il bel <c type="capital">N</c>arciso<lb n="4a"/>nelle chiar'onde il vago suo sembiante<lb n="5a"/>Lodando hor i begli occhi, hora il bel viso,<lb n="6a"/>Fu di se stesso micidiale amante,<lb n="3b"/>Così sovente avvien che sia deriso<lb n="4b"/>L'huom che sprezzando altrui si ponga inante<lb n="5b"/>Con lodi amor soverchio di se stesso,<lb n="6b"/>E vanitade e danno e biasmo espresso</quote></cit>.
11
Esempio di XSL per le citazioni
<xsl:template match="cit"><xsl:attribute name="title"><xsl:if test="bibl/author!=''"><xsl:apply-templates select="bibl/author"/></xsl:if><xsl:if test="bibl/author!='' and bibl/title!=''"><xsl:text>, </xsl:text></xsl:if><xsl:if test="bibl/title!=''"><xsl:apply-templates select="bibl/title"/></xsl:if><xsl:if test="bibl/biblScope!=''"><xsl:text>, </xsl:text>
<xsl:apply-templates select="bibl/biblScope"/></xsl:if></xsl:attribute>
<xsl:element name="img"><xsl:attribute name="class">lente</xsl:attribute><xsl:attribute name="border">1</xsl:attribute><xsl:attribute name="src">lente_pic.gif</xsl:attribute></xsl:element><xsl:text> </xsl:text>
<xsl:element name="i"><xsl:apply-templates select="quote"/></xsl:element>…
12
13
Xft e Motori di Ricerca:Xft e Motori di Ricerca: due strumenti diversi due strumenti diversi con uno stesso obiettivocon uno stesso obiettivo
NOI
CERCHIAMO
XFT
TROVA
14
XFTXFT
Strumento software sviluppato in linguaggio C++, per la ricerca full text in documenti
XML
Libreria software: insieme di istruzioni
"Full text" significa che il software trova tutte le occorrenze (presenze) di una o più parole nell’intero documento
15
I soggetti di XFTI soggetti di XFT
XFT
Team di informatici
Amministratore dei documenti
Utenti finali
16
XFT:XFT: operazioni preliminarioperazioni preliminari
documento1.xmldocumento1.xmldocumento2.xmldocumento2.xmldocumento3.xmldocumento3.xmlCollezioneCollezione
12
IndicizzazioneIndicizzazione3
17
IndicizzazioneIndicizzazione
Analisi, strutturazione e memorizzazione di tutte le informazioni che dovranno essere utilizzate nella
fase di ricerca.Tutte queste informazioni sono raccolte in database di
supporto.Il documento viene diviso in frammenti (capitoli,
pagine) e ognuna di queste frazioni viene indicizzata separatamente.
18
IndicizzazioneIndicizzazione
“Il color giallo del vestimento si pone per similitudine del color delle biade …”
(Cesare Ripa, 1603, Iconologia, pag. 10)
il color giallo del vestimento si pone per similitudine delle biade
Pos 1
Pos 2 Pos 3 Pos 4 Pos 5 Pos 6
Pos 7 Pos 8
Pos 9 Pos 12 Pos 13
Pos 11 Pos 10
2 occorrenze 1 occorrenza
19
XFT: creazione tabelle3capitoloidTavoladellefigureXII1RtavfigRtavfig_figRtavfigfig5outlinetavolafigureillustr
001 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/@n001 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/@type001 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/head[1]/@type001 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/head[1]002 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/head[1]003 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/head[1]004 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/pb[1]/@n004 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/lb[1]/@n004 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/figure[1]/@entity004 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/figure[1]/@id004 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/figure[1]/@id004 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/figure[1]/@id004 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/figure[1]/@n004 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/figure[1]/@rend004 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/figure[1]005 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/figure[1]006 /TEI.2[1]/text[1]/body[1]/div0[1]/div1[1]/p[1]/figure[1]/interp[1]/@value
20
La query è un’interrogazione su una collezione che restituisce all’utente le
parti del documento xml che soddisfano la richiesta
Query Query
21
XFT: tipi di queryXFT: tipi di query
query AND
query NEAR
query OR
query EXACT Ricerca frase esatta
Ricerca tutte le parole
Ricerca almeno una parola
Ricerca parole vicine