Zoeken in collecties van Openbare Bibliotheken

Preview:

DESCRIPTION

 

Citation preview

zoeken in collecties van openbare bibliotheken

onder de loep

Rosemie Callewaert, Metadata Architectuur bij Bibnet

Bibliotheekschool Gent , 1 juni 2010Gastles

Metadata en indexeringImpliciete en expliciete metadataHerkomst metadata zoeken.bibliotheek.beDoel zoeken.bibliotheek.be

Manuele indexeringBibliografische recordsAuthority records

Machine indexeringRelevantie sorteringQuery expansionStemming en compoundFuzzy searchRecommendations

data metadata

over

object

datametadata

object

Data en metadata

objecten

Impliciet en expliciet

object

Doel van indexeringterugvindbaar maken

ordening

Doel van metadatadata terugvinden mogelijk maken

ordening mogelijk makeninformeren over data

etaleren van data

Herkomst metadata zoeken.bibliotheek.be

Open VlaccFysieke collectie 6 grote openbare bibliothekenMuziekcollectie Centrale Discotheek RotterdamSelectie van websites

VakorganisatiesBoekbesprekingen Leeswolf en LeeswelpCovers van Bowker en de Centrale Discotheek van Rotterdam (CDR)Meer Over Media van NBD/Biblion

UitgeversAankondigingen van uitgevers via BoekbankFlapteksten en coversMetadata bij krantenartikelen

InternetLeestips LibraryThingLuistertips Last.fm

PubliekTagsBesprekingenLijstjes

gecontroleerd

niet gecontroleerd

data en metadataimpliciet en expliciet

Doel zoeken.bibliotheek.be

Voorbeeld publiekscatalogus voor openbare bibliothekenModel zal uitgebreid worden naar de Provinciale en VGC Bibliotheeksystemen (PBS)Elke Openbare bibliotheek aangesloten op het PBS een publiekscatalogus geënt op zoeken.bibliotheek.be

Integratie fysieke en digitale bibliotheekcollectie

Verdeelplatform data en metadataPersmappen MediargusBoekbesprekingenDigileenDigitale Bibliotheek voor de Nederlandse Letteren (DBNL)…

Zoeken in collecties van verschillende bibliotheken

Metadata Open Vlacc

Titelbeschrijving, explicite metadata, manuele indexering

Beschrijving van formele en inhoudelijke kenmerken

Open Vlacc invoerregelgevingverschillende soorten en materialen

tekst, beeld, klank, boek, bladmuziek, cd, dvd, tijdchrift, artikel, …verschillende doelgroepen en inhoudelijke types

volwassenen, jeugd, fictie, non-fictieverschillende bibliografische types

monografie, onderdelen, meerdelig, serieel, koepel, deeluniforme ingangen

auteurs, titels, onderwerpeninhoudelijke ontsluiting

trefwoorden, thema’s, genresclassificaties

SISO, ZIZO, Vlaamse muziekclassificatie, NBLC

Bibliografisch record

Authority Record

• Gebruik van consequente terminologie bij het toevoegen van nieuwe gegevens• Mogelijkheid om items van dezelfde auteur, hetzelfde onderwerp, hetzelfde werk, …. te

groeperen

=databankrecord waarin een term vastgelegd wordt voor het uniek

benoemen van een concept, onderwerp, auteur, …

Waarom?

Hoe?• Zie verwijzingen (see references): een term die hetzelfde impliceert en verwijst naar de

vastgelegde term• Zie ook verwijzingen (see also references): een term die verwant is aan de vastgelegde

term en ook als term kan gebruikt worden in de databank

Voor catalogusbouw

Authority Bestanden

AuteursPersoonsnamenOrganisaties en instellingen (corportaties)

OnderwerpenTrefwoorden volwassenenTrefwoorden jeugdThema’s jeugdThema’s volwassenen

GenresMuziekVolwassenen (film, literatuur)Jeugd (film, muziek, literatuur)

Titels Uniforme titels en reekstitels

Verwijzing van Nicci French naar 2 andere namenVerwijzing van Nicci French naar 2 andere namen

jaargetijden = seizoenenzie ook verwijzingen naar afzonderlijke seizoenen

jaargetijden = seizoenenzie ook verwijzingen naar afzonderlijke seizoenen

Metadata van het publiek

Tags Bespreking

Waardering

bibliotheek

publiek

Andere organistaties

25.000 getagde titels2,5% van alle titels

1.500 besproken titels0,15% van alle titels

11.O00 titels met steraanduidingen1,1% van alle titels

Machine indexeringenRelevance rankingQuery expansion

Stemming en compoundFuzzy search

Recommendations

Relevantie sortering

Exacte match

Frequentie zoekwoord(en) in geïndexeerde gegevens van een publicatie *

Locatie van zoekwoord(en) in geïndexeerde gegevens van een publicatie *

Aantal edities van een publicatie/werk

Aantal bibliotheken met publicatie/werk in bezit

Materiaaltype

Niet exacte match

* gewicht per soort informatie: titel, auteur, onderwerp, fulltext, …

=relatie tussen zoekwoord(en) en

volgorde van titels in het zoekresultaat

RelevantiesorteringZichtbare invloed van aantal edities en bezit

RelevantiesorteringZichtbare invloed van aantal edities en bezit

RelevantiesorteringZichtbare invloed van aantal voorkomens van de zoekterm

RelevantiesorteringZichtbare invloed van aantal voorkomens van de zoekterm

Query expansion

=De zoekvraag (query) achter de schermen uitgebreiden

(expanding) met andere zoektermenhttp://en.wikipedia.org/wiki/Query_expansion

Op zoeken.bibliotheek.be- machine uitbreidingen- uitbreidingen op basis van Authority Records

Seizoenen = Seizoenen OR JaargetijdenZoekterm heeft meer gewicht in relevantiesortering

Seizoenen = Seizoenen OR JaargetijdenZoekterm heeft meer gewicht in relevantiesortering

Luc Zeebroek = Luc Zeebroek OR KamagurkaLuc Zeebroek komt niet voor

Luc Zeebroek = Luc Zeebroek OR KamagurkaLuc Zeebroek komt niet voor

Authority Records hebben ruimere werking dan enkel het zoeken in bibliografische records ondersteunen.

Ook relevant voor full text!

Authority Records hebben ruimere werking dan enkel het zoeken in bibliografische records ondersteunen.

Ook relevant voor full text!

Stemming

=Gebruik van computeralgoritmes die gebouwd zijn op de taalkundige morfologie die

bepaalt dat een werkwoord voor vervoeging herleid moet worden tot de stam.De computer zou hierdoor mits voldoende interpretatiemogelijkheden woorden kunnen

vervoegen.De algoritmes die dit doen worden “stemmers” genoemd.

Eerste stemmer °1970: Porter Stemmer

http://en.wikipedia.org/wiki/Stemming

Enkelvoud zoeken, meervoud vindenEnkelvoud zoeken, meervoud vinden

Compound

=Compound is een samengesteld begrip waarvan de stam een onderdeel is.

De samenstelling wordt gebouwd door het gebruik van bestaande woorden.

Door het hersamenstellen van woorden kan een begrip een afgeleide betekenis of een bijna niet meer verwante betekenis hebben.

http://en.wikipedia.org/wiki/Compound_%28linguistics%29

“Fietsen” wordt herleid tot “fiets” (stemming)“Techniek” wordt gecombineerd met “fiets” (compound)

“Fietsen” wordt herleid tot “fiets” (stemming)“Techniek” wordt gecombineerd met “fiets” (compound)

Fuzzy search

In de woordenwolk worden spellingsverianten getoondHet woord dat meest voorkomt wordt gesuggereerd

In de woordenwolk worden spellingsverianten getoondHet woord dat meest voorkomt wordt gesuggereerd

Zoek de “juiste” spellingsvariant.Waar zijn de thesaurustermen?

Zoek de “juiste” spellingsvariant.Waar zijn de thesaurustermen?

http://zoeken.bibliotheek.be/?q=dostoyevsky

Authority Bestanden van Nationale Bibliotheken Verzameld virtueel internationale Authority Records

Authority Bestanden van Nationale Bibliotheken Verzameld virtueel internationale Authority Records

Recommendations

Leestips

Luistertips

Recommended