9
Otto Oberhauser Universititsbibliothek der TU Wien Klassifikation in On I i ne- I nfo rmatio nssystemen (Classification in Online lnformation Systems) Oberhauser, O.: ClesificrtiDn in online infomrtion systems. (Klassifikation in Online-Informationssystemen) (Orig. de) Int. Classif. 13 (1986) No. 2, p. 79-87, 13 refs. Subject-oriented bibliographic online searching relies in most ca- ses on the results of verbal subject analysis (descriptors, subject headings, keywords, text of abstract). However, many biblio- graphic databases are also searchable by classification codes. This paper deals with the latter form of subject access, mainly pointing out the role of classification codes (class codes) as a useful enrich- ment to verbal online searching. Part ope discusses the following questions: To what extent are classification schemes as a means of subject access to be found in bibliographic databases? What is the nature ofthese systems and their notation? Part two shows several advantageous applications of using classification codes in biblio- graphic online searching. Part three deals with modifications and changes of classification systems, which constitute the main pro- blem when using them in online searching. Thus, the searcher not only has to be informed how to apply classification for improving search strategies, but also how to ovetcome such difficulties. (Author) 0. Einleitung Klassifikationssysteme - also mehr oder weniger kom- plexe Systeme von Themenklassen - dienen im Biblio- theks-, Informations- und Dokumentationswesen hautpsächlich dem Ordnen von Dokumenten bzw. deren Inhalten. Denkt man als Bibliothekar an den praktischen Einsatz von Klassifikationssystemen, so assoziiert man wohl primär Anwendungsbereiche wie die sachliche Erschließung von Buchbeständen im syste- matischen Katalog bzw. die physische Anordnung von Sammlungen in Form der systematischen Freihandauf- stellung. Daß Klassifikationen auch beim Online Infor- mation Retrieval - also einer ursprünglich dokumenta- rischen Anwendung, die in den letzten Jahren in die meisten wissenschaftlichen (und neuerdings auch in einige öffentliche (1)) Bibliotheken eingezogen ist - eine Rolle spielen können, ist hingegen weit weniger be- kannt (2). Was die Mittel der sachlich orientierten Recherche in bibliographischen Datenbanken betrifft, so ist in erster Linie die sogenannte Volltextsuche an nennen. Bei vielen Retrievalsystemen (2.B. DIALOG, SDC, STN, etc.) bedeutet dies, daß jene Datenfelder, die verbale Sachin- formation tragen, simultan und unabhängig von der ur- sprünglichen Wortposition recherchiert werden können. Bei vielen Datenbasen handelt es sich dabei um die Wörter aus dem Titel und dem Abstract der Dokumen- tationseinheiten, sowie Deskriptorenlkontrollierte Schlagwörter unüoder freie Indexierungsbegriffe. Be- sonders vorteilhaft ist dabei, daß genormtes Vokabular und ,,Freitext" gemeinsam recherchiert werden können, da sie bei den genannten Systemen in einem Basic Index (Hauptregister) zusammengefaßt sind, in welchem die Suche standardmäßig - d.h. sofern keine andere An- weisung erfolgt - abläuft. Die Online-Sachrecherche basiert also vornehmlich auf den Resultaten der verbalen Sacherschließung. Da- neben verfügen zahlreiche Literaturdatenbanken aber auch über eine klassifikatorische Erschließung ihrer Do- kumentationseinheiten. Deren Elemente sind einerseits die Notation (meist ,,Classification Code" oder ,,Class Code" genannt), andererseits manchmal zusätzlich auch die Verbalbezeichnung der Klassen (,,Classification Text"). Das letztere Element stellt im übrigen, sofern es vom System als Teil des Basic Index dargeboten wird und damit automatisch auch bei der Volltextrecherche ,,mitspielt", einen interessanten Querbezug zwischen verbaler und klassifikatorischer Inhaltserschließung dar. Online-Rechercheure, auch solche mit beträchtlicher Retrievalpraxis, sehen oft gerne über die Präsenz einer klassifikatorischen Erschließung in Literaturdatenban- ken hinweg, insbesondere dann, wenn sie Anhänger der reinen ,,Freitextrecherche" sind. Nun soll auch im vor- liegenden Beitrag die Online-Recherche mit Classifica- tion Codes durchaus nicht als grundlegende Alternative zur Textrecherche propagiert werden. Die hier vertrete- ne These lautet vielmehr: Eine Literaturdatenbank ist beim gegenwärtigen Stand der Retrievaltechnik qualita- tiv umso wertvoller, je mehr sachliche Zugriffsmöglich- keiten sie bietet. Eine Recherche wird somit potentiell umso bessere Ergebnisse liefern, je besser man alle vor- handenen Elemente der Inhaltserschließung zu nutzen versteht. 1. Klassifikatorische Erschließung von Literaturdatenbanken 1 . 1 Erscheinungsbild der D o kumentations einheit Fig. 1 zeigt ein Beispiel ftir eine typische Dokumenta- tionseinheit aus einer gut erschlossenen Literaturdaten- bank. Es handelt sich - hier im Ausgabeformat des r502t74 C85038055 dBAsE rr in liblaries cadikian, R. state Univ, col.l., Buffalo, NY, UsA Libr. Software Rev. (USA) vo1.3, no.4 52L-6 Dec, 1984 CODEN: LSREEA ISSN: 0742-5759 TTeatnent: BTBIIOGRAPI{Y' PRACTTCAL; PRODUC? REVIEW Docunent Type: JOIIRNAI, PAPER languages: ENGLISH (5 Refs) The dBAsE II database nanagenent systern is used at But]er Library to solve DP problens. The author discusses its day-to-day use, docunentation, nain features and linitations. A bibliography of dBAsE II naterials is included. Descriptors: library automationi relational databases Identifiers: l-ibrary autonationi dBASE IIt database managenent systent Butler Libraryt DP problensi docunentationt nain featuresi bibliography; dBASE II naterials Class Codes: CSl5ODt C7210 Fig. 1: Dokumentationseinheit aus der Datenbank IN- SPEC im Ausgabeformat des Hostsystems DIALOG Int. Classif. 13 (1986) No. 2 Oberhauser - Classification in Online Systems 79

Klassifikation nfo nssystemen - Welcome to E-LIS ...eprints.rclis.org/18412/1/ic_13_2.pdf · blem when using them in online searching. Thus, ... Wörter aus dem Titel und dem Abstract

  • Upload
    vukhanh

  • View
    218

  • Download
    0

Embed Size (px)

Citation preview

Otto OberhauserUniversititsbibliothek der TU Wien

Klassifikation inOn I i ne- I nfo rmatio nssystemen(Classification in Online lnformation Systems)

Oberhauser, O.: ClesificrtiDn in online infomrtion systems.(Klassifikation in Online-Informationssystemen) (Orig. de)Int. Classif. 13 (1986) No. 2, p. 79-87, 13 refs.

Subject-oriented bibliographic online searching relies in most ca-ses on the results of verbal subject analysis (descriptors, subjectheadings, keywords, text of abstract). However, many biblio-graphic databases are also searchable by classification codes. Thispaper deals with the latter form of subject access, mainly pointingout the role of classification codes (class codes) as a useful enrich-ment to verbal online searching. Part ope discusses the followingquestions: To what extent are classification schemes as a means ofsubject access to be found in bibliographic databases? What is thenature ofthese systems and their notation? Part two shows severaladvantageous applications of using classification codes in biblio-graphic online searching. Part three deals with modifications andchanges of classification systems, which constitute the main pro-blem when using them in online searching. Thus, the searcher notonly has to be informed how to apply classification for improvingsearch strategies, but also how to ovetcome such difficulties.

(Author)

0. Einleitung

Klassifikationssysteme - also mehr oder weniger kom-plexe Systeme von Themenklassen - dienen im Biblio-theks-, Informations- und Dokumentationswesenhautpsächlich dem Ordnen von Dokumenten bzw.deren Inhalten. Denkt man als Bibliothekar an denpraktischen Einsatz von Klassifikationssystemen, so

assoziiert man wohl primär Anwendungsbereiche wiedie sachliche Erschließung von Buchbeständen im syste-matischen Katalog bzw. die physische Anordnung vonSammlungen in Form der systematischen Freihandauf-stellung. Daß Klassifikationen auch beim Online Infor-mation Retrieval - also einer ursprünglich dokumenta-rischen Anwendung, die in den letzten Jahren in diemeisten wissenschaftlichen (und neuerdings auch ineinige öffentliche (1)) Bibliotheken eingezogen ist -eine Rolle spielen können, ist hingegen weit weniger be-kannt (2).

Was die Mittel der sachlich orientierten Recherche inbibliographischen Datenbanken betrifft, so ist in ersterLinie die sogenannte Volltextsuche an nennen. Bei vielenRetrievalsystemen (2.B. DIALOG, SDC, STN, etc.)bedeutet dies, daß jene Datenfelder, die verbale Sachin-formation tragen, simultan und unabhängig von der ur-sprünglichen Wortposition recherchiert werden können.Bei vielen Datenbasen handelt es sich dabei um dieWörter aus dem Titel und dem Abstract der Dokumen-tationseinheiten, sowie DeskriptorenlkontrollierteSchlagwörter unüoder freie Indexierungsbegriffe. Be-

sonders vorteilhaft ist dabei, daß genormtes Vokabularund ,,Freitext" gemeinsam recherchiert werden können,da sie bei den genannten Systemen in einem Basic Index(Hauptregister) zusammengefaßt sind, in welchem dieSuche standardmäßig - d.h. sofern keine andere An-weisung erfolgt - abläuft.

Die Online-Sachrecherche basiert also vornehmlichauf den Resultaten der verbalen Sacherschließung. Da-neben verfügen zahlreiche Literaturdatenbanken aberauch über eine klassifikatorische Erschließung ihrer Do-kumentationseinheiten. Deren Elemente sind einerseitsdie Notation (meist ,,Classification Code" oder ,,ClassCode" genannt), andererseits manchmal zusätzlich auchdie Verbalbezeichnung der Klassen (,,ClassificationText"). Das letztere Element stellt im übrigen, sofern es

vom System als Teil des Basic Index dargeboten wirdund damit automatisch auch bei der Volltextrecherche,,mitspielt", einen interessanten Querbezug zwischenverbaler und klassifikatorischer Inhaltserschließungdar.

Online-Rechercheure, auch solche mit beträchtlicherRetrievalpraxis, sehen oft gerne über die Präsenz einerklassifikatorischen Erschließung in Literaturdatenban-ken hinweg, insbesondere dann, wenn sie Anhänger derreinen ,,Freitextrecherche" sind. Nun soll auch im vor-liegenden Beitrag die Online-Recherche mit Classifica-tion Codes durchaus nicht als grundlegende Alternativezur Textrecherche propagiert werden. Die hier vertrete-ne These lautet vielmehr: Eine Literaturdatenbank istbeim gegenwärtigen Stand der Retrievaltechnik qualita-tiv umso wertvoller, je mehr sachliche Zugriffsmöglich-keiten sie bietet. Eine Recherche wird somit potentiellumso bessere Ergebnisse liefern, je besser man alle vor-handenen Elemente der Inhaltserschließung zu nutzenversteht.

1. Klassifikatorische Erschließung vonLiteraturdatenbanken

1 . 1 Erscheinungsbild der D o kumentations einheit

Fig. 1 zeigt ein Beispiel ftir eine typische Dokumenta-tionseinheit aus einer gut erschlossenen Literaturdaten-bank. Es handelt sich - hier im Ausgabeformat des

r502t74 C85038055dBAsE rr in liblariescadikian, R.state Univ, col.l., Buffalo, NY, UsALibr. Software Rev. (USA) vo1.3, no.4 52L-6Dec, 1984 CODEN: LSREEA ISSN: 0742-5759

TTeatnent: BTBIIOGRAPI{Y' PRACTTCAL; PRODUC?REVIEW

Docunent Type: JOIIRNAI, PAPERlanguages: ENGLISH(5 Refs)The dBAsE II database nanagenent systern is used

at But]er Library to solve DP problens. The authordiscusses its day-to-day use, docunentation, nainfeatures and linitations. A bibliography of dBAsEII naterials is included.

Descriptors: library automationi relationaldatabases

Identifiers: l-ibrary autonationi dBASE IItdatabase managenent systent Butler Libraryt DPproblensi docunentationt nain featuresibibliography; dBASE II naterials

Class Codes: CSl5ODt C7210

Fig. 1: Dokumentationseinheit aus der Datenbank IN-SPEC im Ausgabeformat des Hostsystems DIALOG

Int. Classif. 13 (1986) No. 2 Oberhauser - Classification in Online Systems 79

Hostsystems DIALOG - um ein Zitat aus der briti-schen Datenbank INSPEC, die die internationale Fach-literatur auf den Gebieten Physik, Elektrotechnik/Elektronik, Datenverarbeitung und Informationstech-nologie dokumentiert. Im Basic Index sind folgendeElemente der sachlichen Erschließung recherchierbar:

die Wörter des Titels,die Wörter des Abstract-Textes,

,,Descriptors" oder ,,Controlled Terms" (Deskriptoren aus demINSPEC-Thesaurus (3)),,,Identifiers" oder,,Uncontrolled Terms" (nicht-gebundeneIndexbegriffe; bei INSPEC meist Phrasen aus dem Titel undAbstract bzw. dem Originaldokument).

Darüberhinaus ist aber auch ersichtlich, daß der Lite-raturstelle, die sich mit der Anwendung des Datenbank-systems ,,dBase II" in Bibliotheken befaßt, in der Kate-gorie ,,Class Codes" ztrei Notationen zugeordnet wur-den:

C6160D Relationale Datenbanksysteme, undC72I0 Computeranwendungen in Informationsdiensten.

In zahlreichen anderen bibliographischen Datenbankenbietet sich ein ähnliches Bild, das sich lediglich durch dasjeweils konkret verwendete Klassifikationssystem, dasErscheinungsbild der Notationen und mitunter auchdurch die Kategorienbezeichnung (,,Classification Co-de", ,,Section Code", etc.) unterscheidet.

1.2 Herkunft der Klassifikationen

Die oben dargestellten Notationen entstammen demKlassifikationssystem von INSPEC (4), wo sie in die fol-genden hierarchischen Strukturen eingebettet sind:

A: PhysicsB: Electrotechnology &ElectronicsC: Computing & ControlD: InformationTechnology

C6000 ComputerSoftwareC6100 Software Techniques and ManagementC6160 Database Management SystemsC6160D RelationalDatabaseManagementSystems

C7000 ComputerApplicationsC7200 Information Science and DocumentationC7210 Information Services and Centers

Primär dient das Klassifikationsschema von INSPECder sachlichen Gliederung und damit dem Aufbau dergedruckten Referateorgane, die parallel zur Datenbankerscheinen bzw. dieser vorausgingen (5). Die Literatur-nachweise sind in den betreffenden Referateorganennach diesem Schema angeordnet. Damit liegt hier einBeispiel für den häufigsten Fall des Zustandekommenseiner klassifikatorischen Erschließung von Literatur-datenbanken vor. Als weitere Beispiele wären etwa die,,Chemical Abstracts" (Gliederung nach 80 Sektionen),die,,Physics Briefs" (eigenes Klassifikationssystem),und zahlreiche andere Referateorgane zu nennen.

Dagegen leitet sich z.B. die klassifikatorische Er-schließung der ingenieurwissenschaftlichen DatenbankCOMPENDEX - deren gedrucktes Pendant ,,Engi-neering Index" nicht nach einem Klassifikationsschema,sonderen alphabetisch nach Schlagwörtern geordnet ist

- von einem Current Awareness Service ab, der seit 1928vom Datenbankproduzenten angeboten wurde. Dabeidiente die Klassifikation zur Erstellung von thematisch

abgegrenzten Standardprofilen, nach denen eine laufen-de Zusendung von Literaturnachweisen erfolgte. Ob-wohl dieser Dienst (,,CARD-A-LERT") mit dem Auf-kommen des Online-Retrieval im Jahre 1975 eingestelltwurde, behielt man die Vergabe von Class Codes bisheute bei (6).

Im Falle vieler Patentdatenbanken (7) liegt die klassi-fikatorische Erschließung in der Arbeitder Patentämterbegründet, die im Zuge des Prüfungsverfahrens Nota-tionen aus einschlägigen Patentklassifikationen verge-ben. Als Beispiel kann etwa die amerikanische Patent-datenbank PATSEARCH genannt werden, die sowohlNotationen der Internationalen als auch der amerikani-schen Patentklassifikation aufweist.

Auch Bibliotheken tragen gegebenenfalls zur Präsenzvon Class Codes in Datenbanken bei. So beinhalten dieZitate der bei DIALOG angebotenen Files MARC/REMARC (: Buchbestand der Library of Congress,Washington/DC) neben den sonstigen bibliographi-schen Kategorien auch die Notationen der Library ofCongress Classification.

Nur selten wurden Klassifikationen ftir die sachlicheErschließung von bibliographischen Datenbanken spe-ziell entwickelt. Bei der amerikanischen Wirtschafts-datenbank ABI/INFORM - zu der kein gedrucktesPendant besteht - war dies allerdings der Fall. Hier kamman erst vor wenigen Jahren zu dem Entschluß, die be-stehende sachliche Erschließung (Abstracts, Deskripto-ren) durch Hinzufügen von Class Codes zu verbessern,was zur Entwicklung eines eigenen Schemas führte (8).

1. 3 Bekannte Klassifikationen online

Unter den zahlreichen und verschiedenartigen Klassifi-kationssystemen, die in bibliographischen Datenbankenzu registrieren sind, finden sich auch mehrere Systememit relativ hohem Bekanntheitsgrad. Beispiele dafürsind:

- die bereits genannten 8O Sektionen der ,,Chemical Abstracts",die in der Datenbank CA SEARCH recherchierbar sind;

- die ebenfalls schon erwähnte Klassifikation der DatenbankINSPEC, die vier gedruckte Dienste gliedert (vgl. Anm. 5);

- die Internationale Patentklassifikation (IPC), die in nahezuallen Patentdatenbanken (2.8. INPADOC, PATSEARCH,CLAIMS, WPI, etc. ) sowie auch bspw. in CA SEARCH ftir dienachgewiesenen Patentdokumente Anwendung findet;

- die Snndard Industrial Classification (SIC), eine Klassifikationfür wirtschaftliche Phänomene (v.a. auch ftir Produkte undDienstleistungen), deren Codes in mehreren einschlägigen Li-teraturdatenbanken (PREDICASTS, INDUSTRY DATASOURCES, TRADE AND INDUSTRY INDEX, etc.) sowieauch in etlichen Faktenbanken vergeben werden;

- die Klassifikation der American Mathernatical Society (AMS),die in den beiden bedeutendsten mathematischen Referate-organen, dem ,,Zntralblatt ftir Mathematik und ihre Gretrzge-biete" sowie den ,,Mathematical Reviews", verwendet wirdund somit auch in deren Online-Versionen, MATTI undMATIISCI, recherchiert werden kann;

- das Sachgruppenscherna der Deutschen Bibliothek (65 Sach-gruppen, frtiher: 26), das die ,,Deutsche Bibliographie.. glie-dert und in der nationalbibliographischen InformationsbankBIBLIO-DATA wiederzufi nden ist.

Auch eine der bekanntesten Klassifikationen, die Inter-nationale Dezimalklassifikation (UDC), ist in einigenLiteraturdatenbanken recherchierbar. Dabei handelt essich um folgende Dateien:

80 Int. Classif. 13 (1986) No. 2 Oberhauser - Classification in Online Systems

- VOLKSWAGENWERK: eine Dokumentation zu den The-mengebieten Fahrzeug- und Transportindustrie ;

- CAB ABSTRACTS: die UDC wird in der Teildatei ,,Forstwirt-schaft" dieser agrarwissenschaftlichen Datenbank des Com-monwealth Agricultural Bureau angewendet;

- PICA: eine britische Datenbank für Architektur und Bau-wesen;

- FOREIGN TRADE & ECONOMY ABSTRACTS: eine nie-derländische Datenbank zu den Themenbereichen Wirtschaftund Handel;

- SOVIET SCIENCE & TECHNOLOGY: eine amerikanischeDatenbank, die Literatur über Technik und Naturwissenschaf-ten in Ostblockstaaten nachweist.

Auch wenn diese Aufstellung nicht absolut vollständigsein sollte, geht daraus hervor, daß die Zahlder Daten-banken mit UDC-Codes nicht sehr groß ist. Auch han-delt es sich bei den betreffenden Datenbanken nicht ge-rade um die wichtigsten oder größten Literaturspeicher.Es kann somit festgehalten werden, daß die UDC imKontext des bibliographischen Online Information Re-trieval nicht jene Rolle spielt, die ihr in anderen Berei-chen zukommen mag.

1.4 Arten von Klassifikationen

Die in bibliographischen Datenbanken verwendetenKlassifikationssyteme weisen nicht nur hinsichtlich ihrerfachlichen Orientierung bzw. ihres fachlichen Umfan-ges, sondern vor allem auch hinsichtlich ihres Komplexi-tätsgrades und ihrer hierarchischen Struktur ein sehr un-terschiedliches Erscheinungsbild auf.

Fig. 2 zeigt ein Beispiel für die einfachste Form, einsog. Sachgruppen-Schema. Nun könnte angezweifeltwerden, ob ein solches einstufiges Gliederungsschemaals Klassifikation gelten darf, da keine hierarchischeStruktur vorliegt. Allerdings können auch solche Sche-mata im vorliegenden Zusammenhang zu den Mittelnder klassifikatorischen Sacherschließung gerechnet wer-den, da sie die gleiche Zielsetzung wie komplexere Sy-

steme verfolgen und bei der praktischen Recherche ähn-lich behandelt werden wie diese. In Fig. 2 handelt es sichum die 21 Sektionen der amerikanischen Umweltdaten-bank ENVIROLINE, die die einfache Bauweise einessolchen Schemas - gleichrangige Gruppen bei durchausunterschiedlichem thematischen Umfang - deutlich zei-

Fig. 2: Beispiel für ein Sachgruppenschema

Etwas strukturierter ist da$egen die in Fig. 3 auszugs-weise dargestellte Klassifikation der US-DatenbankSOCIOLOGICAL ABSTRACTS. Hier handelt es sichum ein zweßtufiges Ordnungssyslern, dessen Haupt-gruppen jeweils durch eine (ungleiche) Zahl von Unter-gruppen aufgegliedert sind. Die Hierarchie drückt sichin der Notation aus: So ist z.B. die Klasse 0105 (Statisti-sche Methoden) eine Subklasse von 01 (Methodologieund Forschungstechniken).

RLASSIFIXATION DER DATENBANK SOCIOL.OGICAIJ ABSTRACTg(Auszug)

01 l,!€thodologY alrd Res€arcb Technology01ol Of General Interest0103 ltethodologyo1o4 Research TechnologYO1o5 Statistical Methods0161 Models: Mathenatical- and Other

02 Sociology: History and Theoryo2O2 Of Professional Interest0206 Eistory and Present status of socioloqyO2O1 Theorj-es, Ideas, and Systems0233 Sociology of Knowledge0267 Macrosociology: Analyses of Society

03 gocial PsYcholoqy0309 Interaction within (Snall) Groups0312 Personality and Culture0322 Leadership0364 Deviance

O{ GrouP Interactionso4l-O Interactions Betueen (Large) Groups -

Race and Gloup Rel.ations

05 Cutture anal Social gtructureo5os SociaL organization0513 CuLture (Evolution)0514 Social. AnthropologY (and Ethnology)

Fig. 3: Beispiel ftir ein zweistufiges Klassifikationssy-stem

Als Beispiel für ein sehr komplexes System mitmeh-reren H ierarchies tufen sei schließlich die InternationalePatentklassifikation (IPC) genannt. Wie atus Fig. 4 er'sichtlich ist, weist sie acht Obergruppen, die sog. Sek-tionen, auf, die weiters in Subsektionen, Klassen, Sub-klassen, Haupt- und Subgruppen unterteilt sind. Wäh-rend etwa auf der dritten Hierarchiestufe hunderte Klas-

IPc-sektionen:

A TägLicherLebensbedarfB ArbeitsverfahrenC chenie und HüttenwesenD Textil und PapierE Bauweseni BergbauF Maschinenbaut Beleuchtung; Heizungt waffenc PhysikH El.ektrotechnik

Beispiel für eine Notationshierarchie:

Section Chenie und Hüttenwesen2 Subsection Hüttenwesen2I cl.ass Eisenhüttenwesen2L B Subclass Gewinnung v. Eisen/stahl2L B oo5/oo Main Group Roheisengew. in Hochofen2L B oo5/o4 Subgroup Gewinnung v. schlacke

besond, .zusamensetzung

cc

Fig. 4: Beispiel für ein mehrstufiges Klassifikationssy-stem

gen.

Ol Air Pollution02 chemical & Biological contanination03 Energy04 Environnental. Education05 Environmental Design & Urban Ecology06 Food & DrugsO7 ceneralOg International09 Land Use & Misuselo Noise Poll-utionll Non-Renewable ResourcesL2 Oceans & Estuaries13 Population Planning & Control14 Radiological contanj-nation15 Renewable Resources - Terrestrial16 Renewable Resources - waterI7 Solid Wastel8 Transportation19 l.tater Pollution20 weather t4odification & Geoplrysical change2r wiJ.dIife

Int. Classif. 13 (1986) No. 2 Oberhauser - Classification in Online Systems 81

sen bestehen, existieren auf der sechsten Stufe bereitsviele tausend Subgruppen. Die Tafeln dieser Klassifika-tion füllen daher auch mehrere Bände (9).

1.5 Quantitative Daten

Um einen quantitativen Überblick über das Phänomen,,Klassifikationen in Online-Datenbanken" zu erhalten,wurde eine Auszählung der vom Hostsystem DIALOG,also der größten einschlägigen Vertreiberorganisation,angebotenen bibliographischen Datenbanken vorge-nommen (Stand: Oktober 1985).Von insgesamt 1"23 Literaturdatenbanken wurden:

65 durch eine Klassifikation erschlossen, während58 über keine klassifikatorische Erschließung verfügten.

Hinsichtlich der Art der Klassifikationen ergab sich dasfolgende Bild: Von den 65 Klassifikationen waren:

15 einstufige Sachgruppenschemata,10 zweistufige Klassifikationssysteme,36 mehrstufige Klassifikationssysteme, und4 unklare Fälle.

Schließlich wurde auch ermittelt, wieviele Notationenpro Dokumentationseinheit (DE) vergeben wurden.Von den 65 durch Klassifikationen erschlossenen Daten-banken wiesen:

22 nur eine einzige Notation pro DE,38 dagegen mehrere Notationen pro DE, und5 eine unklare Zahlvon Notationen pro DE auf.

Somit verfügt die Mehrheit der untersuchten Literatur-datenbanken über eine klassifikatorische Sacherschlie-ßung, die wiederum eher durch die Vergabe von mehre-ren Notationen aus einem mehrstufigen System reali-siert ist. Was die übrigen Hostsysteme betrifft, so kannbei diesen eine ähnliche Verteilung vermutet werden,zumal sich ihr Datenbankenangebot mit dem von DIA-LOG zum Teil auch überschneidet.

2. Recherchepraxis nit Class Codes

2.1 Retrievaltechnik

Voraussetzung für die Durchftihrung einer Online-Recherche mithilfe von Class Codes ist natürlich dasVorliegen der Tafeln des betreffenden Klassifikations-systems. Übersichten zu Sachgruppenschemata bzw.kleineren Klassifikationen finden sich meist in den Be-nutzerunterlagen, die die jeweiligen Hosts zu den vonihnen vertriebenen Datenbanken herausgeben (2.B. beiDIALOG in den sog. ,,database chapters"); größereSchemata sind häufig als selbständige Publikationen er-schienen (vgl. z.B. Anm. 4 u. 9). Die Klassifikationsta-feln stehen im Prinzip auchonlinezur Verfügung, sofernder jeweilige Host seine Datei so aufgebaut hat, daßneben den invertierten Class Codes auch der Classifica-tion Text gespeichert ist. In diesem Fall kann mit jenemKommando, das den Registereinblick ermöglicht (EX-PAND, DISPLAY, etc.), eine Online-Inspektion derTafeln vorgenommen werden, die allerdings wenigerkomfortabel als das Blättern in einer gedruckten Ausga-be ist und überdies Ad-hoc-Kosten verursacht. EinzelneKlassifikationen liegen darüberhinaus auch in Formselbständiger Datenbanken vor, so z.B. die ,,StandardIndustrial Classification" beim britischen Host PER-GAMON-INFOLINE (Datei SIC), die,,International

Patent Classification" beim französischen Host TELE-SYSTEMES-QUESTEL (Datei INPI-4) und die ,,USPatent Classification" bei DIALOG (Datei CLAIMS/CLASS).

Das Retricval.der Class Codes erfolgt bei jenen Syste-men, die mit mehreren Registern arbeiten (2.B. DIA-LOG, MESSENGER, ESA-QUEST, etc.), über einspezielles Datenfeld, welches im Suchkommando alsPräfix oder Suffix codiert sein kann, z.B.:

SELECT CC:742. . . Datenbank COMPENDEX, VersionDIALOG, Class Code ftir ,,Cameras& Photography",

SEARCH 80/SC . . . Datenbank CA SEARCH; VersionSTN, Section Code für,,Organic Ana-lytical Chemistry".

Bei Systemen, die mit einem einzigen Register arbeiten(2.8. DSO/STAIRS), wird der Class Code im Suchkom-mando,,qualifiziert", z.B. i

742.CC. ... DatenbankCOMPENDEX,VersionDATA-STAR, Class Code ftir,,Came-ras & Photography" (das Suchkom-mando,,. . SEARCH" ist implizit).

Als Feldbezeichnungen gelangen, je nach System undDatenbank, die unterschiedlichsten Kürzel zur Anwen-dung, z.B.:

CC Classification CodeCL ClassificationPC PatentClassificationSC Section CodeSH Section Heading.

Der Komfort, der bei der Recherche nach Class Codesgeboten wird, kann sogar innerhalb eines Hostsystemsvariieren. So wird z.B. im System DIALOG:

bei der Recherche in der Datenbank INSPEC der ClassificationText als hilfreiche Zusatzinformation vom System ,,zurückge-schrieben":

Eingabe: SELECT CC:C6160DAntwort: 51 2912 CC:C6lffiD (Relational DBMS)

hingegen bei der Recherche in der Datenbank SOCIOLOGI-CAL ABSTRACTS keine derartige Hilfestellung geleistet(0233 : Sociology ofKnowledge):

Eingabe: SELECT SH:0233Antwort: 51 303 SH:0233

Besonders hilfreich kann die flexible Endmaskierung(,,truncation") von Classification Codes zwei- odermehrstufiger Systeme sein. Dadurch ist eine (sukzessi-ve) Verbreiterung von Themenklassen erreichbar, wiesie im Vergleich dazu bei der manuellen Recherche nichtmöglich ist: Die Eingabe eines Class Code mit flexiblerEndmaskierung ftihrt zur Subsumierung aller Doku-mentationseinheiten, die den eingegebenen Stammbzw. einen spezielleren Code aufweisen, unter eine Er-gebnismenge. Auf diese Weise kann z.B. eine Haupt-gruppe mit all ihren Untergruppen simultan recher-chiert werden.

Zwei Probleme können bei ,,truncation" von ClassCodes zutage treten:

Die erforderliche Rechenzeit kann bei einer großen Zahl vonzu subsumierenden Endungen bzw. großen Zitathäufigkeitenstark ansteigen;und/oderDie maximale Zahl von Suchbegriffen, die den gleichen Stammaufueisen und simultan in einem einzigen Befehlsschritt abge-arbeitet werden können; kann vom Retrievalsystem her zustark begrenzt sein (2.8. ist diese Grenze im System DSO/

82 Int. Classif. 13 (1986) No. 2 Oberhauser - Classification in Online Systems

STAIRS mit nur 100 Begriffen viel zu niedrig, was auch bei derflexiblen Endmaskierung von Verbalbegriffen - ganz beson-ders, wenn es sich um deutschsprachige handelt - immer wie-der spürbar wird!)

Eine Lösung für diese Probleme ist dann gegeben, wenndas jeweilige Hostsystem bereits beim Datenbankauf-bau dafür sorgt, daß jeweils alle Subcodes einer Gruppeauch zusätzlich unter einem gemeinsamen Gruppen-code eingetragen werden. Der letztere ist sodann ohne,,truncation" recherchierbar und läßt den unmittelbarenZugnff. auf die bereits subsumierte Menge von Doku-mentationseinheiten zu, ohne daß Zeit- oder Begren-zungsprobleme auftreten. Man spricht in diesem Fallvon ,,cascaded class codes". Für die praktische Anwen-dung ist eine genaue Vorinformation in den diversenManuals, wle solche Codes anzusetzen sind und - beimehrstufigen Klassifikationssystemen - auf welchenStufen derartige Gruppencodes existieren, unerläßlich.Als Beispiele für ,,cascaded codes" können etwa die Da-tenbanken COMPENDEX (in der Version von DIA-LOG) oder INSPEC (in der Version von DATA-STAR)genannt werden.

2.2 Anwendungsbeispiel 1 :Reduktion v on Mehrdeutigkeit

Das erste Beispiel (Fig. 5) zeigt eine der bekanntestenAnwendungen von Class Codes bei Online-Recher-chen. Insbesondere in multidisziplinären Datenbanken

PTObIEM3 MEHRDEUTTGKEIT IN MULTIDISZIPLIN.i|RENDATENBANKEN

ziel3 HersteLlung des gewünschten thena-tischen Zusamenhangs

Thema: Veryendung von Conputersystemen durchReiseveranstalter

Datenbank: INSPEC (Physik - Elektrotechnik - EDV)

Suchbegriffe: tour(s), tourisn, holiday(s),travel (s), travel(1) ing, etc.

üehraleutigi TRAVEL (unterschiedliche Bedeutung in derAstro- bzw. Teilchenphysik)

class code: c7l = Conputer Applications in Adnini-strative Data Processingt

Suchfomul.ielurg (DIALOG) :sErJEcT sTEps (TouR? oR tR-AvEL? OR üOLIDAY?) AlllD CC=C71?

Amerkung: Suchbegriffe und class Code sind nitflexibler Endnaskierung ("?r') versehen.

Fig. 5: Anwendungsbeispiel 1

können verbale Suchbegriffe - oft unerwartet - mehr-deutig sein, was z.T. auch durch logische UND-Ver-knüpfung mit anderen Verbalbegriffen nicht korrigier-bar ist. Hier kann die Verknüpfung mit einem Class Co-de, der den gewünschten thematischen Zusammenhangimpliziert, dazu verhelfen, das Rechercheergebnis we-sentlich zu verbessern. Das Beispiel in Fig. 5 zeigt über-dies, wie knapp und einfach eine Suchformulierung un-ter Einbeziehung eines Class Codes (hier mit flexiblerEndmaskierung) ausfallen kann (10).

2.3 Anwendungsbeispiel 2 :Schwer aus drückbare Sachverhalte

Sehr hilfreich können Class Codes im Fall von bestimm-ten thematischen Sachverhalten sein, die durch verbaleSuchbegriffe nur unzureichend formuliert werden kön-

nen. Im Beispiel in Fig. 6 ist dies der Aspekt ,,biomedi-zinische Anwendungen". Es ist zu erwarten, daß diegewünschten Ergebniszitate sehr spezifische Anwen-dungen der akustischen Mikroskopie beschreiben wer-den, die kaum mit Phrasen wie ,,biomedical application"indexiert sein dürften. Eine reine Freitextrecherchemüßte hier auf eine Vielzahl schwer festzulegender Ver-balbegriffe zurückgreifen und würde mit Sicherheit zueinem weniger guten Ergebnis ftihren als die wiederumrelativ einfache Anwendung von zwei einschlägigenClass Codes (11).

ProbI€B!

ziel:Theua!

Datenbank:

Deskriptor:

schsierig:

class coal€s!

vemeiden einer vlelzahl von Einzelbeqriffen

Bionedizinische Anwendunq der akustischenI'likroskopie

INSPEC

Acousti.c l"ticroscopes (INSPEC Thesaurus)

Ibionedizin j,sche Arwendungenrl

487 = Biophysics and Bionedical EngineeringB75 = Biomedical Electronics

Suchfonulierung (DIALOG) !SELECI SIEpS ACOUAIIC(w)I.IICROSCOP? ÄlID CC=(e87? oR 87s?)

AMerkung: obwohl ein Deskriptor vorhanden ist, wi.rdIakustj.sche I'Iikroskopj.e" als Freitextphraserecherchiert, un den Recall zu erhöhen.Freitext und cl-ass codes nit flexibler End-naskierung.

Fig. 6: Anwendungsbeispiel 2

2.4 Anwendungsbeßpiel 3 :Aus s chlutS v o n T he menklas s en

Das in Fig. 7 dargestellte Beispiel veranschaulicht, wiedurch den Ausschluß einer ganzen Hauptklasse die Prä-zision eines Rechercheergebnisses verbessert werdenkann. Hier wurde die Hauptklasse,,Kernphysik", inklu-sive ihrer zahlreichen Subklassen (sowie deren Subklas-

Probleu:

zi.eL.

thenas

THEI.,IENKI,AS SE

Erhöhung der Präzision

Mehrfachstreuung in der Festkörperphysik undAtonphysik

Daten-bank! INSPEC

suchbegriffe3 nultiple scattering. plural scattering,nultiple/pluraL process (es) ,nultiple/pluraI interaction (s)

unesünscht: Kernphysikalische }lessungen

class code: 42000 = Nuclear Physics (nit zahlreichenUntergruppen)

guchfomulierung (DIAIOG) :SELECT SIEPS (l.tUl,TIPLE OR PLURIL) (If) (SCATIERING OR

PRoCESS? oR INTERACIIoN?) NOt cc=42?

Fig. 7: Anwendungsbeispiel 3

sen), mit einem logischen UND NICHT aus der Ergeb-nismenge ausgeschlossen, wodurch mit einem einzigenSuchschritt die unerwünschten Zitate - Literaturstel-len, die kemphysikalische Messungen zum Inhalt hatten

- eliminiert werden konnten.

2.5 Anwendungsbeispiel 4:B ib lio grap hß che Vertfi z ierung

Auch im Falle von Online-Recherchen, die nicht einersachlich orientierten Literaturzusammenstellung die-nen, sondern eine bibliographische Verifizierung be-stimmter ZitatezttmZielhaben, können Class Codes er-

lnt. Classif. 13 (1986) No. 2 Oberhauser - Classification in Online Systems 83

folgreich eingesetzt werden. Im vorliegenden Beispiel(Fig. 8) wurde sinnvollerweise nicht versucht, den the-matischen Zusammenhang durch Suchbegriffe wie z.B.,,Finanztransaktion" oder,,Internationale Banken" her-zustellen. Die Verwendung eines thematisch breiterenClass Code (= potentiell höherer Recall!) erwies sichhier als die beste (und einfachste) Lösung (12).

Problen! BIBLIoGRAPHISCHE VERIFIZIERUNG

Erhöhung des Recalls

cesucht: Artikel über Finanztransaktion zwischen Iranund internationalen Banken kurz nach Frei--Iassung der us-Geise1n, vemutlich in v'irt-schaftsnagazin IFortunerl

Datenbalk: ABIlINfoR!,i

cLass cotle: g = Industries & ltarkets8:.00 = FinaDcial geryices Inllustry8II0 = Comercial Banking8I2o = Retail Banking8130 = Investnent Seryices

suchfomuliorung (DIALOG) lSELECT STEPS IRN AND JC=FOR AXD CC=AI?

Amerkungr Datenbankspezifischer Zeitschriften-code inspeziellen suchfeld (Jc=FoR)

Ergebnis !

81005225The Iran DeaI Dgesnrt Look Baal-

Nickel, HemanFortune v1o3n4 PP: 57-59 Feb 23, 1981 CODEN:

FoRTAP ISSN: 0015-8259JRNL CODEi FORDoc TYPE: Journal Paper LANGUAGE: EngLishAVAIIABILITY: ABI,/INroRMDESCRIPTORS: Iran i Hostages; Negotiations;

Agreenents; Banksi Banking lndustry; clains;settlenent

CT,ASSTFICATION CODES: 8100 (CN=Financial seryicesindustry)

Fig. 8: Anwendungsbeispiel 4

2.6 Anwendungsbeispiel 5 :Primöre und sekundöre Class Codes

Sofern den Dokumentationseinheiten in einem Refera-teorgan oder einer Datenbank mehr als nur eine Nota-tion zugeordnet wird, bezeichnet der Begriff ,,primäreNotation" jene Klasse, unter der die Haupteintragungder betreffenden Dokumentationseinheit in der ge-druckten Ausgabe erscheint.,,Sekundäre Notationen"sind hingegen jene, unter denen eine Verweisung (,,sie-he auch") auf die Haupteintragung erfolgt. Bei der ma-nuellen Suche in Referateorganen ist es vom Arbeitsauf-wand her nahezu unvorstellbar, über einen größerenZeitraum hinweg auch all diesen Verweisungen nachzu-gehen. Bei einer Online-Recherche nach Class Codes istdies hingegen kein Problem, da simultan pimäre undsekundäre Notationen gefunden werden.

Beispielsweise erfaßt in der Datenbank MATH( : Online-Version des,,Zentr alblatts fü r Mathemati k" ;

Host: STN) die Eingabe in der Form: ,,SEARCH 65?/CC" alle Zitate, die in der gedruckten Version in derGruppe 65 (Numerische Mathematik) bzw. einer ihrerUntergruppen als Haupteintr agung o der als Verweisungerscheinen. Soll hingegen nur nach primären Notatio-nen recherchiert werden, ist (in der Suchsprache MES-SENGER) vor dem entsprechenden Class Code einAsterisk einzugeben, z.B. : SEARCH * 46A12l CC.

2.7 Anwendungsbeispiel 6 : SD l-Profile

Der Terminus,,SDI-Profi l" (Selective Dissemination ofInformation) bezeichnet eine Suchformulierung, die -

in einem Online-System dauerhaft gespeichert - bei je-der Aktualisierung einer bestimmten Datenbank auto-matisch abgearbeitet wird und so zur kontinuierlichenLiteraturüberwachung auf einem festgelegten Themen-gebiet dient. Oft werden derartige SDl-Profile thema-tisch breiter formuliert als retrospektive Recherchen, daimZuge der periodischen Aktualisierungen jeweils nurkleinere Datenbestände durchsucht werden und über-dies meist nach ,,Vollständigkeit" (Recall) getrachtetwird. Aus diesem Grund ist es mitunter besonders gün-stig, Class Codes in SDl-Profile einzubauen. Das Bei-spiel in Fig. 9 zeigt eine solche Anwendung, wobei hiereine Verknüpfung mit einer Formalkategorie - demAutorenfeld - erfolgt, da dieses SDI-Profil die Litera-turproduktion einiger Autoren auf einem bestimmtenThemengebiet überwachen soll.

Ptoblen: SDI-PROFIL

zieli Breiter Recal]

The[a: Laufende überyachunq der Arbeiten von vierAutoren auf dem cebiet der adaptiven systen-theori.e

Datenbank: INSPEC

Class Coales: CL00O = Systens and Control Theorycl.20o = systens Theory & cyberneticsCI240 = Adaptive Systens Theory

Suchfornulierung (DATA-STAR) :Tttol{PgoN-R9. AU.GOOD.I$.AU.GLUSXKOV-V9.AU.oDA-t{$.AU.{c12 93 . CC.(1OR234)AAD5

AMelkung: Da ein breiter Recall effünscht ist, uirdsicherhei.tshalber die Rlasse Ct2 ansteLleder spezj.fischeren l(lasse C1240 venendet.

Fig. 9: Anwendungsbeispiel 6

2.8 Klassifikationen und Endbenutzer

Erfahrungsgemäß wissen viele Endbenutzer, die dieDienste einer Informationsvermittlungsstelle in An-spruch nehmen, über Klassifikationen kaum oder wenigBescheid. Meist sind sie daher auch nicht in der Lage, inihren subj ektiven Recherchevorbereitungen bereits ei-nen Class Code zu berücksichtigen. Dennoch kommen

- wenn es um die Durchftihrung einer Online-Recher-che geht - Klassifikationen dem Denken zahlreicherEndbenutzer grundsätzlich sehr entgegen. Dies ist m.E.durch die Erwartungen bzw. Vorstellungen begründet,mit denen Endbenutzer sehr häufig Online InformationRetrieval Systemen begegnen. Die wichtigsten dieserVorstellungen seien im folgenden kurz skizziert:

- Erwartung eines automatischen ,,upposting" bzttt. ,down-posting" von Suchbegriffen (besonders häufig!). Man glaubt,durch die Eingabe eines allgemeineren Begriffes auch alle spe-zielleren Begriffe abgedeckt zu haben und auf diese verzichtenzu können. (Beispiel: HORMONES vs. ADRENALINE, IN-SULINE, etc.);

- Annahme einer generellen SynonymkonrrolJe (soweit nichtweiter reflektiert wird, sogar auch ftir Freitextfelder!)(Beispiel: KRANKENHAUS vs. KRANKENANSTALT vs.SPITAL);

- Annahme einer automatischen Auflösung von Abkürzungen(Beispiel: IR vs. INFRARED);

- Erwartung einer automatischen Bereinigung von Schreib-v arianten (2. B. britische vs. amerikanische Schreibweise)(Beispiele: COLOR vs. COLOUR, INFRARED vs. INFRA-RED);

- Vorstellung einer automatischen Bewältignng von Flexionsfor-

84 Int. Classif. 13 (1986) No. 2 Oberhauser - Classification in Online Systems

men (in Freitext!), die auch bei flexibler Endmaskierung nichtabgedeckt sind(Beispiel: SPITAL vs. SPITALER);

- Erwartung einer automatischen Wortfragmentierung bei kom-plexen Komposita, wie sie gerade im Deutschen sehr häufigauftreten(Beispiel: KRANKENHAUSFINANZIERUNG vs. KRAN-KENHAUS AND FINANZIERUNG).

Alle diese Erwartungen und Vorstellungen werden inder Realität der heutigen Online-Systeme meist nicftt er-füllt. Die Indexierung nach hierarchischen Thesaurifolgt in der Regel dem Prinzip des ,,engen Begdffes";Freitexte weisen die gesamte Fülle der Unstrukturiert-heit auf, die einem ,,freien" Vokabular zu eigen ist;deutschsprachige Freitexte bieten zudem die spezifi-schen Probleme der deutschen Sprache.

Klassifikationssysteme als Mittel der sachlichen On-line-Recherche ,,bewältigen" die genannten Aspekte oftaber dennoch. Class Codes mit flexibler Endmaskierungfassen z.B. ganze Gruppen von Themenklassen in einemSuchbegriff (ohne die Notwendigkeit der Auflistungaller spezifischen Elemente) zusammen. Die Suche mitClass Codes setzt sich über Schreibweisen, Flexionsfor-men, Komposita-Probleme etc. leicht und elegant hin-weg. Präsentiert man Endbenützern im Zuge einerRecherchevorbereitung geeignete Klassifikationstafeln,so wird ein solcher Zugang oft rasch akzeptiert und alsgünstig bewertet.

3. Anderungen von Class Codes

Bekanntlich beginnen Klassifikationssysteme in jenemAugenblick zu veralten, in dem sie formuliert wurden.Online-Rechercheure, die mit Class Codes arbeiten, be-kommen dieses Faktum immer wieder zu spüren, ob-wohl der Zeitraum, den eine literaturdatenbank retro-spektiv umfaßt, meist nicht größer als etwa 15 Jahre ist.Beim raschen Wandel der wissenschaftlich-technischenEntwicklung ist es aber unumgänglich, daß Datenbank-produzenten - vor allem aufden Sektoren Naturwissen-schaft und Technik - immer wieder Anpassungen undAnderungen ihrer Gliederungssysteme vörnehmen. Diedadurch entstehenden Inhomogenitäten und Brüche inden Klassifikationssystemen erweisen sich als dasHauptproblem bei der praktischen Arbeit mit ClassCodes in Online-Systemen. Die Bewältigung diesesProblems wird in der Regel nur erfahrenen Online-Rechercheuren, die in ihren Institutionen auch mit denentsprechenden Handbüchern ausgestattet sind, gelin-gen; selbständig recherchierende Endbenutzer - eine inletzter Zeit von den Hosts intensiv umworbene poten-tielle Zielgruppe der Informationsindustrie - dürftenhier hingegen wohl an die Grenzen des ihnen Möglichenstoßen.

Zur Veranschaulichung möglicher Anderungsmusterseien im folgenden einige Beispiele genannt:

Sektionen der CHEMICAL ABSTRACTS:Version l: l%7-l9lVenion 2: 1972-1981Version 3: l982ff.

Klassifikation der SOCIOLOGICAL AB STRACTS :Grundschema: 1963ff.Neu (Sub')Klassen: 1!}68, 197 l, Ln2, ß73, 197 5, 1E77, 1978,

1982,1983

Klassifikation von INSPEC:Version l: 1969-L972Version2: 1973-1976Version3: 1977-1984Version 4: 1985ff.

Welcher Art sind nun die konkreten Probleme für dieRecherchepraxis? Frg. 10 zeigtzunächst ein Beispiel ausden Sektionen der CHEMICALABSTRACTS (Daten-bank CA SEARCH). Hier wurde 1982 durch Aufspal-tung der ursprünglichen Sektion 35 (Synthetic HighPolymers) in zwei neue Sektionen (35 und 36) eine Ver-

1967-19813Sektion 35 = Synthetic Hj"gh pollmersSektion 35 = Plastics Manufacture

19A2 ff.:Sektj.on 35 = Chenistry of Synthetic High pollmersSektion 35 = Physical- Properties of synth. High Pollm.Sektion 37 = Plastics Uanufacture

Fig. 10: Beispiel für eine Anderung im Sektionensche-ma der "Chemical Abstracts"

schiebung der weiteren Notationen bewirkt (PlasticsManufacture: vorher 36, nachher 37). Dieselbe Nota-tion (2.B. 36) bezeichnet somit in unterschiedlichenZeiträumen unterschiedliche Klassen. Dieses Problemkann außer durch explizite Verknüpfung mit dem jewei-ligen Zeitraum auch durch eine Recherche mittels Ver-balbezeichnungen von Klassen gelöst werden, z.B. imSystem STN:

Eingabe: SEARCH(sYNTI{ETrC(W)HrGH(W)POLYMERSySC

Resultat: Es werden alle Dokumentationseinheiten gefunden,die die Phrase ,,Synthetic High Polymers" im Daten-feld ,,SC' (Section Code oder Section Text) auf-weisen.

Im nächsten Beispiel (Fig. 1I) wird das Problem einerneugeschaffenen Klasse berührt. So wurde z.B. in den

03 = Social Psychologyo309 = Interactions within sEaII Gröups0312 = Personality and culture0322 = Leadershi.p0364 = Deviance (aalded in 1983)

Fig. 11: Beispiel fär eine Anderung im Klassifikations-system der "Sociological Abstracts"

SOüOLOGICAL ABSTRACTS im Jahre 1983 derGruppe ,,Sozialpsychologie" eine Subklasse für ,,Ab-weichendes Verhalten" hinzugefügt. Problematisch sindhier zwei Aspekte:

Für den T,eit.gaam vor 1983 ist der Themenbereich ,,Abwei-chendes Verhalten" nicht durch einen Classification Code aus-drückbar;Die Verknüpfung einer Ergebnismenge mit dem Code ,,0364"beschränkt die Recherche automatisch und ohne Warnung aufden Zugangszeitraum ab 1983 (ob dies nun erwünscht ist odernicht).

Besonders dramatisch fielen einige Anderungen derINSPEC-Classification aus, was in Fig. 12 am Beispielder Klasse,,Digitale Rechenanlagen" demonstriertwird. Anläßlich der ersten Anderung (1973) wurde dieursprüngliche Notation,,C9600" mit einer anderen Be-deutung versehen und ,,C9800' als neue Notation verge-

Int. Classif. 13 (1986) No. 2 Oberhauser - Classification in Online Systems 85

L969-72 L97 3-7 6 !977 -Aa 1965 ff.

c54 ro DigitalConputers& Systens

c5420

c5440c54? O

c5490

l{a.infranes &

MinisUicroconputersMultiprocessorPerfomanceolher Aspects

c9500 DigitalConputers& Systens

CanputerPeriphe-rals

c9800 DigitalCorputers& Systens

Fig. 12: Beispiel für eine Anderung des Klassifikations-systems der Datenbank INSPEC

ben. Diese wurde 1977 gestnchen und durch ,,C5410"ersetzt. Schließlich wurde 1985 die gesamte Klasse ,,Di-gitale Rechenanlagen" zugunsten von fünf spezifische-ren Subklassen mit wiederum neuen Notationen aufge-löst. Dies verdeutlicht, warum bei dieser Datenbank fürdie Recherche nach Class Codes eine umfangreicheKonkordanz unerläßlich ist (13).Erschwerend wirkt hier noch der Umstand, daß jedesHostsystem, das die Datenbank INSPEC online anbie-tet, eine andere läsung für die Bewältigung derartigerAnderungen gefunden hat. Wie diese Lösungen in derPraxis aussehen, soll abschließend am Beispiel derNotationen für die Klasse ,,Measurement of Rate Con-stants" (Subklasse von ,,Chemical Kinetics" und damitvon ,,Physical Chemistry") gezeigt werden:

Version3/4 (1977ff.): A8220PVersion2 (1973-1976): A9210Version I (1969-1972): A1910

- Hostsystem DIALOG (Palo Alto, USA):Die Datenbank INSPEC liegt in zwei Dateien vor. Die neuereDatei (File 13) beginnt nit 1977 . Da bei der letzten Anderungder Klassifikation ausschließlich neue Klassen eingeftihrt wur-de, ist die Recherche in dieser Datei unproblematisch:

Eingabe: SELECT CC= A8220P

In der älteren Datei (File 12, 1969-1976) muß dem Systemdurch Voranstellen einer Ziffer mitgeteilt werden, welcherZeitabschnitt für die Bedeutung eines Class Codes gemeint ist!

Eingabe: SELECT CC: (?A9210 OR !A1910)Wird das Voranstellen der Ziffern vergessen, so erhält man alsErgebnis die Nullmenge angezeigt, was durchaus als Erinne-rungshilfe zu werten ist!

- Hostsystem ESA (Frascati):Die Datenbank INSPEC liegt in einer einzigen Datei ab 1971vor. Bei der Eingabe von Class Codes muß dern System der je-weilige Gültigkeitsbereich durch Limitierung auf diesen Zeit-raum mitgeteilt werden:

Eingabe: SELECT CC: A822OP/77 -86SELECT CC: A9210 173-76SELECT CC: Al9t0 l7I-72

Wird diese Limitierung vergessen, so erhält man zwar keineleere Menge, aber sehr wahrscheinlich ein falsches Ergebnis,da alle Bedeutungen, die ein Class Code in den verschiedenenZeiträumen haben kann, in der Ergebnismenge vereinigt sind!

- Hostsystem DATA-STAR (Bern):Die Datenbank INSPEC liegt in zwei Teildateien, INSP(l98lff.) und IN80 (1970-1980) vor. Für die Kennzeichnung

der Class Codes wurde eine ähnliche Lösung wie bei DIALOGgewählt. Bemerkenswerterweise werden bei DATA-STAR je-doch die Class Codes ab 1985 durch die Ziffer,,4" markiert, so-daß in INSP derselbe Code zweimal einzugeben ist:

Eingabe: (!A822OP OR 3A8220P).CC.

Aufgrund der zeitlich ungünstigeren Teilung der Datenbank alsbei DIALOG werden für die Recherche in IN80 weiters dreiNotationen benötigt:

Eingabe: (1A8220P ORZA9210 OR 1A1910).CC.

- Hostsystem STN (Karlsruhe/Columbus):Die neueste am Markt befindliche Online-Version vonINSPEC liegt bei STN in einer einzigen Datei ab 1969 vor. Fürdie Ansetzung der Class Codes wurde die gleiche Lösung ge-wählt wie bei DATA-STAR, sodaß in folgender Weise zu ver-fahren ist:

Eingabe: SEARCH (!A8220P OR 3A8220p OR2A9210 OR 1A1910yCC

4. Schlußbemerkungen

Klassifikationssysteme begegnen uns im Kontext des bi-bliographischen Online-Retrieval in vielfältiger und un-terschiedlicher Gestalt, jedenfalls aber relativ häufig(vgl. Abschnitt 1.5). Die im zweiten Kapitel dargestell-ten Beispiele sollten einige der vielen vorteilhaften An-wendungsmöglichkeiten, die für Class Codes zweifellosexistieren, vor Augen führen. Daher sollten auch die imvorigen Abschnitt gezeigten Probleme den Online-Rechercheur nicht abschrecken, Class Codes in seineSuchstrategien einzubauen. Sicherlich erfordert eineRecherche mit Class Codes oft mehr Aufwand an Vor-bereitung und/oder Vorwissen als eine reine Freitextsu-che (vor allem wenn letztere nach dem Prinzip ,,quickand dirty" durchgeftihrt wird). Dieser relative Mehrauf-wand wird sich aber mit großer Wahrscheinlichkeit inbesseren Rechercheergebnissen niederschlagen, diez.B. ärmer an Ballast und damit zufriedenstellender undökonomischer sein können. Einer der großen Vorteilevon Online-Informationssystemen liegt darin, mehrereElemente der sachlichen Erschließung parallel bzw. si-multan nutzen zu können. Der vorliegende Beitrag ver-steht sich - nicht zuletzt - als Aufforderung, dies bei derpraktischen Recherchearbeit auch tatsAchlich zu tun.

Quellen und Anmerkungen:(1) Vgl. z.B.: Mackay, R.: Online-Informationsdienste in der

Stadtbibliothek Duisburg. - ABl-Technik, Jg. 5, 1985, Nr. 2,s.162-165.

(2) So wird z.B. in einer Rezension des kürzlich erschienenen Bu-ches,,Sacherschließung in Bibliotheken und Bibliographien.Bd. I : Klassifikatorische Sacherschließung" (v.K. Weishaupt,Frankfurt/M. 1985) die Behandlung dieses Aspektes aus-drücklich vermißt; vgl.: Gödert, W. - Nachr. Dokum., Jg.37,1986, Nr. I, S. 54-56.

(3) Zu/,etzt: INSPEC Thesaurus 1985. - Old Woking (Surrey/GB): Gresham Press 1985. (ISBN 0-85296-299-l').

(4) Z'llrem.: INSPEC Classification: A classification scherne forphysics, electrotechnology, computers and control. - Hitchin(Hertfonhire/GB): Institution of Electrical Engineers 1985.(rsBN 0-8s29G300-9).

(5) ,,Physics Abstracts" (189ff.), ,,Electrical & Electronics Ab-stracts" (1898ff.), ,,Computer & Control Abstracts"(1966ff.), ,,IT Focus" (1983ff.; IT: Information Techno-logv).

86 Int. Classif. 13 (1986) No. 2 Oberhauser - Classification in Online Systems

(6) Vgl: Engineering Information Inc., An Historical Perspec-tive, 1884-1984. In: Engineering Index Annual, vol. 83.,1984, pt. 1. - New York/NY 1985. S. IX-XX.

(7) Vgl. z.B.: Oberhauser, O.;Nevyjel, A.: Patentinformationenonline: Eine Übersicht über Datenbanken und Suchmöglich-keiten. - Wien: Österr. Forschungszentrum Seibersdorf1985. (: Univ.-Bibl. d. Techn. Univ. Wien; Benützungshil-fen;6).

(8) Bond, D.K.: Development and Implementation of a Hierar-chical Classification System for the ABI/INFORM Database.Paper presented at the 12th Mid-Year Meeting of the Ameri-can Society for Information Science, I-exington (Kentucky/USA), May 22 -2s , 1983. - 10 p. (ED 24s703).

(9) Internationale Patentklassifikation. Hng. : Deutsches Patent-amt.4. Ausg. Bd. 1-9. - Köln: Heymann 1984.

(10) Vgl. : Ashton, P.: Computers take a holiday. - INSPEC Mat-ters, no.35, Dec. 1983.

(11) Vgl.: Ashton, P.: Indexingrules OK! - INSPECMatters, no.40, Dec. 1984.

(12) Vgl.: A Guide to Searching ONTAP ABI/INFORM. -Louisville (Kentucky/USA): Data Courier Inc. 1983. S. 94f.

(13) Concordance to the INSPEC Classification, 1969-1985. -Hitchin (Hertforshire/GB): Institution of Electrical Engi-neers 1985. (ISBN G85296-298-3).

Address:Dr. phil. Otto Oberhauser,Universitätsbibliothek der Technischen Universität WienKarlsplatz 13, A,-10,10 Wien, Österreich.

Publications as an Integral Part of Scientific ResearchThe International Federation of Scientific Editors

Associations - IFSEA - announces its Fifth InternationalConference to be held at Hamburg, June l4-19, 1987. ACall for Papers has been circulated inviting papers on thefollowing topics: (l) Quality of Manuscripts, (2) Feed-back of Publications to Research, (3) New Technologiesand their Implications, (4) Economics and Management.Topics (1) and (4) include "Standards and Norms".

An Executive Committee has been appointed. Theorganizing Committee consists of W.P.Kirchner, U.Schütz-sack, and Hans W.Fock. For further information, pleaseturn to: Dr.W.P.Kirchner, Bundesforschungsanstalt frirFischerei, Information/Dokumpntation, Palmaille 9,D-2000 Hamburg 50.

We should like to point out that the possibility toestablish - already at the first instance of publication -

a document for its later correct subject accessibility, isa worthwhile topic which would demand the attentionof every editor. This conference is a chance for anyaction in this regard.

Just publ i shed:

Franeis Devadason

Computurtzed Deep Structure Indexing System

FID/CR Report No.21. 42 p., DM 12.50

F.Devadason teaches at the Documentation Research and TrainingCentre in Bangalore. This summary of his PhD thesis is a des-cription of the computer generation of Postulate-based PermutedSubject Index (P0PSI) entries, having Lead and Context Headingsfrom names of subjects formulated according to the Deep Struc-ture Indexing System (DSIS).

Earlier Reports from the FID/CR REPORT SERIES - still available:

No. 19:

Reportsdies asmerical

T.C.CRAVEN: Research in Document Classification andIndexi Canada) 1971-1980. P., 11.-

the research concerning

No.20: F.l^I.RIGGS: Ildexing Glossary: a Ne

1s82. a0P.FPresents a new approach for elaborating systematic glossariesbased on the UNESCO-sponsored work INTERC0NCEPT and shows how

this is applicable in the field of indexing terminology.

INDEKS VERLAG, l,loogstr. 36a, D-6000 Frankfurt 50, Tel . : 52 36 90

on historica research and general and theoretical stu-non-numeric and nu-wel I as on

techn i ques.

Int. Classif. 13 (1986) No. 2 Oberhauser - Classification in Online Systems 87