• Keine Ergebnisse gefunden

Die automatische Indexierung ist immer noch mit Problemen behaftet, die sie nicht an die intellektuelle Indexierung heranreichen lässt. Die Tests haben gezeigt, das die linguistischen Systeme nicht den Wortschatz eines Thesaurus treffen können, da sie nur Stichworte extrahieren. Wichtig wäre es, den Kontext des Textes zu erfassen, d.h. die Semantik zu erschließen. Die Einbindung von semantischen Netzwerkres-sourcen zeigen eine Lösung in dieser Richtung auf. Problembereiche wie die der Homonymie und der Polysemie würden damit beseitigt werden.

Deutsche kommerzielle Systeme im Einsatz verwenden bisher immer noch aus-schließlich linguistische und statistische Verfahren. Neuere Entwicklungen (Siehe Kapitel 3.2) zeigen Wege auf, wie die Indexierung durch Wissensmanagement ver-ändert bzw. erweitert werden könnte. In TREC hat sich aber gezeigt, das auch Sys-teme erfolgreich sein können, die nur auf der Dokumentenstruktur aufbauen. Auto-matische Klassifikation erzielte bei TREC bisher schon gute Ergebnisse und kann als Ergänzung die Indexierungsergebnisse verbessern.

Ein Indexierungssystem hat auch Auswirkungen auf den Prozess des Retrievals.

Komplexe Indexierungssysteme bedingen ebenfalls komplexe Bedingungen an ein Retrievalsystem. Anforderungen der Nutzer sollten miteinbezogen werden (Vgl.

Nohr, 2001, S. 96).

Glossar

88

:

Anapher:

Wiederholung eines Wortes oder mehrerer Wörter zu Beginn aufeinander folgender Sätze oder Satzteile; [...] z. B. Die Frau [...]. Sie war sehr elegant (Duden, Fremdwör-terbuch, 19976, S. 61).

Antonym:

Gegenwort; [...] Wort, das einem anderen in Bezug auf die Bedeutung entgegenge-setzt ist (Duden, Fremdwörterbuch, 19976, S. 71).

Data Mining:

Data Mining definiert sich als der Prozess, Muster in Daten zu erkennen. Der Pro-zess hat automatisch oder (was häufiger der Fall ist) halbautomatisch stattzufinden.

Dabei müssen sinnvolle Muster erkannt werden, die zu einem Vorteil in der Regel wirtschaftlicher Art führen (Witten/Eibe, 2001, S. 3).

Dependenzgrammatik:

Abhängigkeitsgrammatik; Forschungsrichtung der Linguistik, die die hinter der linea-ren Erscheinungsform der gesprochenen oder geschriebenen Sprache verborgenen strukturellen Beziehungen zwischen den einzelnen Elementen im Satz untersucht oder darstellt, vor allem in Abhängigkeit der Satzglieder vom Verb (Duden, Fremd-wörterbuch, 19976, S. 179).

Deskriptor:

Deskriptor ist eine Benennung, die für sich allein verwendbar, eindeutig zur Inhalts-kennzeichnung geeignet und im betrefffenden Dokumentationssystem zugelassen ist (DIN 31 623, Teil 1, 1996 [1988], S. 181).

Disambiguierung:

Ambiguität bedeutet Mehr-, Doppeldeutigkeit von Wörtern (vgl. Duden, Fremdwör-terbuch, 19976, S. 55). Disambiguierung ist dann die Aufhebung dieser Mehr bzw.

Doppeldeutigkeit mit dem Zweck eine Eindeutigkeit zu erlangen (Vgl. Duden, Fremdwörterbuch, 19976, S. 195).

Dokumentenmanagementsystem:

Abkürzung DMS; Oberbegriff für ein System zur Verwaltung von Dokumenten inner-halb von Organisationseinheiten eines Unternehmens. Ziel ist die vollständige und dauerhafte Konvertierung aller Dokumente in digitalisierte Form, so dass alle Doku-mente unabhängig von ihrer Quelle und ursprünglichen Verarbeitungsform am Com-puter eingesehen und bearbeitet werden können. Für das Unternehmen sollen eine

88 Die Definitionen sind fast ausschließlich wörtlich zitiert, aber nicht extra mit Anführungsstrichen ge-kennzeichnet. Wo bei der angegebenen Quelle (vgl. [...] ) steht, wurde sinngemäß zitiert.

Reduzierung der Archivierungsmenge, eine Beschleunigung der Geschäftsprozesse und eine Erhöhung der Produktivität erreicht werden89

Dokumentationssprache:

Eine Dokumentationssprache ist eine Menge von Ausdrücken, die nach bestimmten Regeln zur Beschreibung von dokumentarischen Bezugseinheiten zum Zweck der gezielten Wiederauffindung (Retrieval) dienen. Dokumentationssprachen sind z.B.

Schlagwortsysteme, Thesauri und Klassifikationen. Sie enthalten Bezeichnungen aus natürlichen und/oder künstlichen Sprachen (DIN 31 623, Teil 1, 1996 [1988], S. 180).

Auch genannt: „Indexsprache“, „Indexierungssprache“, „Retrievalsprache“, „Recher-chensprache“ (Fugmann, 1992, S. 3).

Ellipse:

Im Sinne der Sprachwissenschaft: Auslassungssatz; Satz, in dem Redeteile erspart sind, z.B keine Zeit (= ich habe keine Zeit)! (Duden, Fremdwörterbuch, 19976, S.

220)

Graphem und Graphemik (Graphematik):

Graphem: Kleinstes bedeutungsunterscheidendes grafisches Symbol, das ein oder mehrere Phoneme wiedergibt (Duden, Fremdwörterbuch, 19976, S. 301).

Graphemik (auch Graphematik genannt): Wissenschaft von den Graphemen unter dem Aspekt ihrer Unterscheidungsmerkmale und ihre Stellung im Alphabet (Ebd.).

Holonymie:

„Ganzes-Teil-Beziehung“, z.B. das Gebäude ist ein Holonym von Dach (Vgl. Cars-tensen, 2001, S. 387)

Homonym:

Homonyme sind lexikalische Grundformen, die zwar diesselbe phonologische (Ho-mophone) oder graphemische Form (Homographei) besitzen, deren verschiedene Bedeutungen aber in keinem semantischen Zusammenhang stehen (Carstensen et al., 2001, S. 293).

Homograph:

Wort, das sich in der Aussprache von einem anderen gleich geschriebenen unter-scheidet, z.B. Tenor „Haltung“ neben Tenor „hohe Männerstimme (Duden, Fremd-wörterbuch, 19976, S. 327).

Homophon:

Wort, das mit einem anderen gleich lautet, aber verschieden geschrieben wird (z.B.

Lehre - Leere) (Duden, Fremdwörterbuch, 19976, S. 328).

89 Quelle: http://www.wissen.de

Hyponym:

Das Wort, [...], das in einer untergeordneten Beziehung zu einem anderen Wort, [...]

steht, aber inhaltlich differenzierter, merkmalhaltiger ist, z.B. Tablette zu Medikament (Duden, Fremdwörterbuch, 19976, S. 341).

Hypernym:

Übergeordneter Begriff; Wort, Lexem, das in einer übergeordneten Beziehung zu ei-nem bzw. mehreren anderen Wörtern, Lexemen steht, aber inhaltlich allgemeiner, weniger merkmalhaltig ist (Duden, Fremdwörterbuch, 19976, S. 339).

Indexierung:

Indexierung ist die Gesamtheit der Methoden und Verfahren sowie deren Anwen-dungen, die zur Zuordnung von Deskriptoren oder Notationen zu dokumentarischen Bezugseinheiten führen mit dem Ziel der inhaltlichen Erschließung sowie der geziel-ten Wiederauffindung (DIN 31 623, Teil 1, 1996 [1988], S. 181).

Kookkurrenz:

Das Miteinandervorkommen sprachlicher Einheiten in derselben Umgebung (z.B. im Satz) (Duden, Fremdwörterbuch, 19976, S. 447).

Mehrwortbegriff:

Eine Wortfolge, die eine Begriffseinheit bildet (Vgl. Krause, 1987, S. 49).

Meronymie:

„Teil-Ganzes-Beziehung“, z.B. ist Dach ist ein Meronym zu Gebäude (Vgl. Carsten-sen, 2001, S. 387)

Nicht-Deskriptor:

Nicht-Deskriptor ist eine Bezeichnung, die nicht zur Indexierung zugelassen, aber im Thesaurus aufgeführt und entsprechend gekennzeichnet ist, um dem Benutzer den Zugang zu den Deskriptoren des Thesaurus zu erleichtern (DIN 1463, Teil 1, 1996 [1987], S. 17).

Notation:

Eine Notation ist eine Bezeichnung aus künstlichen bzw. formalen Sprachen, die ei-nen Begriff oder eine Begriffsklasse repräsentiert und zur Inhaltskennzeichnung ver-wendet wird (DIN 31 623, Teil 1, 1996 [1988], S. 181).

Parsen:

(Maschinenlesbare Daten) analysieren, segmentieren und kodieren (Duden, Fremd-wörterbuch, 19976, S. 598).

Pattern Matching:

A Pattern is a set of syntactic features that must occur in a text segment. Those segments satisfying the pattern specifications are said to ‘match’ the pattern (Baeza-Yates/Ribeiro-Neto, 1999, S. 104). Pattern […] ranging from simple words to regular expressions (Baeza-Yates/Ribeiro-Neto, 1999, S. 448).

Phonem:

Bedeutung in der Sprachwissenschaft: Kleinste bedeutungsunterscheidende, aber nicht selbst bedeutungstragende sprachliche Einheit (z.B. b in Bein im Unterschied zu p in Pein) (Duden, Fremdwörterbuch, 19976, S. 621).

Polysemie:

Das Vorhandensein mehrerer Bedeutungen zu einem Wort (z.B. Pferd: 1. Tier. 2.

Turngerät. 3. Schachfigur) (Duden, Fremdwörterbuch, 19976, S. 641).

Postkoordination:

Stellt man [...] eine Begriffskombination durch mehrere Deskriptoren dar, die erst während des Suchvorgangs miteinander kombiniert werden, um einen gesuchten Begriff darzustellen, handelt es sich um „Postkoordination“ (DIN 1463, Teil 1, 1996 [1987], S. 18).

Präkoordination:

Werden Bezeichnungen, die Begriffskombinationen darstellen (z.B. Komposita, Mehrwortbenennungen) in dieser Form als Deskriptoren zugelassen [...], so spricht man von „Präkoordination“ (DIN 1463, Teil 1, 1996 [1987], S. 18).

Relevance Feedback:

Bei Suchanfragen werden nachgewiesene Dokumente mit den Relevanzbestimmun-gen eines Nutzers ausgewertet und die Suchanfrage wird neu formuliert (Vgl. Sal-ton/McGill, 1987, S. 130).

Schlagwort:

Natursprachige, lexikalische Ausdrucksweise, welche einen Begriff prägnant darstel-len soll, unabhängig davon, wie dieser Begriff in einem Text oder in einer Fragestel-lung ausgedrückt worden ist. Auch Terminus in einem Thesaurus. Entstammt diese Ausdrucksweise einem Indexsprachenwortschatz, dann wird hierfür auch die allge-meinere Bezeichnung „Deskriptor“ benutzt (Fugmann, 1992, S. 7).

Taxonomie:

Unter einer Taxonomie versteht man ein hierarchisches Klassifikationsschema, das dazu geeignet ist, eine Wissensdomäne inhaltlich zu strukturieren (Carstensen et al., 2001, S. 440)

Thesaurus:

Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zu-sammenstellung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeich-nungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wieder-auffinden dient (DIN 1463, Teil 1, 1996 [1987], S. 17).

Valenz:

Bedeutung in der Sprachwissenschaft: Fähigkeit eines Wortes, ein anderes seman-tisch-syntaktisch an sich zu binden, bes. Fähigkeit eines Verbs, eine bestimmte Zahl von Ergänzungen zu fordern (Duden, Fremdwörterbuch, 19976, S. 839).

Wissensrepräsentation:

Während sich durch Dokumentationssprachen lediglich (in der Regel unzusammen-hängende) Begriffe darstellen lassen, bietet die Wissensrepräsentation die Möglich-keit, Sachverhalte (Aussagen, Propositionen), also durch Prädikate verknüpfte Beg-riffe zu repräsentieren (z.B.: ist_ein (Löwe, Säugetier) => „Der Löwe ist ein Säuge-tier“. [...] Die Methoden und Werkzeuge dazu werden in der Künstlichen Intelligenz entwickelt (Luckhardt, o.J.).

Literatur:

Adi, T./Ewell, O. K./Adi, P. (2000): “High Selectivity and Accuracy with READware’s Automated System of Knowledge Organization”. Siehe:

<http://trec.nist.gov/pubs/trec8/papers/READWARE.pdf> (02.01.2003)

Anderson, J. D./Pérez-Carballo, J. (2001): “The nature of indexing: how humans and machines analyze messages and texts for retrieval / Part II: Machine indexing, and the allocation of human versus machine effort”. Information Processing & Manage-ment 37, S. 255 - 277

Baeza-Yates, R./Ribeiro-Neto, B. (1999): “Modern Information Retrieval”. Harlow u.a.: Addison-Wesley

Bakel, B. van (1998): “Modern classical document indexing: a linguistic contribution to knowledge-based IR”. Siehe:

<http://www.universal.nl/users/bakel/work.html/sigir98extabs.ps.gz> (06.08.2002) Bakel, B. van/Boon, R. T. (1997): „Principle-Based Structured Concept Generation: a contribution to knowledge-based document indexing”. Siehe:

<http://www.universal.nl/users/bakel/work.html/clin97.ps> (06.08.2002)

Balzert, H. (1998): “Lehrbuch der Software-Technik: Software-Management, Soft-ware-Qualitätssicherung, Unternehmensmodellierung“. Heidelberg, Berlin: Spektrum, Akad. Verl.

Bayraktar,O./Wormer-Hacker, C. (1998): „Qualitätsbewertung von Information-Retrieval-Systemen – Sind Synergieeffekte durch die Koordination verschiedener Bewertungsmethoden möglich?“ In: H. H. Zimmermann/V. Schramm (Hrsg.): Know-ledge Management und Kommunikationssysteme: Workflow Management, Multime-dia, Knowledge Transfer. Proceedings des 6. Internationalen Symposiums für Infor-mationswissenschaft (ISI’ 98), Prag, 3. – 7. November 1998. Konstanz: UVK Univer-sitätsverlag Konstanz. S. 427 - 437

Bear, J. et al. (1998): „Using Information Extraction to Improve Document Retrieval“.

Siehe: <http://trec.nist.gov/pubs/trec6/papers/sri.ps.gz> (02.12.2002)

Biebricher, P./Fuhr, N./Niewelt (1986): „Der AIR-Retrievaltest“. In: G. Lustig (Hrsg.):

Automatische Indexierung zwischen Forschung und Anwendung. Hildesheim u.a.:

Olms. S. 127 – 143

Biebricher, P. et al. (1988): „Entwicklung und Anwendung des automatischen Inde-xierungssystems AIR/PHYS“. Nachrichten für Dokumentation 39, (3), S. 135 - 143 Boughanem, M./Soulé-Dupuy, C. (1996): „Mercure at trec6“. Siehe:

<http://trec.nist.gov/pubs/trec6/t6_proceedings.html/irit.ps.gz> (12.12.2002) Brandes, U./Corman, S. R. (2002): “Visual Unrolling of Network Evolution and the Analysis of Dynamic Discourse”. Information Visualization. Noch nicht erschienen.

Büttel, I. et al. (1980): „Beschreibung des Modells CONDOR“. In. H. G. Fischer (Hrsg.): Information Retrieval und natürliche Sprache: integrierte Verarbeitung von Daten und Texten im Modell CONDOR. München: Saur. S. 9 - 157

Carstensen, K. et al. (Hrsg.) (2001): „Computerlinguistik und Sprachtechnologie“.

Heidelberg, Berlin: Spektrum, Akad. Verl.

Chomsky, N. (1981): „Lextures on government and binding”. Dordrecht: Foris Publi-cations.

Chung, Y./Pottenger, W. M./Schatz, B. R. (1998): „Automatic Subject Indexing using an associative Neural Network“. Siehe

<http://www.canis.uiuc.edu/archive/papers/canis-dl.pdf> (15.12.2002)

Cooper, W. S./Maron, M. E. (1978): „Foundation of probabilistic and utility-theoretic indexing“. Journal of the ACM, S. 67 – 80

DeJong, G. (1979): “Prediction and Substantiation: A New Approach to Natural Lan-guage Processing”. In: Cognitive Science Vol.3. S. 251 – 273

Dennis, S. F. (1967): „The Design und Testing of a Fully Automatic Indexing-Searching System for Documents Consisting of Expository Text”. In: G. Schector (Hrsg.): Information Retrieval: A Critical Review. Washington, D.C.: Thompson Book Co. S. 67 – 94

Dillon, M./Gray, A. S. (1983): “FASIT: A Fully Automatic Syntactically Based Indexing System”. Journal of the American Society for Information Science 34, No. 2, S. 99 - 108

DIN 1463: Teil 1 (1996 [1987]) - Erstellung und Weiterentwicklung von Thesauri: ein-sprachige Thesauri. In: Publikation und Dokumentation: Normen. Hrsg.: DIN, Deut-sches Institut für Normung e.V., Berlin: Beuth / Band 2. Erschließung von Dokumen-ten, DV-Anwendungen in Information und Dokumentation, Reprographie, Photogra-phie, Mikrofilmtechnik, Bibliotheks- und Verlagsstatistik, S. 16 – 27

DIN 31 623: Teil 1 – 3 (1996 [1988]) - Indexierung zur inhaltlichen Erschließung von Dokumenten. In: Publikation und Dokumentation: Normen. Hrsg.: DIN, Deutsches Institut für Normung e.V., Berlin: Beuth / Band 2. Erschließung von Dokumenten, DV-Anwendungen in Information und Dokumentation, Reprographie, Photographie, Mik-rofilmtechnik, Bibliotheks- und Verlagsstatistik, S. 180 - 205

DIN e.V. (Hrsg.) (1995): „DIN 55 350: Teil 11 – Begriffe zu Qualitätsmanagement und Statistik: Grundbegriffe des Qualitätsmanagements“. Berlin: Beuth

DIN e.V. (Hrsg.) (1991): „DIN ISO 9126: Informationstechnik – Beurteilen von Soft-wareprodukten, Qualitätsmerkmale und Leitfäden zu deren Verwendung“. Berlin:

Beuth

Duden, Fremdwörterbuch (19976). 6., auf der Grundlage der amtlichen Neuregelung der deutschen Rechtschreibung überarb. und erw. Auflage. Mannheim u.a.: Duden-verl.

Earley, J. (1970): „An efficient context-free parsing algorithm“. Communications of the ACM 13 (2), S. 94 –102

Ehrmann, D. (2002): „BINDEX: Final Project Report“. Siehe: <http://www.iai.uni-sb.de/~bindex/FR.pdf> (15.12.2002)

Faulstich, L. C. et al. (2002): „Concept Extractor – ein flexibler und domänenspezifi-scher Web Service zur Beschlagwortung von Texten“. In: R. Hammwöhner, C. Wolff, C. Wormser-Hacker (Hg.): Information und Mobilität – Optimierung und Vermeidung von Mobilität durch Information. Proceeding des 8. Internationalen Symposiums für Informationswissenschaft. Konstanz: UVK Verlagsgesellschaft mbH. S. 165 - 180 Fellbaum, C. (1998): „WORDNET, an Electronical Lexical Database“. Cambridge (MA): The MIT Press

Finkler, W./Neumann, G. (1988): „MORPHIX: Ein hochportabler Lemmatisierungs-modul für das Deutsche“. SFB 314, KI-Labor, Universität des Saarlandes.

[Folgeantrag, 2002] Gemeinsames Portal für Bibliotheken, Archive und Museen – Ein Online Informationssystem: Folgeantrag zum Projektantrag des Bibliotheksservice-Zentrums Baden-Württemberg, der Landesarchivdirektion Baden-Württemberg und der staatlichen Museen in Baden-Württemberg (2002).

Fugmann, R. (1992): „Theoretische Grundlagen der Indexierungspraxis“. Frank-furt/Main: Indeks-Verl., 1992

Fuhr, N. (1996): „Information Retrieval: Skriptum zur Vorlesung“. Universität Dort-mund. Siehe:

<http://www.is.informatik.uni-duisburg.de/teaching/dortmund/lectures/ir_ss02/irskall.ps.gz> (20.07.2002)

Garvin, D. A. (1988): “Managing Quality: the strategic and competitive edge”. New York: The Free Press

Goeser, S. (1997): „Inhaltsbasiertes Information Retrieval: Die TextMining-Technologie“. LDV-Forum 1. Siehe:

<http://www.iud.fh-darmstadt.de/iud/wwwmeth/publ/paper/ldvf97/goeser1.htm> (02.08.2002)

Goller, C. et al. (2000): „Automatic Document Classification: a thorough Evaluation of various Methods”. In: G. Knorz, R. Kuhlen (Hg.): Informationskompetenz – Basis-kompetenz in der Informationsgesellschaft. Proceedings des 7. Internationalen Sym-posiums für Informationswissenschaft. Konstanz: UVK Universitätsverlag Konstanz.

S. 145 - 162

Grey, F. C./Oard, D. W. (2002): “The TREC-2001 Cross-Language Information Re-trieval Track: Searching Arabic using English, French or Arabic Queries”. Siehe:

<http://metadata.sims.berkeley.edu/papers/trec2001-clirtrack-overview.pdf>

(04.01.2003)

Grummann, M. (2000): „Sind Verfahren zur maschinellen Indexierung für Literaturbe-stände Öffentlicher Bibliotheken geeignet?: Retrievaltests von indexierten ekz-Daten

mit der Software IDX“. Bibliothek 24, Nr. 3, S. 297 - 318. Im Internet unter:

<www.bibliothek-saur.de/2000_3/297-318.pdf> (09.10.2002)

Grupp, B. (1999): „Das DV-Pflichtenheft zur optimalen Softwarebeschaffung“. Bonn:

MITP-Verl.

Gutwin, C. et al. (1998): „Improving browsing in digital libraries with keyphrase in-dexes”. Siehe: http.//www.cs/uasak/gutwin/1998/keyphind-techreport/html/keyphind-9.html (15.12.2002)

Haapalainen, M./Majorin, A. (1995): “GERTWOL und Morphologische Disambiguie-rung für das Deutsche“. In: Proc. of the 10th Nordic Conference on Computional Lin-guistics; May 30-31 1995, Helsinki (NODALIDA-95).

Hacker, R. (19926): „Bibliothekarisches Grundwissen“. 6., völlig neu bearbeitete Auf-lage. München u.a.: Saur

Hacker, R. (20007): „Bibliothekarisches Grundwissen“. 7., neubearbeitete Auflage.

München: Saur

Haller, C./Schroeder, U. (2002): „Topic Maps zur Realisierung von Ontologien im Kontext der Vision des Semantic Web“. Dortmund: „Web Information Retrieval Work-shop“ auf der GI-Jahrestagung 2002

Hahn, U./Romacker, M. (2001): „The SynDiKATe Text Knowledge Base Generator“.

Siehe: <http://hlt2001.org/hlt2001-67.pdf> (29.08.2002)

Hahn, U./Schnattinger, K./Markó, K. G. (2002): „Wissensbasiertes Text-Mining mit SynDiKATe“. Künstliche Intelligenz, Heft 02, S. 5 – 11

Hahn, U./Sonnenberger, G. (1991): „Einführung in die Informationslinguistik“. Vorle-sungsskript der Universität Konstanz im Fachbereich Informationswissenschaft Harabagiu, Sanda et al. (2001): „FALCON: Boosting Knowlegde for Answer En-gines”. Siehe: http://trec.nist.gov/pubs/trec9/papers/smu.ps (28.12.2002)

Harabagiu, Sanda et al. (2002): „Answering complex, list and context questions with LCC’s Question-Answering Server“. Siehe:

<http://trec.nist.gov/pubs/trec10/papers/lcc-trec10.ps> (28.12.2002)

Harman, Donna (1993): „Overview of the first Text Retrieval Conference (TREC 1)”

Siehe: <http://trec.nist.gov/pubs/trec1/t1_proceedings.html/01.txt> (28.12.2002) Harter, S. P. (1975): „A probabilistic approach to automatic keyword indexing”. Jour-nal of the ASIS. S. 197 – 206 und S. 280 - 289

Hauer, M. (2000): „Automatische Indexierung“. In: R. Schmidt (Hrsg.): Wissen in Ak-tion: Wege des Knowledge Managements; 22. Online Tagung der DGI, Frankfurt, 2.

bis 4. Mai 2000. Frankfurt a.M.: DGD. S. 203 – 212

Hawking, D. (2001): „Overview of the TREC-9 Web Track“. Siehe:

<http://trec.nist.gov/pubs/trec9/papers/web9.pdf> (04.01.2003)

Hawking, D./Craswell, N. (2002): “Overview of the TREC-2001 Web Track”. Siehe:

<http://trec.nist.gov/pubs/trec10/papers/web_overview.ps> (04.01.2003)

Hengartner, Urs (1996): „Entwurf eines integrierten Informations-, Verwaltungs- und Retrieval Systems für textuelle Daten“. Bern u.a.: Lang u.a.

Hess, Michael (1992): „An Incrementally Extensible Document Retrieval System based on Linguistic and Logical Principles“. Siehe:

<http://www.ifi.unizh.ch/CL/hess/sigir92.ps.gz>

Huang, K./Lee, Y. W./Wang, R. Y. (1999): „Quality Information and Knowledge“.

New Jersey: Prentice Hall PTR

Huang, X./Robertson, S. E. (1998): “Okapi Chinese text retrieval experiments at TREC-6”. Siehe: http://trec.nist.gov/pubs/trec6/papers/city_proc_chinese.ps.gz (16.09.2002)

Hüther, Hubert (1998): “Selix im DFG-Projekt Kascade”. In: H. H. Zimmermann/V.

Schramm (Hrsg.): Knowledge Management und Kommunikationssysteme: Workflow Management, Multimedia, Knowledge Transfer. Proceedings des 6. Internationalen Symposiums für Informationswissenschaft (ISI’ 98), Prag, 3. – 7. November 1998.

Konstanz: UVK Universitätsverlag Konstanz. S. 397 - 403

Jones, S. et al. (1977): „Peeling the onion: Okapi system architecture and software design principles“. Journal of Documentation 53, (1), S. 58 – 68

Kaiser, A. (1993): „Computer-unterstütztes Indexieren in Intelligenten Information Retrieval Systemen: Ein Relevanz-Feedback orientierter Ansatz zur Informationser-schließung in unformatierten Datenbanken“. Wien: Universität Wien, 1993. Im Inter-net unter: <http://wwwai.wu-wien.ac.at/Publikationen/Kaiser/diss.html> (08.08.2002) Karagiannis, D./Telesko, R. (2001): „Wissensmanagement: Konzepte der künstlichen Intelligenz und des Softcomputing“. München u.a.: Oldenbourg, 2001

Keen, E. M. (1977): „On the Generation and Searching of Entries in Printed Subject Indexes“. Journal of Documentation 33, (1), S. 15 – 45

Knorz, G. (1983): „Automatisches Indexieren als Erkennen abstrakter Objekte“. Tü-bingen: Niemeyer

Knorz, G. (1994): „Automatische Indexierung“ In: R.-D. Henning (Hrsg.): Wissensrep-räsentation und Information Retrieval. Potsdam: Universität. S. 138 – 196. Im Internet unter:

<http://www.iud.fh-darmstadt.de/iud/wwwmeth/publ/skript/autind94/paper1.htm> (02.08.2002)

Knorz, G. (19974): „Indexieren, Klassieren, Extrahieren“ In: M. Buder, W. Rehfeld und T. Seeger (Hrsg.): Grundlagen der praktischen Information und Dokumentation. 4.

Auflage. München u.a.: Saur, S. 120 – 140. Im Internet unter: darmstadt.de/iud/wwwmeth/publ/skript/index96/paper1.htm> und <http://www.iud.fh-darmstadt.de/iud/wwwmeth/publ/skript/index96/quali2.htm> (06.08.2002)

Knorz, G. (2000): „Automatische Indexierung – Text Mining; Von der Forschungs-spielwiese zum Werkzeug für das Wissensmanagement“. Siehe: <http://www.k-n-o-r-z.de/Publ/paper/boehr00/paper1.htm (07.08.2002)

Königer, P./Reithmayer, W. (1998): „Management unstrukturierter Informationen: wie Unternehmen die Informationsflut beherrschen können“. Frankfurt/Main u.a.: Campus Verlag

Krause, J. (Hg.) (1987): „Inhaltserschließung von Massendaten: Zur Wirksamkeit in-formationslinguistischer Verfahren am Beispiel des Deutschen Patentinformations-systems“. Hildesheim u.a.: Olms

Krause, J./Mutschke, P. (1999): „Indexierung und Fulcrum-Evaluierung“. IZ-Arbeitsbericht Nr. 17. Siehe:

<http://www.gesis.org/Publikationen/Berichte/IZ_Arbeitsberichte/pdf/ab17.pdf>

(10.08.2002)

Krause, J./Womser-Hacker, C. (1990): „PADOK-II: Retrievaltest zur Bewertung von Volltextindexierungsvarianten für das Deutsche Patentinformationssystem“. nfd 41, S. 13 - 19

Kuhlen, R. (1974): „Morphologische Relationen durch Reduktionsalgorithmen“. Nach-richten für Dokumentation 25 (4), S. 168 - 172

Kuhlen, R. (1977): „Experimentelle Morphologie in der Informationswissenschaft“.

München: Verlag Dokumentation

Kuhlen, R. (1984): „A Knowledge-Based Text Analysis System for the Graphically Supported Production of Cascaded Text Condensation“. Bericht TOPIC-9/1984.

Konstanz: Universität, Fachgruppe Politik-/Verwaltungswissenschaft, Informations-wissenschaft

Kuhlen, R. (1995): „Informationsmarkt: Chancen und Risiken der Kommerzialisierung von Wissen“. Konstanz: UVK, Univ.-Verl.

Kuhlen, R. (1998): „Organisationsformen und Mehrwertleistungen elektronischer Märkte“. In: G. Heyer/C. Wolf (Hrsg.): Linguistik und neue Medien. Wiesbaden: DUV, Dt. Univ.-Verl.

Kwok, K. L./Grunfeld, L. (1994): „TREC2 Document Retrieval Experiments using PIRCS“. Siehe: <http://trec.nist.gov/pubs/trec2/t2_proceedings.html/22.txt>

(12.12.2002)

Ladewig, C./Henkes, M. (2001): „Verfahren zur automatischen inhaltlichen Erschlie-ßung von elektronischen Texten – ASPECTIX“. nfd 52, (3). Im Internet unter:

<http://www.dgi-info.de> (10.08.2002)

Ladewig, C. (1998): „Information Retrieval ohne Linguistik? – Erwiederung“ nfd 49, (8), S. 476 – 478

Lahtinen, T. (2000): „Automatic indexing: an approach using an index term corpus and combining linguistic and statistical methods“. Helsinki: Universität. Im Internet unter: <http://ethesis.helsinki.fi/julkaisut/hum/yleis/vk/lahtinen/automati.pdf>

(02.08.2002)

Lepsky, K. (o. J.): „Methoden und Verfahren des Information Retrievals“. Siehe:

<http://www.fbi-fh-koeln.de/fachbereich/personen/Lepsky/Material-Lepsky/IR-Methoden.pdf> (28.07.2002)

Lepsky, K. (1996): „Automatisierung in der Sacherschließung: Maschinelles Indexie-rung von Titeldaten“ In: S. Wefers (Hrsg.): Die HerausfordeIndexie-rung der Bibliotheken durch elektronische Medien und neue Organisatonsformen; 85. Deutscher Bibliothe-kartag in Göttingen 1995. Zeitschrift für Bibliothekswesen und Bibliographie, Sonder-heft 63, S. 221 - 233

Lepsky, K. (1997): „Inhaltserschließung von bibliothekarischen Massendaten“. In: S.

Wefers (Hrsg.): Ressourcen nutzen für neue Aufgaben; 86. Deutscher Bibliothekar-tag in Erlangen 1996. Zeitschrift für Bibliothekswesen und Bibliographie, Sonderheft 66, S. 296 – 306.

Lepsky, K. (1999): „Automatische Indexierung zur Erschließung deutschsprachiger Dokumente“. Nfd 50, (6), S. 325 - 330

Lepsky, K. ([2002?]): “Automatische Indexierung”. Siehe: <http://www.fbi.fh-koeln.de/fachbereich/personen/Lepsky/le_lehre.htm> (28.07.2002)

Lepsky, K./Siepmann, J./Zimmernann, A. (1996): „Automatische Indexierung für On-line-Kataloge: Ergebnisse eines Retrievaltests“. Zeitschrift für Bibliothekswesen und Bibliographie 43, S. 47 - 56

Lepsky, K./Zimmermann, H. H. (1998): „Katalogerweiterung durch Scanning und Au-tomatische Dokumentenerschließung : Das DFG-Projekt KASCADE“. Abi-Technik 18, (Nr. 1), S. 56 - 60

Lepsky, K./Zimmermann, H. H. (2000): „Katalogerweiterung durch Scanning und au-tomatische Dokumentenerschließung: Ergebnisse des DFG-Projektes KASCADE.

Stand: 18.05.2000“. Zeitschrift für Bibliothekswesen und Bibliographie 47, (4), S. 305 - 316

Liddy, E. D./Myaeng, S. H. (1993): “DR-LINK's Linguistic-Conceptual Approach to Document Detection”. In: D. K. Harman (Ed. ): The First Text REtrieval Conference (TREC-1). NIST Special Publication 500-207. Gaithersburg MD: National Institute of Standards and Technology. S. 113 - 129.

Lohmann, Hartmut (2000): „KASCADE: Dokumentanreicherung und automatische Inhaltserschließung: Projektbericht und Ergebnisse des Retrievaltests“. Düsseldorf:

Universitäts- und Landesbibliothek

Lovins, J. B. (1968): "Development of a stemming algorithm," Mechanical Translation and Computational Linguistics 11, S. 22 - 31.

Luckhardt, H.-D. (1996): „Automatische und intellektuelle Indexierung“. Siehe:

<http://www.phil.uni-sb.de/fr/infowiss/papers/iwscript/exkurs.ind.html> (15.08.2002)

<http://www.phil.uni-sb.de/fr/infowiss/papers/iwscript/exkurs.ind.html> (15.08.2002)