In dem zurückliegenden Beitrag Sacherschließung von Literatur in und mit der Wikipedia — eine Spielidee hatte ich die Grundidee und die Potentiale einer kollaborativen Sacherschließung der Wikipedia-Community mittels der Wikipedia als Quasi-Thesaurus zur Diskussion gestellt. Dieser Beitrag ist eine Fortsetzung. Zum besseren Verständnis empfiehlt es sich daher, zunächst einen Blick in den alten Beitrag zu werfen.
Wie wird ein Aufsatz in und mit der Wikipedia erschlossen?
Um in diesem neuen Blogbeitrag zur Diskussion zu stellen, wie so etwas aussehen könnte, habe ich mit einigen Mock-ups die Erschließung eines realen Aufsatzes in und mit der Wikipedia dargestellt.
Mein Ausgangspunkt ist die frei zugängliche Preprint-Version des Zeitschriftenaufsatzes Credit Rating Prediction Using Ant Colony Optimization von David Martens et al. In BASE (Bielefeld Academic Search Engine) findet man die Metadaten, die zu diesem Preprint gehören, hübsch zusammengestellt. Datensätze wie dieser müßten, z.B. aus BASE, im ersten Schritt als Datensätze in die Wikipedia übernommen werden. Für Wikipedia-Benutzer sähe so ein importierter Datensatz vielleicht aus wie in Abb. 1.
Woher kommen die vorgeschlagenen “Inhaltlichen Zuordnungen”?
Durch Indexierung mit Maui Indexer oder einem ähnlichen Tool sind im Abschnitt „WP:Inhaltliche Zuordnung“ automatisch Links zu Wikipedia-Artikeln hinzugefügt worden, die thematisch zu diesem Aufsatz passen könnten.
Die Links in dem Beispiel sind übrigens erfunden, aber das Ergebnis könnte so ähnlich aussehen. Im Aufsatztitel ist z.B. von „Ant Colony Optimization“ die Rede. Die englischsprachige Wikipedia enthält einen gleichnamigen Eintrag zu dieser Methode. Statt „Ant Colony Optimization“ könnte in der deutschsprachigen Wikipedia automatisch „Ameisenalgorithmus“ angezeigt werden, da dieser Wikipedia-Eintrag mit „Ant Colony Optimization“ verlinkt ist.
Die automatisch hinzugefügten Links landen zunächst im Feld „unbestätigte“. Erfahrungsgemäß werden bei der automatischen Indexierung häufig offensichtlich falsche Vorschläge gemacht. Diese können von jedem registrierten Benutzer durch Klick auf „entfernen“ beseitigt werden. Automatische Zuordnungen, die von Benutzern bestätigt worden sind, sollten sich hingegen nicht so einfach entfernen lassen, intellektuell vorgenommene Zuordnungen natürlich auch nicht.
Wie kommt es zu “bestätigten Zuordnungen”?
Wenn man in Abb. 1 auf den Vorschlag „Insolvenzprognoseverfahren“ klickt, hätte man den Wikipedia-Eintrag zu diesem Thema vor sich. Unten auf dieser Seite, unter „Literatur“, werden automatisch die zuletzt indexierten Literaturvorschläge aufgezählt. Der Beispiel-Aufsatz würde dort etwa so erscheinen wie in Abb. 2.
Jeder Wikipedia-Leser, der den Artikel überfliegt, stolpert im Literatur-Abschnitt über den vorgeschlagenen Aufsatz, neben der Aufforderung, diese Zuordnung zu bestätigen. Bei der Gestaltung dieser Aufforderung können Prinzipien, die sich in der Sacherschließung traditionell bewährt haben, ansatzweise berücksichtigt werden:
- Grundlage der richtigen Erschließung ist die Betrachtung des zu erschließenden Objekts. Deshalb ist es hier wichtig, den Link zum Volltext besonders hervorzuheben.
- Das verwendete Schlagwort sollte so genau wie möglich passen. Den Begriff „genau“ kann man in diesem Zusammenhang ruhig mehr als ein mal verwenden…
- Mehrere Schlagworte können hilfreich sein — womit wir bei Abb. 3 sind, die darstellt, wie es nach dem Bestätigungs-Klick weitergeht.
Die Bestätigung wird mit dem Hinweis quittiert, daß der automatisch ermittelte Literaturvorschlag erst nach Bestätigung durch zwei registrierte Wikipedia-Autoren in die Literaturliste aufgenommen wird. (Vgl. Abb. 3. Wann welcher automatische Vorschlag von welchem Benutzer bestätigt wurde, sollte dauerhaft nachvollziehbar bleiben, wie andeutungsweise in Abb. 1 zu sehen.)
Danach wird dem Benutzer angeboten, mit dem Zuordnen fortzufahren. Zwei Anknüpfungspunkte liegen dabei nahe:
- Dem Benutzer werden weitere Wikipedia-Einträge („Ameisenalgorithmus“, „Basel II“…) angezeigt, die automatisch zu dem Aufsatz ermittelt worden sind. Hier findet gewissermaßen ein Perspektivenwechsel statt: Eben noch beschäftigte sich der Benutzer mit dem Thema des Wikipedia-Eintrags und ist dann auf vorgeschlagene Literatur dazu gestoßen. Nun schlüpft er in die Rolle des Bibliothekars/Dokumentars, der dieses eine Literaturstück vor sich hat und überlegt, zu welchen anderen Themen es passt…
- Dem Benutzer wird darüber hinaus angeboten, sich alle weiteren Literaturvorschläge anzeigen zu lassen, die zu Wikipedia-Einträgen in den Wikipedia-Kategorien „Bonitätsprüfung“ und „Unternehmensbewertung“ gemacht worden sind. Gewissermaßen wieder ein Rollenwechsel — diesmal zum Fachreferenten, an dem alles vorbeiströmt, was (vielleicht) zu seinem gegebenen Themengebiet paßt. Diese Sicht kann z.B. für Wikipedia-Benutzer reizvoll sein, die sich dauerhaft für einen bestimmten Themenbereich interessieren. Für den Benutzer sehen die Vorschläge so ähnlich aus wie in Abb. 1, vielleicht ergänzt um den Kategorienbaum der Wikipedia, in dem er browsen kann.
Exkurs zum Schlagwort “Insolvenzprognoseverfahren” im gezeigten Beispiel
Ich habe einigermaßen willkürlich ein Beispiel aus einem Literaturbereich gewählt, mit dem ich in meiner beruflichen Tätigkeit als Fachreferent für Wirtschaftswissenschaften zu tun habe. Über solche Prognoseverfahren ist seit den Neunziger Jahren eine Menge geschrieben worden. Die Schlagworte auf der Seite des wirtschaftswissenschaftlichen Preprint-Netzwerks RePEc zu dem Aufsatz sind ziemlich gut – aber sie verlinken nur auf andere Aufsätze zu dem jeweiligen Schlagwort innerhalb von RePEc. (Zumindest beim „Ameisenalgorithmus“ ist das schade, denn diese Methode wenden natürlich nicht nur Wirtschaftswissenschaftler an.) Aber warum ist dieser Aufsatz bisher nirgends mit dem Schlagwort „Insolvenzprognoseverfahren“ als Synonym zu „Bankruptcy prediction“ auffindbar gemacht worden? Werfen wir zunächst einen Blick in die Schlagwortnormdatei (SWD), den Universalthesaurus der Deutschen Nationalbibliothek. Hier gibt es nur das Schlagwort „Insolvenz“ mit den Unterbegriffen „Drohende Zahlungsunfähigkeit“ und „Insolvenzverhütung“. Aber neben der SWD existieren auch fachliche Thesauri, in diesem Fall ist der Standard-Thesaurus Wirtschaft (STW) einschlägig. Er kennt nur das Schlagwort “Zahlungsunfähigkeit”, u.a. mit dem Synonym “Insolvenz” sowie den Unterbegriffen “Bankinsolvenz”, “Privatinsolvenz” sowie “Staatsbankrott”. Nun zur Wikipedia. Hier gibt es zahlreiche Einträge, die das Thema Insolvenz detailliert aufschlüsseln, u.a. neben dem „Insolvenzprognoseverfahren“ das „Informelle Insolvenzprognoseverfahren“, „Optionspreismodelle als Insolvenzprognoseverfahren“, „Deterministische Simulationsmodelle als Insolvenzprognoseverfahren“ sowie „Anleihespreadbasierte Ansätze als Insolvenzprognoseverfahren“. Daneben gibt es die Einträge „Schätzgütemaße für kardinale Insolvenzprognosen“, „Schätzgütemaße für kategoriale Insolvenzprognosen“ und „Schätzgütemaße für ordinale Insolvenzprognosen“. Wie gesagt, mein Beispiel ist zufällig gewählt. Ich behaupte aber, daß es zumindest für die Wirtschaftswissenschaften typisch ist. Es wirft ein verheerendes Licht auf den Stand der Entwicklung und Anwendung nicht-kollaborativ gepflegter Thesauri. Es ist durchaus vorstellbar, daß wir uns in einigen Jahren um SWD, STW etc. und die mit ihnen erschlossene Literatur als ein zu rettendes kulturelles Erbe werden kümmern müssen.Ausblick: Wie kann man selbständige Literatur in und mit der Wikipedia erschließen?
Auch die Sacherschließung selbständiger Literatur — also von Büchern, bei denen es sich nicht um Aufsatzsammlungen o.ä. handelt — in und mit der Wikipedia wäre einen Versuch wert. Zumal angesichts der maroden Alternativen, siehe den obigen Exkurs.
Anders als bei Online-Aufsätzen ist der Volltext von Büchern leider selten einen Mausklick weit entfernt. Mir fallen zwei Szenarien zur Sacherschließung von Büchern in und mit der Wikipedia ein:
- Viele Bücher werden im Bibliothekskatalog mittlerweile mit Verlags- oder Klappentexten, Rezensionen, Scans von Inhaltsverzeichnissen oder eingeschränkten kostenlosen Vorschauen angereichert. Denkbar wäre es, nur Bücher in die automatischen Vorschlagslisten aufzunehmen, die bereits mit solchen Materialien angereichert worden sind. Ich behaupte, daß sich viele Bücher allein schon anhand des Inhaltsverzeichnisses exakt und umfassend verschlagworten lassen.
- In Kooperation mit einer Bibliothek bekommen Bücher beim Ausleihvorgang ein formschönes Papier-Lesezeichen. Darauf wird an den Benutzer appelliert, das jeweilige Buch in der Wikipedia-Bibliographie aufzurufen und zu prüfen, ob alles stimmt.
Ein Demonstrator für Dublin Core 2011?
Vom 21.-23. September 2011 findet die DC-2011 in Den Haag statt, die diesjährige Konferenz der Dublin Core Metadata Initiative, einer etablierten weltweiten Metadaten-Organisation. Kürzlich wurde die Deadline für Einreichungen auf den 30. April verlängert. Wer will dabei helfen, bis September einen kleinen Demonstrator zur Sacherschließung in und mit der Wikipedia zu bauen? Wenn sich das als machbar herausstellt, wäre bis zum 30. April ein englischsprachiges Abstract bei der DC-2011 einzureichen.
Abschließend bedanke ich mich herzlich bei Kai Eckert, der mit einigen beiläufigen Bemerkungen bei einem Flurgespräch während des BibCamp 4 über Metadaten mit transparenter Herkunft und Geschichte sowie über die DC-2011 indirekt zu diesem Blogartikel beigetragen hat.
Tags:Bibliographie, mock ups, preprint version, SWD, Wikipedia




[...] und die Leser bewerten zu lassen, ob sie wirklich geeignet sind. Ein aktueller Beitrag in Biblionik verfolgt diese Strategie weiter und wird [...]
[...] TUBfind zu ermöglichen. Auch können ja vielleicht Ideen wie die von Lambert Heller zur Erschliessung von Literatur via Wikipedia die sachliche Erschliessung ins Semantic Web [...]