15 responses to “Sacherschließung von Literatur in und mit der Wikipedia – eine Spielidee”

  1. Manuel

    Gefällt mir. Bekommst Du den Datenexport aus der Suchmaschine und das Sortieren mit Maui so hin, dass die Ergebnisse dann in eine zentrale Datenbank eingepflegt werden können?

    Paper:
    * Sprache (ISO 639-1)
    * Titel
    * Autor
    * URL des Volltextes
    * Zeitpunkt der Aufnahme im Index

    Paper zu Artikel:
    * Wikipedia-Artikelname
    * Paper gelistet (ja/nein)
    * pro-Stimmen
    * contra-Stimmen

    So könnte man das nett in einer Extension abbilden… Artikel die innerhalb eines bestimmten Zeitraumes eine bestimmte Menge pro-Stimmen erhalten haben werden dann in den Wikitext übertragen und in der DB entsprechen markiert.

    Ein paar Cent zu Deiner Idee…

  2. CH

    Die Idee ist charmant, ich sehe allerdings mehrere Probleme. Zuerst fällt mir da ein:

    1. Du hast den Wikipedia-Artikel “Marketing” (über 90k Treffer bei BASE). Welche Artikel sollen vorgeschlagen werden?

    2. Jeder Artikel müsste m.E. mehrfach darauf hin bewertet werden, ob er zum Wikipedia-Eintrag passt. Schafft man dies für eine ausreichende Menge von Artikeln, damit sich die Erschließung überhaupt lohnt?

    Ob es die erforderliche kritische Menge an geeigneten Bewertern gibt, die die Zuordnung überhaupt beurteilen können, sei dahingestellt. When you build it, will they come? Hierbei würde ich es auf einen Versuch ankommen lassen. Die schiere Menge der täglich publizierten Literatur ist vermutlich durch diese Art eines Wikipedia-Erschließungs-Spiel nicht zu bewältigen.

  3. Klaus Graf
  4. Jakob

    Tolle Idee, das könnte gut funktionieren! Bevor wir an technische Umsetzungen denken, sollte wir uns eine passende Benutzeroberfläche überlegen. Die Oberfläche trägt mehr zum Erfolg oder Mißerfolg bei als die Details des Vorschlag-Algorithmus. Die Bewertung könnte ähnlich wie bei Stackoverflow aussehen, wo einzelne Beiträge und Kommentare bewertet werden können und so die Reihenfolge festgelegt wird.

  5. Tagging von OpenAccess-Artikeln mit Wikipedia « Jakoblog — Das Weblog von Jakob Voß

    […] mit, da ich intensiv an der Dissertation sitze (siehe meine Literatur). Lamberts Vorschlag Wikipedia zur Sacherschließung von Open Access zu nutzen, möchte ich jedoch nicht unkommentiert […]

  6. Cornelius

    Finde die Idee ebenfalls hervorragend. Ein wenig Gedanken mache ich mir allerdings ähnlich wie CH bezüglich der Auswahl der Literatur. Würde dieser Ansatz funktionieren, wäre das natürlich ein weiteres, sehr gutes Argument für OA…

  7. Magnus Manske

    (das Folgende auf Bitte von Lambert aus meiner mail kopiert)

    * Das überschwemmt bald die Literaturliste, besonders bei generellen Themen
    * Warum die ganzen Publikationen selber laden, Volltext-indizieren und
    auf Artikel mappen?

    Also dacht’ ich mir, vielleicht optional auf Reviews reduzieren (viel
    nützlicher für die meisten Themen, und Größenordnungen weniger).
    Und statt Publikationen in Massen selbst verarbeiten, lieber bei
    Bedarf einfach bei den Journals suchen lassen (vorzugsweise nur Titel
    und Abstract, bei Volltext bekommt man wieder nur allen möglichen
    Mumpitz).

    Demo:
    http://toolserver.org/~magnus/liturgy.php

    Beispiel :
    http://toolserver.org/~magnus/liturgy.php?language=de&article=Malaria&reviews_only=1&doit=Do+it!

    * LITurgy für LITeratur-Spiel – sorry ;-)
    * Wenn nicht en.wikipedia verwendet wird, probiert es den language
    link nach en für Suchbegriffe (auch wenn’s wie im Beispiel der gleiche
    ist…)
    * Sucht im Moment nur PLoS (dafür alle PLoS-Journals gleichzeitig),
    kann aber modular erweitert werden
    * Sucht nur in Titel & Abstract (Volltext kann angeschaltet werden)
    * Hier nur Reviews (findet 7; ohne Review-Filter 606…)
    * Zeigt nur die ersten 100 Treffer (Gnade!)

    Die “Spiel”-Komponente hab ich mir erstmal geschenkt
    (Benutzer-Authentifizierung auf dem Toolserver – AARGH! HELP!!), aber
    die Verwaltung könnte einfach gemacht werden – Datenbanktabelle
    SPRACHE:ARTIKEL:DOI:BENUTZER – fertig ;-)

  8. Jakob

    Danke für den schnellen Prototyp Magnus. In der jetzigen Form ist es aber nicht mehr als ein Hilfsmittel zum Durchsuchen von PLoS – es fehlen gerade die zwei wesentlichen Bestandteile von Lamberts Idee so wie ich sie verstanden habe:

    1. “Spiel” ist keine optionale Komponente sondern Grundidee der Anwendung.

    2. Artikel werden auf Basis der Ähnlichkeit vorgeschlagen – das lässt sich aber nur feststellen, wenn die Volltexte gemeinsam indexiert werden und nicht über eine Suchanfrage bei einem Fremdanbieter wie PLoS.

    Was das Spielen betrifft habe ich auch nochmal in meinem Blog darauf hingewiesen, das erst das Benutzerinterface entwickelt werden sollte und zwar unabhängig von technischen Überlegungen wie Servern, Datenbanken und Seitenbeschreibungssprachen.

    Was das Mapping von Wikipedia-Artikel und Open-Access-Artikel betrifft, so vertraue ich da auf das gute alte Vektorraum-Modell, so wie es beispielsweise in Lucene umgesetzt wird. Damit lassen sich Volltexte nach Ähnlichkeit ranken. Die Anzahl der Treffer ist dabei völlig irrelevant, da es nur auf die Reihenfolge der Treffer ankommt.

  9. Magnus Manske

    Hi Jakob,

    ich habe das “Spiel” nie als optional bezeichnet, ich habe nur noch nichts derartiges implementiert. Ich sehe das Ganze (von der technischen Seite) in drei Teile zerfallen:

    1. Mapping / Suche, wie auch immer implementiert
    2. Abstimm-Verwaltung (Datenbank)
    3. Spiel-Interface

    Ich hatte mich an #1 versucht; Mapping kann durchaus besser sein als Suche, aber Suche ist im Moment fuer mich einfacher :-) Wie gesagt, technisch gesehen spielt es keine Rolle, wie die Zuordnung Artikel Publikation zustande kommt.

    Werde mich vielleicht mal am Interface versuchen (diese Wireframe-Dinger sind mir aber zu kompliziert ;-)

  10. Jakob

    Stimmt, die Anwendung lässt sich so unterteilen, wobei 1. noch am einfachsten zu entkoppeln ist. Ich bin wirklich gespannt, wie gut Empfehlungen sind, wenn sie auf dem direkten Vektorraum-Vergleich der Volltexte basieren – wahrscheinlich funktioniert das nur wenn die Sprache gleich ist. Die Datenbank ergibt sich aus den eigentlichen Spielregeln (vielleicht mal ein Anlass eine schemafreie NoSQL-Datenbank auszuprobieren), da sind sicher mehrere Varianten möglich:

    I) Punkte bei gegebenem Wikipedia-Artikeln
    I.1) für jedes “+” oder “-” um einzelne Fach-Artikel als passend oder unpassend zum Artikel zu bewerten
    I.2) für das erstmalige Bewerten eines einzelnen Fach-Artikels sofern dieser später von der Mehrheit der Mitspieler ebenso bewertet wird
    I.3) für das Eintragen oder Korrigieren neuer Fach-Artikel

    II) Bei gegebenen Fach-Artikeln
    II.1) für jeden angegebene Wikipedia-Artikel
    II.2) für Wikipedia-Artikel, die ebenfalls von anderen angegeben werden
    II.3) für Wikipedia-Artikel, deren Unterthemen nicht dem gleichen Artikel zugeordnet sind (lässt sich über die Kategorien ermitteln), damit die Zuordnung möglichst speziell ist.

    Vielleicht fällt euch noch mehr oder Besseres ein. Wie wäre es mit einem Wettbewerb für die Benutzeroberfläche und Funktionsbeschreibung (nur das Mockup ohne CSS-Schnickschnack)?

  11. Robert

    Der Vorschlag von Klaus Graf mit einem Open-Data-Server wäre wirklich die bessere Lösung. Alleine schon weil bei WP keine x-Links zusätzlich hinzugefügt werden können. Früher gab es bei WP eine 7 Links-Regel (max. Anzahl an Links). Fragt sich nur wer das finanziert? Ob der deutsche Wikimediaverein so etwas machen würde? Vielleicht als Anschub?

  12. Gelesen in Biblioblogs (31. KW) « Lesewolke's Blog

    […] und welchen Nutzen dieses Projekt für Bibliotheken hätte, damit beschäftigt sich der Blog Biblionik.  Die interessante Idee hat Jakoblog aufgegriffen und sich ebenfalls Gedanken dazu […]

  13. Bibliothekartag 2011 – Facebook und Co. « Lesewolke

    […] Wie man am besten Leute für Mitmachprojekte im Netz begeistert, interessierte Lambert Heller. Und sicher nicht nur für das Tagging gilt: es „funktioniert nur egoistisch oder für ein ‘echtes’ Gemeinschaftsprodukt“ (S. 10 der Präsentation). Außer Facebook stellte Lambert Heller spezielle Netzwerke für Wissenschaftler, wie ResearchGate (ähnlich wie Facebook) oder Mendeley vor. Wobei sich letzteres eben sehr gut für persönliche Literaturlisten eignet. Man erfährt, wie oft die Publikationen gelesen wurden oder kann sich sogar alles zu einem bestimmten Thema ansehen (Research papers overview). Da stellt sich die Frage, ob sich Wikipedia nicht auch ausbauen ließe, vor allem weil sich bereits zahlreiche Angaben  Literaturquellen dort befinden (vgl. auch den Blogbeitrag zur Sacherschließung von Literatur in Wikipedia). […]

Kommentar verfassen