Crowdsourcing – Vielfältige Erfahrungen

Mitmachen bei der Indizierung von Personendaten im Landesarchiv Baden-Württemberg

Das Landesarchiv Baden-Württemberg (LABW) besitzt eine längere Erfahrung mit „Mitmachprojekten“. Um 2005 begannen die Vorbereitungen für ein erstes Transkriptionsprojekt und beim jüngsten Projekt können ausgewählte historische Karten und Luftbilder georeferenziert werden. Hier stellen wir zwei Projekte vor, bei denen listenartige Textquellen transkribiert und in einen datenbankgestützten Index eingegeben werden. Dieser kann dann unter anderem nach Personennamen durchsucht werden.

Die Projekte

Im Projekt „Wer waren die Toten der beiden Weltkriege?“ wurden verschiedene Angaben aus sog. Kriegsgräberlisten transkribiert. Diese Listen umfassen sämtliche militärischen und zivilen Opfer der beiden Weltkriege, deren Gräber sich in Baden Württemberg befinden und vom Staat gepflegt werden. Bei der „Indizierung der badischen Standesbücher“ werden die Tauf-, Ehe- und Sterberegister aus dem 19. Jahrhundert von Süd- und Nordbadischen Gemeinden erfasst. Beide Quellengattungen werden rege benutzt, weshalb die Indexierung nach Personennamen einen grossen Gewinn für Familienforschende darstellt. Eine verbesserte Erschliessung war denn auch das Hauptziel der beiden Mitmachprojekte. Zudem erhoffte sich das LABW einen Werbeeffekt für seine Bestände. Und schliesslich wollte man Erfahrungen mit dieser Art von Aufgabe für eine Crowd aus Genealogen sammeln.

Bei beiden Mitmachprojekten ging das LABW eine Kooperation mit externen Partnern ein, die bereits Erfahrung mit Crowdsourcing hatten und die nötige Erfassungssoftware und Plattform für die Projekte zur Verfügung stellten. Das LABW finanziert nur seinen Personalaufwand für die Planung und Vorbereitung der Projekte sowie für die Integration der Daten in sein Online-Findmittelsystem. Dieser grosse Vorteil der Kooperationen war ausschlaggebend für beide Projekte, eine eigene technische Infrastruktur hätte das LABW zuerst entwickeln müssen. Als Nachteil ist natürlich hinzunehmen, dass das Projekt über die Website des Partners läuft und das LABW kaum direkten Kontakt zur Crowd hat. Zudem können die Präsentation der Aufgabe, die Tutorials und Tools nur bedingt dem Bestand des LABW angepasst werden. Die Zusammenarbeit mit einem Partner ist deshalb gut zu prüfen – dies ist die Erkenntnis aus den bisherigen Erfahrungen des LABW. Denn die Erfahrungen in den beiden Projekten sind recht unterschiedlich, was auch an deren unterschiedlichen Ausgangslage liegt.

Erfolg hängt von vielem ab

Die Kriegsgräberlisten stellen einen kleinen Bestand dar, der zu Projektbeginn bereits erschlossen und digitalisiert über den Online-Katalog des LABW in Internet zugänglich war. Er umfasst 13000 Digitalisate, auf denen rund 136000 Tote aufgeführt sind. Die Informationen zu den einzelnen Personen sind in Maschinenschrift in Tabellen eingetragen. Zum Mitmachen waren somit keine besonderen Kenntnisse nötig. Als Partner konnte der Verein für Computergenealogie Compgen gewonnen werden. Seine Mitglieder tragen genealogische Informationen aus ganz Deutschland in Datenbanken zusammen. Eine ideale Crowd also für das Kriegsgräberprojekt. Es kam zu einer unkomplizierten Zusammenarbeit, von der Auswahl des Bestandes bis zum Import der fertigen Daten dauerte es nur zwei Jahre. Das von Compgen selber entwickelte Daten-Eingabe-System DES konnte an die Bedürfnisse des LABW angepasst werden: die Eingabemaske enthielt nur jene Felder, die das LABW als relevant definierte. Die Anleitungen und Projektbeschriebe verfasste das LABW selbst. Der Zugang zum Projekt erfolgte über die Plattform „GenWiki“, auf der sich Mitmachende bei Compgen registrierten und danach die zu bearbeitenden Gräberlisten nach Stadt oder Landkreis auswählen konnten. Es beteiligten sich über 100 Freiwillige, das LABW konnte durch eigene Werbung auch neue Leute zum Mitmachen bei Compgen animieren. Nach 11 Monaten war der ganze Bestand transkribiert, seit Frühling 2015 sind die Daten auch über das Findmittelsystem des LABW recherchierbar. Allerdings muss dazu die „Expertensuche“ gewählt und der Suchbereich um die „Dokumente“ erweitert werden. Weil die Dokumenten-Suche sehr lange dauert, wird das Feld derzeit noch nicht standardmässig abgesucht – nur geübte Genealogen finden also die Daten. Dies ist der einzige wunde Punkt des sonst erfolgreichen Projekts.

Treffer im Findmittelsystem mit Bild des Originals und einem Fenster mit den Indexdaten (23.6.2019)
https://www2.landesarchiv-bw.de/ofs21/bild_zoom/zoom.php

Das Projekt der Badischen Standesbücher gestaltet sich viel komplexer. Zum einen gehörte hier auch die Digitalisierung der Standesbücher zum Projekt und diese dauerte wegen der enormen Grösse des Bestandes mehrere Jahre: 1.6 Millionen Digitalisate aus knapp 6000 Bänden. Die einzelnen Taufen, Ehen und Todesfälle sind leider nicht tabellenartig, sondern in Satzform aufgelistet. Das Entziffern der Handschriften des 19. Jahrhunderts verlangt deshalb von der Crowd gute Kenntnisse im Schriftenlesen. Für das korrekte Indentifizieren der Namen und Daten sind zudem Deutschkenntnisse nötig. Damit sind die Hürden zum Mitmachen deutlich höher. Zum andern wird in diesem Projekt mit einen internationalen Partner zusammengearbeitet: Family Search führt auf der ganzen Welt Projekte der Digitalisierung und Transkription von Zivilstandsbüchern durch. Family Search verfügt über standardisierte Vorgehen und eigene Tools, auf die das einzelne Archiv nur geringen Einfluss nehmen kann. So ist bei den Standesbüchern z.B. nicht möglich, dass Mitmachende eine bestimmte Gemeinde auswählen. Auch Family Search besitzt bereits eine engagierte Crowd, die jedoch wenig Bezug zu Baden und zur deutschen Sprache zu haben scheint, denn die Resonanz auf das Projekt verläuft nicht wunschgemäss: in 5 Jahren Laufzeit wurden erst knapp 1 % der Südbadischen Standesbücher transkribiert. Die 1.6 Mio Digitalisate hingegen sind seit mehreren Jahren im Findmittelsystem des LABW zugänglich, womit ein wichtiges Teilziel erreicht wurde.

Für registrierte Freiwillige zugängliche Eingabemaske auf der Plattform Family Search und Digitalisat mit den zu bearbeitenden Einträgen

Positives Fazit

Obwohl nicht alle Projektziele erreicht wurden, möchte das LABW die Erfahrungen nicht missen. Sie fliessen in die neuen Mitmachprojekte ein: das LABW strebt kleinere Projekte an, die besser steuerbar sind, zudem soll das Archiv eine gewisse Mitsprache bei der Präsentation der Aufgabe für die Crowd haben und Anleitungen oder Tutorials an den Bestand anpassen können. Was natürlich mit mehr Eigenleistung des LABW verbunden ist.

Und was rät das LABW „Neueinsteigern“ unter den Archiven? Von Anfang an ein klares Konzept auszuarbeiten und die Zusammenarbeit mit einem Partner genau zu prüfen: Passt die vorhandene Crowd wirklich zu den ausgewählten Quellen? Verfügen vorhandene Tools über die Funktionalitäten, die für den konkreten Bestand nötig sind? Und als letzter Rat, klein anzufangen und den Bestand zu erweitern, falls das Crowdsourcing-Projekt gut läuft. Denn die Crowd macht nicht alles, was sich die Archive wünschen.

Infobox

Landesarchiv Baden-Württemberg, Eugenstrasse 7, D-70182 Stuttgart

Die Mitmachprojekte des LABW www.landesarchiv-bw.de/web/60586

Nähere Auskunft: Andreas Weber, Abt. Archivischer Grundsatz,andreas.weber@la-bw.de, +49 711/212-4243

Schreibe einen Kommentar