Digitalisierung von Kulturgut
Digitalisierung von Kulturgut
Private Briefe sind wertvolle Quellen für Sprach-, Sozial- und Kulturgeschichte, werden aber in der Forschung kaum beachtet. Das Projekt will herausfinden, wie marginalisiertes Kulturgut verantwortungsvoll und technisch sinnvoll digitalisiert werden kann, um es für künftige Forschung nutzbar zu machen.
| Promovierende: | Debby Trzeciak |
| Betreuende: | Prof. Dr. Andrea Rapp (TU Darmstadt), Prof. Dr. Stefan Schmunk (h_da) |
| Dauer: | 04/2024 bis 04/2027 |
| Beteiligte Institutionen: |
Gegenstand der Forschung in den Geistes- und Kulturwissenschaften sind häufig Kulturgüter. Ein wichtiger Teil des kulturellen Erbes unserer Gesellschaft sind private Briefe und schriftliche mediale Formen der Kommunikation – auch nicht-bekannter Personen –, die allerdings in der wissenschaftlichen Forschung marginalisiert sind, da ihnen als Alltagsmedium kein wissenschaftlicher oder gesellschaftlicher Mehrwert zugesprochen wird. Ob etwas als Kulturgut gilt, wird häufig von Institutionen entschieden; der ‚kulturelle Kanon’ oder das ‚kulturelle Erbe’ ist als ein dynamisches und gesellschaftlich ausgehandeltes Phänomen zu verstehen, das gängige gesellschaftliche Machtverhältnisse spiegelt. Besonders marginalisierte Kulturgüter jenseits des etablierten Kanons, wie Privatbriefe, unterliegen der Herausforderung, dass ihre Sammlung und Bewahrung, ihre systematische Erschließung und Digitalisierung durch keine Institution oder die Öffentlichkeit gefordert noch gefördert werden. Sie unterliegen daher keiner einheitlichen Archivierung und Standards. Ihre Inhaber:innen sind sich des kulturellen und wissenschaftlichen Wertes der Briefe oft selbst nicht bewusst. Sie bieten als Alltagsquellen jedoch einen wichtigen Einblick in die linguistischen, historischen und sozialen Gegebenheiten ihrer Zeit. Sie bilden zum Beispiel die lebensweltlichen Umstände ihrer Verfasser:innen, die kommunikativen Sitten und Gebräuche und die Sprachverwendung ihrer Zeit und Herkunft ab und sind somit für verschiedene Forschungsdisziplinen relevant. Sie ergänzen bzw. ‚korrigieren‘ offizielle Quellen und sind dadurch wichtige Forschungsdaten für die Analyse spezifischer Kulturen, Sprachen, Gesellschaften und sozialer Interaktion. Fast alle großen linguistischen Korpora (z.B. DeReKo [1], DTA [2], DDD-Referenzkorpora [3]) bestehen aus redigierten öffentlichen Texten; private Kommunikation und Sprache sind in aller Regel nicht sichtbar. Bei Archivsammlungen, Briefkorpora und Korpora bzw. Editionen weiterer Egodokumente werden in aller Regel Texte bekannter Personen oder Netzwerke gesammelt (vgl. z.B. Literaturarchiv Marbach [4], Propyläen-Edition [5], Editionen, die über correspSearch [6] erschlossen sind). Ausnahmen sind z.B. das Feldpostarchiv [7], das Deutsche Tagebucharchiv [8] und das Liebesbriefarchiv [9].
Digitale Forschungsprozesse erfordern eine umfassende und verlässliche Datengrundlage, um valide und reliable Forschungsergebnisse zu erzielen. Um diese zu schaffen und eine Nachnutzung der Daten zu ermöglichen, braucht es einen verantwortungsvollen Umgang mit Forschungsdaten und die Einhaltung von Standards und Prinzipien. Die FAIR-, CARE-, Open-Access- und Creative-Commons-Prinzipien bieten Orientierungspunkte für die wissenschaftliche Praxis. Eine Balance, wie die vielen Prinzipien, die zur Digitalisierung und Erschließung von Forschungsdaten existieren, miteinander gleichberechtigt vereint werden können, gibt es bisher nicht. Sie wäre aber sehr nützlich für alle Gedächtniseinrichtungen und Archive, die Kulturgut bewahren und aufbewahren und für alle Forschungsdisziplinen und Forschende, die mit Kulturgut arbeiten.
Forschungsfragen
Die Digitalisierung von großen Briefkorpora stellt enorme wissenschaftliche, rechtliche, informationstechnologische sowie auch ethische Herausforderungen dar. Die Dissertation fokussiert daher Fragestellungen, wie eine nachhaltige und dauerhafte Erschließung auch und vor allem von marginalisiertem Kulturgut nach internationalen Standards ermöglicht werden kann und analysiert darüber hinaus, wie eine maschinenlesbare und interoperable Digitalisierung und IT-gestützte Analyse des Kulturguts in dessen Entstehungskontext ermöglicht werden kann.
Insbesondere die konsequente Berücksichtigung aller Prinzipien ist eine Aufgabe, die bisher nicht gelöst wurde. Besonders gilt das für Briefkorpora von privaten Briefen der Zivilgesellschaft – und dies unabhängig von einer zeitlichen oder auch räumlichen Verortung. So müssen beispielsweise folgende Herausforderungen adressiert werden:
- Wie können Briefe digital erschlossen und nach den FAIR-Prinzipien (nach)nutzbar gemacht werden, ohne dass sie in eine Institution überführt werden (müssen), sodass die Inhaber, wie es gemäß den CARE-Prinzipen gefordert wird, Verantwortung für ihre Forschungsdaten übernehmen können, ohne kolonialistisch zu sein?
- Wie können die Forschungsdaten trotz der CARE-Prinzipen sichtbar und öffentlich werden und wie können die Urheber*innen/Inhaber*innen trotz der FAIR-Prinzipien teilhaben und ihre Rechte geschützt werden?
- Welche Technologien können das ermöglichen und wie müssen die Daten modelliert werden?
- Am Beispiel von Briefen bekannter/berühmter (männlicher) Persönlichkeiten ist das bereits gut zu erkennen, hier haben in den letzten Jahren vermehrt Erschließungen stattgefunden, die durch Technologien ermöglicht wurden. Wie können diese Mechanismen auf Briefe von marginalisierten Gruppen übertragen werden und an welchen Stellen ergeben sich andere/neue Herausforderungen?
Methodik
Um dieses Spannungsfeld aufzulösen, wird in der Dissertation explorativ an einem ausgesuchten Korpus vorgegangen. Das Vorgehen ist in mehrere Schritte geteilt. Als erstes werden die genannten FAIR , CARE- und Open-Prinzipien, Richtlinien und Standards detailliert betrachtet und ihre Anwendung und ihre (möglichen) Überschneidungen miteinander herausgearbeitet. Dabei werden Bereiche deutlich gemacht, denen in der späteren Anwendung eventuell genauere Aufmerksamkeit geschenkt werden muss, die sich als problematisch oder als einfach adaptierbar herausstellen können. Danach erfolgt die Erstellung des Untersuchungskorpus. Dafür kommen verschiedene Textzeugen und Sammlungen als Datengrundlage infrage. Im nächsten Schritt folgen die Aufbereitung und Auszeichnung der Briefe gemäß den zuvor herausgearbeiteten Prinzipien, Richtlinien und Standards. Wo es möglich ist, sollen die Prozesse automatisiert werden. Bei Kollisionen verschiedener Anforderungen unterschiedlicher Prinzipien, Richtlinien oder Standards wird eine Problembeschreibung erfolgen und mögliche (technische) Lösungsansätze erarbeitet und abgewogen. Auf diese Weise werden nicht nur auftretende Widerstreite gelöst, sondern es werden auch flexible Anpassungen an unterschiedliche Einzelfälle in der zukünftigen Anwendung möglich gemacht.
Ziel
Das Ziel ist, das Spannungsfeld zwischen den Prinzipien auszutarieren und festzustellen, wie Briefe und private Kommunikation zu digitalisieren, zu bewahren und für die Forschung zugänglich zu machen sind, ohne dabei die Standards und Prinzipien außer Acht zu lassen. Am Ende des Prozesses wird ein maschinenlesbares, maschinenverarbeitbares und interoperables Korpus nach internationalen Standards stehen. Zudem wird aus der Dissertation ein Anwendungsleitfaden für die digitale Erschließung von Kulturgut hervorgehen, der kulturellen Gedächtniseinrichtungen und Forschungsprojekten eine Anleitung und Hilfestellung für die Digitalisierung, Erschließung und den Erhalt von Kulturgütern geben wird. Gleichwohl kann davon ausgegangen werden, dass am Ende nicht allen Prinzipien, Richtlinien und Standards gerecht werden kann, aber es soll eine Balance gefunden werden, die stets eine an Einzelfälle anpassbare Lösung ermöglicht. Die Arbeit wird einen Beitrag zum nachhaltigen Umgang mit marginalisiertem Kulturgut und seiner Digitalisierung und damit seinem Erhalt und seiner Erforschung liefern.
Literatur und weiterführende Links
Das Deutsche Referenzkorpus des Leibniz-Instituts für deutsche Sprache, https://www.ids-mannheim.de/digspra/
Die Korpora des Deutschen Textarchivs, https://www.deutschestextarchiv.de/doku/textauswahl
Die Referenzkorpora zur deutschen Sprachgeschichte des Verbunds „Deutsche Diachron Digital“, https://www.deutschdiachrondigital.de/
https://goethe-biographica.de/
https://correspsearch.net/de/start.html