Digitale Methodik und Umsetzung der Edition

Editionsumgebung und Datenmodell

Die Erfassung und editorische Bearbeitung der Briefe erfolgt in der Editionsumgebung ediarum der Berlin-Brandenburgischen Akademie der Wissenschaften, die auf der XML-Datenbank eXist-db und dem XML-Editor oXygen aufbaut.

Die Briefe und ihre Beilagen werden standardkonform nach den Richtlinien der Text Encoding Initiative in XML kodiert. Für das Projekt wird das TEI-Subset des Deutschen Textarchivs, das DTA-Basisformat, verwendet. Die Briefe entsprechen dem XML-Schema der Editionsumgebung ediarum, das eng an das DTA-Basisformat angelehnt ist.

Der in der Edition verwendete erweiterte Briefbegriff – ein Brief umfasst neben dem Brieftext auch seine Beilagen (sofern vorhanden), wobei jeder Text (Brief oder Beilage) in mehreren Varianten (Fassungen: Entwurf, Ausfertigung, Abschrift etc.) vorliegen kann – wird in der digitalen Erfassung in separaten, aber miteinander verknüpften XML-Dateien umgesetzt. Diese Kodierungsform wurde gewählt, um eine unkomplizierte 1:1-Zuordnung der Metadaten und Textdaten in jeder TEI-XML-Datei zu gewährleisten.

Beispielsweise hat jede Variante (Textfassung) in der Regel eine eigene Quellenangabe (im TEI-Element <sourceDesc>). Bei dem hier gewählten Ansatz enthält jede XML-Datei einen Text und eine Quellenangabe, die ohne komplexes Parsing als zueinandergehörend interpretiert werden können. (Im alternativen Ansatz, mehrere Textfassungen in einer Datei zu pflegen, müssten mehrere Quellenangaben im <teiHeader> ihren entsprechenden Texten mittels eindeutiger Identifier zugeordnet werden. Für die Erfassung und Auswertung einer großen Menge von Varianten wurde der Ansatz mit spearaten Dateien als handhabbarer und effizienter eingeschätzt.)

Schematische, beispielhafte Darstellung der Bestandteile eines Briefes in den Sozinianischen Briefwechseln (nach dem erweiterten Briefbegriff): Ein Brief kann mit Beilagen versendet worden sein (hier zwei Beilagen) und ist hier mit einer überlieferten Variante des Anschreibens dargestellt. Auch die Beilagen können in mehreren Varianten erhalten sein.

Das XML-Schema ist ergänzt um die minimale nötige Anzahl projektspezifischer, TEI-konformer Erweiterungen – unter anderem zur Modellierung des erweiterten Briefbegriffs. Die Schema-Erweiterungen sind folgende:

Publikationsumgebung

Die Publikation der Digitalen Edition verwendet das Content-Management-System TYPO3, zugeschnitten auf die Präsentation, Versionierung, Archivierung und Vernetzung von historischen Quellen durch TYPO3-Erweiterungen, entwickelt von der Digitalen Akademie an der Akademie der Wissenschaften und der Literatur | Mainz. Das Cultural Heritage Framework übernimmt die Verwaltung der Brief-Quellen, während die Extension LOD den URI-Resolver und die Schnittstellen bereitstellt.

Graphbasierte Digitale Edition

Die Edition leistet Pionierarbeiten in den Graphentechnologien, indem sie die auf dem Feld der Digitalen Editorik etablierte XML-Technologie um die sehr flexiblen Möglichkeiten der Graphen zur Organisation von Annotationen und Erschließung erweitert. Damit wird es möglich, auf XML-Basis einen Registereintrag direkt mit der entsprechenden Textstelle zu verbinden. Gleichzeitig können die Registereinträge im Graphen übergeordneten Erschließungshierarchien zugeordnet und auch multidimensional untereinander verknüpft werden.

Als erste Komponente wird die Webanwendung eXGraphs (Extract XML to Graphs) entwickelt und unter offener Lizenz veröffentlicht. Mit diesem Open Source Tool können beliebige XML-Strukturen anhand einer Konfigurationsdatei iteriert, analysiert und in einen Graphen transformiert werden. Neben der Ausgabe in einen Graphen kann auch eine Ausgabe als strukturierter Reintext erfolgen, der den ersten Schritt zur einer Referenzierbarkeit und Versionierung von Graphen im Editionskontext darstellt.

Als zweite Komponente wurde die Webanwendung GRACE (Graph Content Editor) als Proof of Concept zur editorischen Bearbeitung von Graphen entworfen. GRACE verbindet sich mit einer Instanz der Graphdatenbank neo4j und ermöglicht EditorInnen, Knoten und Kanten des Graphen übersichtlich auf Basis von Tabellen und Listen zu erkunden. Durch ein Interface kann auch im Graphen gesucht werden, beispielsweise nach Text, der innerhalb einer Relation vorkommt. Haben die EditorInnen einen Kontext ausfindig gemacht, können über die Weboberfläche neue Knoten und Kanten angelegt werden.