OPATCH - Open Platform for Access to and Analysis of Textual Documents of Cultural Heritage

Das zweijährige Forschungsprojekt OPATCH - Offene Plattform für Zugriff auf und Analyse von Kulturdokumenten in Textform wurde von Anfang 2014 bis Ende März 2016 unter der Leitung des Eurac-Instituts für Fachkommunikation und Mehrsprachigkeit durchgeführt. Neben der EURAC und der Landesbibliothek Dr. Friedrich Teßmann war das Institut für Corpuslinguistik und Texttechnologie der Österreichischen Akademie der Wissenschaften als assoziierter Partner am Projekt beteiligt.
Das Projekt wurde über das Landesgesetz 14 durch die Autonome Provinz Bozen – Südtirol, Abteilung 34. Innovation, Forschung und Universität finanziert.

Die Computerlinguisten der EURAC untersuchten zusammen mit den Bibliothekaren der Teßmann und den Wissenschaftlern des Instituts für Corpuslinguistik und Texttechnologie der Österreichischen Akademie der Wissenschaften in Wien wie neueste Technologien aus der Computerlinguistik, Statistik und Informationsvisualisierung kombiniert und weiterentwickelt werden können, um Suchportale für Textsammlungen zu erweitern und verbessern. Ausgehend von den Anforderungen der verschiedenen Nutzer stand dabei im Vordergrund ein System zu erarbeiten, welches den gesamten Arbeitsablauf abdeckt: von der Gewinnung der Daten über die Verarbeitung bis hin zu ihrer Präsentation über Nutzerportale.
Heute finden sich circa schon ein Dutzend deutschsprachiger historischer Tageszeitungen aus dem Alpenraum für den Zeitraum 1910 bis 1920 in dem digitalen Zeitungsarchiv. Dieses ist im Internet für alle unter http://digital.tessmann.it zugänglich. Durch die beigefügten Volltextdaten ergeben sich so nicht nur für Historiker, Chronisten und Ahnenforscher neue komfortable Forschungsansätze und Recherchewege.
Neben dem digitalen Zeitungsarchiv gibt es auch ein neues Portal zur linguistischen Analyse von zeitgenössischen Südtiroler Texten wie zum Beispiel Romane, Fachartikel oder auch Rezepte, die im Korpus Südtirol gesammelt werden. Auf der Plattform können Linguisten etwa untersuchen, welche Wörter häufig zusammen verwendet werden oder auch wie sich der Wortgebrauch über die Zeit verändert. Dazu stehen verschiedene graphische Darstellungsformen, sogenannte Visualisierungen zur Verfügung. Über Liniendiagramme wird sichtbar gemacht, wie sich die Häufigkeiten von Wörtern in verschiedenen Texten und über die Zeit verhalten. Bäumchenartige Visualisierungen hingegen zeigen, welche Kontexte für ein Suchwort besonders typisch sind.
Einstiegsseite zu den zwei Suchportalen: http://commul.eurac.edu/opatch/


logo-provinz-bozen-bei-opatch


Contact Eurac
Verena Lyding
+39 0471 055 127
verena.lyding@eurac.edu

Contact Provincial Library Dr. Friedrich Teßmann
Johannes Andresen
+39 0471 471811
johannes.andresen@tessmann.it