Die Landesbibliothek Teßmann beteiligt sich mit weiteren 16 Partnereinrichtungen aus ganz Europa am EU-Projekt „Europeana Newspapers – A Gateway To Newspapers Online“, das sich die Optimierung und Vereinfachung der Recherche in digitalisierten historischen Zeitungsseiten zum Ziel gesetzt hat.

Die Tagespresse ist eine bedeutsame Informationsquelle – nicht nur in Form der aktuellen Berichterstattung über lokale Chronik und Politik oder das Weltgeschehen, sondern auch als Zeugnis vergangener Tage, wodurch sie zu einer wertvollen Forschungsgrundlage etwa für geschichtliche, sozialwissenschaftliche oder linguistische Studien wird. Um den Zugang zu historischen Zeitungen zu vereinfachen und zugleich das von der Zersetzung bedrohte Papiermaterial zu schonen, haben zahlreiche Bibliotheken und andere Einrichtungen in den letzten Jahren damit begonnen, große Zeitungsbestände einzuscannen und ihren BenutzerInnen in digitaler Form zur Verfügung zu stellen. So hat auch die Landesbibliothek Teßmann zwischen 2006 und 2011 etwa 1,5 Millionen Zeitungsseiten digitalisiert, die sie seit 2010 über das eigene Portal „Teßmann digital“ bereitstellt. Über 40 Zeitungen und Zeitschriften aus dem Raum des historischen Tirols werden den BenutzerInnen über dieses Portal präsentiert und können bequem über eine Titelliste oder über die Kalendernavigation angesteuert werden. Da diese Digitalisate derzeit nur als Bilddateien vorhanden sind, können die Zeitungstexte nicht automatisiert nach Stichworten durchsucht werden, sondern müssen – genau so wie ihre Originale in Papierform – einzeln durchgesehen werden. Dies soll sich allerdings durch die Beteiligung der Landesbibliothek am EU-Projekt „Europeana Newspapers“ ändern, das sich zur Aufgabe gemacht hat, die gezielte Recherche in digitalisierten Zeitungsbeständen zu ermöglichen. Dazu werden die digitalisierten Seiten unter anderem mit einer Software für automatisierte Texterkennung (OCR – Optical Character Recognition) und für Artikelsegmentierung (OLR – Optical Layout Recognition) bearbeitet, wodurch die digitalisierten Zeitungen einerseits volltextdurchsuchbar werden und andererseits auch die gewünschte Position eines Stichworts im Text angegeben werden kann, indem man etwa nur jene Treffer anzeigen lässt, in denen sich das gesuchte Wort in der Schlagzeile oder im Vorspann eines Zeitungsartikels befindet.
Eine besondere Herausforderung für die automatisierte Texterkennung stellt die Tatsache dar, dass ein Großteil der historischen Zeitungen in Frakturschrift gedruckt wurde, die von der OCR-Software nicht immer präzise gelesen werden kann. Deshalb feilen die Universität Innsbruck und die deutsche Firma CCS - Content Conversion Specialists GmbH im Rahmen des EU-Projekts an einer Verbesserung der automatisierten Texterkennung von historischen Druckwerken und werden ihre Erkenntnisse in einem so genannten Best-Practice-Papier festhalten, das auch anderen Einrichtungen und Projekten bei der automatisierten Erschließung von digitalisierten Texten als Grundlage dienen kann.
Zum Abschluss des EU-Projekts werden die beteiligten Bibliotheken über 18 Millionen digitalisierte, für die Recherche verfeinerte Zeitungsseiten zur freien Nutzung über das europäische Online-Kulturportal Europeana (www.europeana.eu) bereitstellen. Die Landesbibliothek Teßmann wird dann ihrerseits die technisch für eine optimierte Recherche aufbereiteten Zeitungsseiten in das landesbibliothekseigene Portal „Digitales Zeitungsarchiv“ einspielen und ihren BenutzerInnen dadurch die gezielte Suche im digitalisierten Zeitungsbestand ermöglichen.

Am EU-Projekt teilnehmende Institutionen:

Staatsbibliothek zu Berlin
National Library of Estonia
University of Helsinki, National Library of Finland
Bibliothèque Nationale de France
CCS Content Conversion Specialists GmbH
National Library of Latvia
University of Beograd
Landesbibliothek Dr. Friedrich Teßmann
University of Salford  
National Library of the Netherlands
Österreichische Nationalbibliothek
Staats- und Universitätsbibliothek Hamburg
National Library of Poland
LIBER Foundation
National Library of Turkey
Universität Innsbruck
The British Library
The European Library 

Mehr Informationen zum Projekt finden Sie auf der Webseite des EU-Projekts unter www.europeana-newspapers.eu.
Fragen zum Projekt können Sie an Karin Pircher (Karin.Pircher@tessmann.it) richten.