Aktuelles von den Schul-Jahresberichten

Datum: 
24.01.2021

Im Mitgliederbereich wurden in letzter Zeit 553 Schul-Jahresberichte zu folgenden Orten online gestellt: Augsburg (Schwaben), Bayreuth (Oberfranken), Bamberg (Oberfranken), Bad Bergzabern (Rheinland-Pfalz), Bielefeld (Nordrhein-Westfalen), Blieskastel (Saarland), Brühl (Nordrhein-Westfalen), Burghausen (Oberbayern), Dinkelsbühl (Mittelfranken), Erlangen (Mittelfranken), Ettal (Oberbayern), Euskirchen (Nordrhein-Westfalen), Kaiserslautern (Rheinland-Pfalz), Miltenberg (Unterfranken), Mindelheim (Schwaben), Oettingen (Schwaben), Metten (Niederbayern), Regensburg (Oberpfalz), Thurnau (Oberfranken), Traunstein (Oberbayern).

Insgesamt stehen derzeit 1832 Schul-Jahresberichte im Mitgliederbereich als Digitalisate zur Verfügung; die gesamten Digitalisate im Mitgliederbereich umfassen ca. 9,6 GB (mit etwas über 71.000 Seiten).

Bis zum Jahresende 2020 wurden von den fleißigen Projektteilnehmern bereits 2215 Schul-Jahresberichte mit insgesamt 83.315 Seiten eingescannt. Aus datenschutzrechtlichen Gründen werden derzeit nur Schul-Jahresberichte mit Jahrgang 1920 oder älter auf der BLF-Homepage zur Verfügung gestellt.

Zu Beginn des Projektes wurden die PDF-Dateien ausschließlich durch Zusammenfügen der eingescannten Bilddateien erzeugt. Eine Suche nach einer solchen PDF-Datei ist nur anhand der auf der BLF-Homepage hinterlegten Metadaten möglich. Nicht möglich ist damit die Suche innerhalb der jeweiligen PDF-Datei, um z.B. den Namen eines Schülers oder einen anderen Suchbegriff zu finden.

Im Laufe des Jahres 2020 wurde deshalb ein technisches Verfahren erarbeitet, mit dem es möglich ist, die Inhalte der eingescannten Bilder der Schul-Jahresberichte per OCR automatisiert zu "lesen" und den so gewonnenen Text zusammen mit den eingescannten Bildern zu PDF-Dateien zusammenzufügen. Der Schul-Jahresbericht einer derart erzeugten PDF-Datei kann damit nach dem Herunterladen von der BLF-Homepage nach beliebigen Suchbegriffen durchsucht werden (Volltextsuche).

Aktuell sind ca. 25 % der online verfügbaren PDF-Dateien mit diesem Verfahren erstellt worden. Alle derartigen Schul-Jahresberichte sind mit dem Vermerk "OCR mittels OCR-Programm (ohne manuelle Nachkorrektur)" versehen und daran erkennbar.

Von dem insgesamt beim BLF vorhandenen Bestand an geschätzten 8.000 Schul-Jahresberichten ist damit jetzt bereits gut ein Viertel erfasst!