Über die OAI-Schnittstelle der Sächsischen Landesbibliothek SLUB werden die METS-Metadaten zu den Digitalisaten des Börsenblatts für den Deutschen Buchhandel heruntergeladen. Mit verschiedenen Skripten wurden diese Daten unterschiedlich ausgewertet.
Aus den Daten wird die Anzahl der Seiten pro Ausgabe ausgelesen und als csv gespeichert. Das Ergebnis wird mit Dash/Plotly als interaktives Diagramm dargestellt.
Ein anderes Skript lädt die ALTO-XML-Dateien, die den Volltext der digitalisierten Seiten enthalten und analysiert die Anzahl der erkannten Zeilen, um daraus Rückschlüsse auf den Inhalt der Seite zu ziehen.
mets-daten über die OAI-Schnittstelle der SLUB laden, für jedes heft eine einzelne xml-datei anlegen
wertet die heruntergeladenen daten aus und schreibt seitenliste.csv, die id eines jeden heftes und die zugehörige seitenzahl enthält
ein diagram der seitenzahlen mit dash erstellen
einfache analysen über die seitenzahlen
Diagram mit bokeh erstellen, nicht weiterentwickelt, dash ist momentan die interessantere alternative