ETH Library Idea Contests

Daten-APIs

by
X.Y.
X.Y. | 10 months ago | in Data Challenge: Idea Contest

Über die Suche auf Webseiten wie e-rara.ch und e-manuscripta.ch lassen sich eine Vielzahl von multimedialen Inhalten finden. Die Suchergebnisse werden für den Benutzer übersichtlich dargestellt, sodass man gegebenenfalls Details dazu abrufen kann. Meine Idee wäre eine zusätzliche programmatische Schnittstelle (API) anzubieten, die es mithilfe eines strukturierten Dateiformats ermöglicht, Anfragen zu formulieren und Ergebnisse zu erhalten. Dies würde den Abruf von grösseren Datenmengen erheblich vereinfachen.

APIs sind ein wichtiger Bestandteil von Webservices wie Flickr, Twitter, Google, Facebook, etc., um deren Daten (z.B. Titel, Beschreibung, Stichworte, Autor, Datum, Ort, Bilder, Lizenz) zu durchsuchen und weiter zu analysieren. Bei digitalen Bibliotheken scheinen Daten-APIs noch nicht sehr verbreitet zu sein – auch bei der ETH-Bibliothek konnte ich keine finden. Ein erwähnenswertes Beispiel für eine API, die mir bei meiner Forschung begegnet ist, ist die der Französischen Nationalbibliothek (http://api.bnf.fr/accueil). Hier kann man sich die Suchergebnisse über verschiedene Endpunkte (z.B. URL, SPARQL) in unterschiedlichen Formaten (z.B. XML, N-Triples) ausgeben lassen.

In meinem spezifischen Anwendungsfall habe ich bei digitalen Bibliotheken nach Karten vom 15. bis 18. Jahrhundert gesucht. Diese sollen als Trainingsdaten für Convolutional Neural Networks dienen, um bestimmte Objekte darauf zu erkennen. Mittlerweile habe ich eine Vielzahl von Karten zusammengetragen, aber in den meisten Fällen musste ich hierfür das HTML der Webseiten auslesen, um die Karten in einem Bildformat mit einer hohen Auflösung zu speichern. Mir hätte es Zeit erspart, wenn es jeweils eine programmatische Schnittstelle gegeben hätte.

Wünschenswert wäre es aus Benutzersicht, wenn alle Bibliotheken ihre Daten in einem gemeinsamen Vokabular (z.B. Dublin Core) im Sinne des Semantischen Webs zur Verfügung stellen, sodass man dieselbe Datenstruktur bei unterschiedlichen Bibliotheken nutzen oder sogar gleich bibliotheksübergreifende Abfragen erstellen könnte. Zudem könnte man die Medien von anderen Linked Data Stores (z.B. DBpedia) referenzieren und Querverweise zwischen den Bibliotheken herstellen, wenn beispielsweise mehrere Kopien desselben Mediums vorliegen.

Describe the required data

RDF/XML, JSON-LD, N3, Turtle

edited on Dec 20, 2018 by X.Y.

Claudia Lienhard 10 months ago

Hallo X.Y., herzlichen Dank für diese interessante Idee! Die Phase der Ideeneingabe läuft noch bis zum 31. Dezember, anschliessend wird jede Idee anhand festgelegter Kriterien evaluiert (siehe dazu FAQ).

Claudia Lienhard 8 months ago

This idea has been advanced to the current phase

Claudia Lienhard 8 months ago

This idea has been advanced to the current phase

Claudia Lienhard 7 months ago

This idea has been advanced to the next phase

Share