The eXtensible characterisation languages - XCL
Autoren
Mehr zum Buch
Wenn Sie ein Office Dokument von Microsoft Word in ein PDF konvertieren, enthält es dann immer noch dieselbe Information? Wenn Sie ein Bild aus einem Format in ein anderes verwandeln, ist es immer noch dasselbe? Überraschenderweise gibt es heute noch keine technische Antwort auf diese Fragen: Der einzige Weg sie zu beantworten verlangt, dass ein menschlicher Beobachter die fraglichen Objekte vor und nach einer solchen Umwandlung beurteilt. Für einzelne Konversionen von Dateien mag dies eine gangbare Lösung sein: Wenn man Millionen davon zu bearbeiten hat, ist sie es offensichtlich nicht. Dies ist gravierend in allen Fällen, in denen derartige Formatumwandlungen oder Migrationen systematisch durchgeführt werden müssen, vor allem im Bereich der digitalen Langzeitspeicherung, wo extrem große Datenmengen langfristig sicher durch eine sich wandelnde technische Umwelt geleitet werden sollen. Innerhalb von Planets - einem der strategischen Projekte für die digitale Langzeitspeicherung, die derzeit von der Europäischen Kommission finanziert werden - wird deshalb derzeit eine Lösung für dieses Problem an der Universität zu Köln entwickelt. Kurz gesagt: Es wurde eine formale Sprache entwickelt, die es erlaubt komplexe Datenobjekte von Typen wie „Text“ oder „Bild“ zu repräsentieren. Wurde der Inhalt zweier Dateien in diese abstrakten Repräsentationen überführt, können Vergleichsalgorithmen auf sie angewendet werden, die eine Abschätzung des Umfangs der Änderungen erlauben, die durch den Migrationsprozess herbeigeführt wurden. Eine weitere formale Sprache erlaubt es, die technischen Spezifikationen von Dateiformaten, die sich an menschliche Programmierer richten, so auszudrücken, dass spezielle Software in die Lage versetzt wird, den Inhalt in bestimmten Formaten gespeicherter Dateien in diese abstrakte Form zu überführen, die für den Vergleich benötigt wird. Da diese Formalismen ein konsistentes Verständnis der Information erfordern, die von diesen Prozessen verarbeitet wird, bauen die entwickelten Lösungen auf einem dedizierten abstrakten Informationsmodell auf. Dieser Band beschreibt den derzeitigen Stand des Projekts: Er wurde als Arbeitsunterlage produziert, die derzeit an führende Forschungsgruppen verteilt wird, um die geschilderte Vorgehensweise in einer Reihe von Workshops zu diskutieren.