Datenkonvertierung

Dr. Jakob Voß

2014-04-07

Was ist Datenkonvertierung?

Überführung von Daten von einem Format in ein anderes Format

Was ist Datenkonvertierung?

Überführung von Daten von einem Format in ein anderes Format

Überführung
Konvertierung, Konversion, Transformation, Mapping…
Daten
Datensätze, digitale Objekte/Dokumente, Dateien…
Format
Datenstruktur, Dateiformat…

Quellformat  →  Konvertierung  →  Zielformat

Anwendungen für Normalnutzer

Anwendungen für Informationsmanager

Arten von Konvertierungen

Regelbasierte Überführung von Daten

Quellformat  →  Konvertierungsregeln  →  Zielformat

Warum regelbasiert?

Beispiel: Bildbearbeitung

Regelbasiert
Thumbnail erstellen
Manuell
Bildmotiv passend zuschneiden

Beispiel: Konvertierung in Großbuchstaben

Regelbasierte Überführung von Daten

Konvertierungs-programm, -skript, -mapping, -tabelle…

Algorithmen und Programme

Programme zur Datenkonvertierung

Beispiel: (Konkordanz-)Tabelle

Datum  →  Date
Autor  →  Creator
Übersetzung  →  Contributor
Illustrationen  →  Contributor

Beispiel: Ersetzungsregeln

Schwierigkeiten am Beispiel “Nachname, Vorname”

Technische Schwierigkeiten am Beispiel dieser Folien

datenkonvertierung.slides.md (Markdown in Unicode)
 →  LaTeX  →  datenkonvertierung.slides.pdf (PDF)

Mappings vs. Konvertierungen

Datenverarbeitung durch Konvertierungen

Datenverarbeitung durch Aggregtion/Anreicherung

Konvertierungs- und Verarbeitungs-Pipelines

a & b -> ab -> AB -> BA …

Prinzip in Unix und anderen Systemen

Übung

Rekonstruktion einer Konvertierung

In Gruppen: * Titel * Contributor * Date * Subject

Daten und Formate

Aufbau von Daten

Werte & Struktur (mit unterschiedlichen Strukturierungsgraden)

siehe Einheit zu Digitalität

Eigenschaften von Konvertierungsregeln

Verschiedene Eigenschaften

Bestimmen, welche Informationen in Daten stecken können!

Qualitätskontrolle

Qualitätskontrolle

Zusammenfassung

Quellen und Literatur

Flowchart mit Euklids Algorithmus CC-BY Wvbailey@commons]


  1. Je nach Anwendung, welche Teile relevant sind!