Digitalität: grundlegende Eigenschaften von Daten

Dr. Jakob Voß

2014-03-17

Digitale Bibliotheken

Digitale Bibliotheken sind Einrichtungen oder Anwendungen, in denen digitale Medien, gesammelt, geordnet, bearbeitet und/oder verfügbar gemacht werden. Der Begriff ist dabei mehr als Metapher statt als trennschafe Gattungsbezeichnung zu verstehen.

Digitale Medien

Digitale Dokumente

Was sammeln digitale Bibliotheken denn nun?

Was für Daten sind in Digitalen Bibliotheken relevant?

Publikationen

(Retro)digitalisierte Publikationen

Digitalisierung
Überführung von analogen Signalen (Zeit, Lautstärke, Farbe, Größe…) in Messwerten, die digital kodiert gespeichert werden.

…mehr zu Digitalisierung am am 12.5.

Digitale Kodierung: Bestandteile

Quantisierung
Begrenzte Menge zulässiger Werte
(z.B. Rot, Grün- und Blauanteil je 0 bis 255)
Datenformate
Definierte Strukturen
(z.B. Felder, Dimensionen, Ordnungsmethoden, Muster…)

Analog-Digital-Umsetzung / Sampling / Quantisierung

Daten nach Strukturierungsgrad

Digitale Kodierung: Beispiele

Unstrukturiert
Natürlichsprachlicher Text
Semi-strukturiert
Email, Text in XML, …
Strukturiert
Klar definierte Bestandteile

Abhängig davon, welche Bestandteile automatisch verarbeitet werden sollen.

Digitale Kodierung: Beispiele

Digitale Kodierung: Beispiele

Verschiedene Kodierungsformen des Buchstaben Å
Verschiedene Kodierungsformen des Buchstaben Å

Unicode U+00C5 (und U+212B),Å und Å (HTML)…

Was für Daten sind in Digitalen Bibliotheken relevant?

  1. Publikationen
    • (Retro)digitalisierte Inhalte
    • Originär digitale Publikationen
    • Aufgezeichnete digitale Kommunikation
  2. Metadaten

Originär digitale Publikationen (“born digital”)

Vorschläge?

Born digital

Aufgezeichnete Kommunikation

…potentiell alle Formen von Daten, sobald sie als publizierte Einheit zusammengefasst sind.

Metadaten

Metadaten: Häufige Unterteilung

Metadaten oder Daten?

Zwischenfazit

Frage an alle:

  1. Was sind Daten ganz allgemein?
  2. Nenne 2-3 Beispiele

Was sind eigentlich Daten?

Definitionen von Daten

x being distinct from y, where x and y are two uninterpreted variables and the relation of ‘being distinct’, as well as the domain, are left open to further interpretation.

Verschiedene Auffassungen von Daten

Daten als (harte) Fakten

Daten als (subjektive) Beobachtungen

Daten als (beliebige) binäre Nachrichten

Was sind Nachrichten/Zeichen?

Dokumente als Zeichen

Digitales Dokument = Einheit von Daten

Nach Voss (2013) sollte sich die Bibliotheks- und Informationswissenschaft mehr mit Daten beschäftigen statt über Dokumente zu reden.

Digitalität

Wie sehen diese Strukturen aus?

Beispiel: BibTeX

@misc{voss2014librarians,
  author = {Voß, Jakob},
  title  = {Old librarians like books. 
            New librarians like data. 
            Good librarians like people.}
  booktitle = {Twitter},
  year   = {2014},
  day    = {28},
  month  = {2},
  url = {https://twitter.com/nichtich/status/438186931139383296}
}

Beispiel: JSON

{
  "text": "Old librarians like books. New librarians like data. Good librarians like people.",
  "id": "438186931139383296",
  "retweet_count": "117",
  "favourites_count": "73",
  "source": "web",
  "user": {
    "name": "nichtich",
    "location": "Nauru"
  }
}

Beispiel: PICA

001A $00206:14-10-13
001B $02001:20-02-14$t01:44:21.000
001D $00206:23-10-13
002@ $0Aau
003@ $0769846149
004A $A9781490931869
010@ $aeng
011@ $a2013
019@ $aXD-US
021A $aDescribing data patterns
     $da general deconstruction of metadata standards
     $hJakob Voß
028A $dJakob$aVoß$9766345386
033A $p [North Charleston]
     $nCreateSpace Independent Publishing Platform

Beispiel: XML

<record>
  <datafield tag="011@">
    <subfield code="a">2013</subfield>
  </datafield>
  <datafield tag="004A">
    <subfield code="A">9781490931869</subfield>
  </datafield>
  <datafield tag="028A">
    <subfield code="d">Jakob</subfield>
    <subfield code="a">Voß</subfield>
    <subfield code="9">766345386</subfield>
  </datafield>
</record>

Datenmodellierung

Datenmodellierung: Beispiel

Siehe Aufgabenverteilung letzte Woche

Daten lesen lernen

Muster in Daten

http://aboutdata.org/patterns.html

Beispiele für Muster in Daten

Braten statt Daten

Guten Appetit!

Literatur

Kogalovsky, M. R. 2013. “Metadata in Computer Systems.” Programming and Computer Software.

Voss, Jakob. 2013. “Was Sind Eigentlich Daten?” LIBREAS. Library Ideas. http://libreas.eu/ausgabe23/02voss/.