Digi­ta­les Vergessen

Lese­dau­er 16 Minu­ten

Digi­ta­les Ver­ges­sen bedroht die zukünf­ti­ge Geschichts­schrei­bung. Viel­leicht wird man in weni­gen Jahr­zehn­ten nicht mehr wis­sen, wie wir heu­te gelebt haben. Kön­nen digi­ta­le Daten ein­fach so „ver­schwin­den”?

VORWORT:
Die­ses The­ma ist sehr kom­plex, behan­delt es doch eigent­lich alle Aspek­te unse­res moder­nen Lebens. Wir leben in einem digi­ta­len Zeit­al­ter, gehen aber mit unse­rer jüngs­ten Ver­gan­gen­heit sehr sorg­los um. Hier möch­te ich einen – zuge­ge­be­ner Mas­sen etwas umfang­rei­chen – Denk­an­stoß geben, sich sel­ber mit den Teil­aspek­ten zu beschäf­ti­gen. Aus die­sem Grun­de habe ich sehr vie­le Links zu ande­ren Web­sei­ten ein­ge­fügt. Die meis­ten davon ver­wei­sen auf die Wiki­pe­dia, da mir die­se momen­tan am zuver­läs­sigs­ten in Sachen Ver­füg­bar­keit erscheint. Ich bin mir sicher, dass die Wiki­pe­dia-Links alle noch erreich­bar sind, wenn die­ser Arti­kel längst ver­schwun­den ist. Die Wiki­pe­dia ist kei­ne Quel­le, aber sie reicht um sich unver­bind­lich einen Über­blick über ein The­ma zu ver­schaf­fen – zumal es hier eher um „har­te” Fak­ten zu The­men der IT geht.

Flüch­ti­ge Informationen

Immer wie­der hörst Du: „Das Inter­net ver­gisst nichts!” Klar, die pein­li­chen Par­ty­bil­der, mit denen sich Dei­ne Kin­der (oder Du selbst?) bis auf das Mark bla­miert haben, bekommt man selt­sa­mer Wei­se nicht mehr aus dem Netz. Aber suche doch mal eine Bedie­nungs­an­lei­tung für einen „alten” Fern­se­her oder die letz­te Firm­ware für einen DVD- oder Blu­ray-Play­er. Nach drei, vier Jah­ren sind die tat­säch­lich von den Her­stel­ler­web­sites ver­schwun­den. Infor­ma­tio­nen zu jüngs­ten poli­ti­schen und gesell­schaft­li­chen Ver­än­de­run­gen? Von den Nach­rich­ten­sei­ten und aus den sozia­len Netz­wer­ken verschwunden!

[irp posts=„681” name=„Was ist eigent­lich Daten­schutz?”] [irp posts=„671” name=„Warum ich etwas zu ver­ber­gen habe”]

Das Pro­blem der digi­ta­len Demenz ist also tat­säch­lich real. Wir leben immer mehr in einer papier­lo­sen Welt. Daten­men­gen, die gan­zen Staats­bi­blio­the­ken ent­spre­chen, kann man mit einem unbe­dach­ten Maus­klick in einem Sekun­den­bruch­teil löschen. Bei den gigan­ti­schen Daten­men­gen, die (nicht nur) die Unter­neh­men hor­ten, muss das zwangs­wei­se nicht ein­mal jeman­dem auf­fal­len. Back­ups wer­den auch nicht für alle Ewig­keit aufgehoben.

[irp posts=„685” name=„Was ist eigent­lich Big Data?”]

Aber lasst uns erst ein­mal eine Exkur­si­on durch die Wun­der­welt der Daten­trä­ger und Medi­en machen. Archäo­lo­gie muss sich nicht zwangs­wei­se mit Epo­chen beschäf­ti­gen, die bereits vor Äonen zu Ende gin­gen. Bevor wir es uns ver­se­hen, haben bereits unse­re Enkel kein genau­es Bild mehr von unse­rem Leben.

Ana­lo­ge Medi­en sind robuster

Ein Foto­al­bum (ein Buch gene­rell) brennt tat­säch­lich eher schlecht. Wenn eine Woh­nung oder ein Gebäu­de aus­brennt, dann wer­den die­se Schät­ze an den Kan­ten ange­kohlt sein. Das größ­te Risi­ko ist das Lösch­was­ser, nicht die Flam­men. So ein Buch steht viel­leicht fünf­zehn Minu­ten im Feu­er, bis die Lösch­ar­bei­ten begin­nen. Es wird nicht mehr hübsch sein, aber der Inhalt wird noch weit­ge­hend zu lesen sein. Die exter­ne Fest­plat­te mit zig Tera­byte an Daten (das ent­spricht der gan­zen Stadt­bü­che­rei einer Groß­stadt) ist – wenn über­haupt – nach die­ser Zeit nur noch durch Foren­si­ker zu enor­men Kos­ten aus­les­bar. Das Feu­er muss nicht ein­mal das Regal errei­chen, die Strah­lungs­hit­ze, die den Ein­band eines Buches nur ansengt, beschä­digt die Beschich­tung der Fest­plat­ten­schei­ben irrepa­ra­bel und lässt opti­sche Daten­trä­ger und Band­kas­set­ten schmelzen.

Phy­si­ka­li­sche Beschädigungen

Digi­ta­le Medi­en sind davon weit­aus stär­ker betrof­fen als ana­lo­ge. Aus einer alten VHS-Kas­set­te, deren Band beschä­digt wur­de, kann ich die betrof­fe­nen Stel­len ein­fach raus­schnei­den und das Band wie­der zusam­men­fü­gen. Es fehlt zwar nun eini­ges an Infor­ma­ti­on, aber ich kann das Band im Recor­der pro­blem­los abspie­len. Hat ein opti­scher Daten­trä­ger Beschä­di­gun­gen in der Daten­schicht, z.B. durch einen Krat­zer von der Ober­sei­te(!) der Disk her, wird es sehr schwer sein, die­sen wie­der zu ret­ten. Die Beschä­di­gung betrifft in dem Fal­le nicht nur einen ein­zel­nen Daten­satz auf dem Daten­trä­ger, son­dern im Pri­zip fast jede dar­auf gespei­cher­te Infor­ma­ti­on, wenn auch im wesent­lich gerin­ge­rem Umfang.

Wird der Bereich mit den Datei­zu­ord­nun­gen auf einem magne­ti­schen Daten­trä­ger phy­si­ka­lisch Beschä­digt, muss ein Daten­ret­tungs­be­trieb ran. Setzt man eines die­ser übli­chen Daten­ret­tungs­tools an, so ver­zich­tet man i.d.R. auf die kom­plet­ten Datei­na­men und ‑endun­gen, bekommt also nur noch „Blan­ko­da­tei­en”, die oft genug auch noch beschä­digt sind. Sol­che Datei­en kön­nen ein Bild, ein Mail­fi­le, oder ein Word-Doku­ment sein, man sieht es dem File nicht mehr an.

Natür­lich darf man nun nicht den­ken, dass die alten Video­bän­der unver­sehrt die Lage­rung über lan­ge Zei­ten über­ste­hen. Das Gegen­teil ist der Fall, die Qua­li­tät wird immer schlech­ter, je älter das Band wird. Beson­ders mehr­fach bespiel­te Bän­der sind pro­ble­ma­tisch. Hier soll­te man also schnell han­deln und die Bän­der auf ein zeit­ge­mä­ßes digi­ta­les Medi­um kopie­ren. Die noch älte­ren Super-8-Fil­me sind da deut­lich haltbarer.

Je nie­dir­ger also die Infor­ma­ti­ons­dich­te in einem Daten­trä­ger ist, des­to weni­ger schnell kön­nen Infor­ma­tio­nen dar­auf beschä­digt werden.

Beschä­di­gun­gen durch Software

Auch ein sehr inter­es­san­tes The­ma ist die For­ma­tie­rung exter­ner Fest­plat­ten. Um die­se auch noch für älte­re Betrieb­sys­te­me wie Win­dows XP (das schon lan­ge nicht mehr mit Sicher­heits­up­dates ver­sorgt wird, an dem aber immer noch vie­le User hän­gen) kom­pa­ti­bel zu machen, die nichts mit der Sek­tro­en­grö­ße von 4 KByte beim Advan­ges For­mat moder­ner Fest­plat­ten anfan­gen kann, gau­kelt die Elek­tro­nik des exter­nen Fest­plat­ten­ge­häu­ses dem Betrieb­sys­tem eine Sek­to­ren­grö­ße von nur 512 Bytes vor. Erlei­det die Elek­tro­nik in dem Gehäu­se einen Defekt und baut man die Plat­te nun in einen Rech­ner intern ein, so wird das Datei­sys­tem als unpar­ti­tio­niert ange­zeigt wer­den, da nun die „512 Emu­la­ti­on” fehlt.

Wenn nun ein ähn­li­ches exter­nes Gehäu­se vor­han­den ist, dass für eine (nicht iden­ti­sche) Umwand­lung der Sek­to­ren­grö­ße sorgt, ist die Pro­ble­ma­tik die glei­che wie bei defek­ten Datei­zu­ord­nun­gen: man weiß nicht mehr was für Daten wo auf der Fest­plat­te gespei­chert sind und müss­te die gesam­te Plat­te Bit für Bit aus­le­sen um dar­aus eine Datei­zu­ord­nung zu rekon­stru­ie­ren. Dabei kann nicht unter­schie­den wer­den, ob die gefun­de­nen Daten zu einer gelösch­ten Datei gehört, die viel­leicht sogar teil­wei­se über­schrie­ben wur­de. Vie­le Zuord­nun­gen müs­sen geschätzt wer­den, so dass am Ende meist ein heil­lo­ses Durch­ein­an­der ent­steht. Die Datei­na­men sind i.d.R. nicht mehr zu ret­ten, so dass man am Ende im Zwei­fel Mil­lio­nen Datei­en hat, aus den man die rele­van­ten her­aus­fin­den müsste.

Gera­de unter dem Betrieb­sys­tem Win­dows ist Schad­soft­ware (Viren, Tro­ja­ner, Wür­mer, etc.) ein mas­si­ves Pro­blem. Nicht nur die Schad­soft­ware an sich kann die Daten beschä­di­gen, auch der Viren­scan­ner kann beim Ent­fer­nen die Datei­en ver­än­dern. Wie zuver­läs­sig ist die Infor­ma­ti­on in einer geän­der­ten Datei? Bei foren­si­schen Unter­su­chun­gen spielt die­ser Aspekt durch­aus eine Rolle.

„Gefälsch­te” Informationen

Ver­fälsch­te Infor­ma­tio­nen? Wie das? Erin­nert sich noch jemand an den „Xerox-Skan­dal” vor eini­gen Jah­ren? Die gro­ßen Scan­ner­sys­tem von Xerox, die in vie­len Fir­men ein­ge­setzt wer­den, die das papier­lo­se Büro vor­an­trei­ben, „fälsch­ten” die ein­ge­spann­ten Doku­men­te. Fin­di­ge Inge­nieu­re kamen auf die Idee, dass man zur opti­ma­len Kom­pri­mie­rung nicht nur ähn­li­che Pixel in einer Gra­fik (etwas anders ist ein Scan nicht) zusam­men­fas­sen könn­te, son­dern durch die OCR (Opti­cal Cha­rac­ter Reco­gni­ti­on, Tex­ter­ken­nung) auch kom­plet­te ähn­li­che Zei­chen (Buch­sta­ben, Zah­len, Son­der­zei­chen) in einem Doku­ment durch einen ein­zi­gen erset­zen könn­te. Wür­den in einem Doku­ment also bei­spiels­wei­se 400 gro­ße „A” vor­kom­men, so müss­te man nur ein­mal eines die­ser „A” als klei­ne Pixel­gra­fik spei­chern und die­se dann an allen ande­ren Stel­len, die ein „A” ent­hiel­ten, einsetzen.

Die Ergeb­nis­se sehen echt aus und fal­len nur auf, wenn man nach Anzei­chen für eine Fäl­schung sucht. So auch gesche­hen bei der Geburts­ur­kun­de des US-Prä­si­den­ten Barak Oba­ma. Die­se wur­de augen­schein­lich mit einem Xerox-Sys­tem ein­ge­scannt und ver­öf­fent­licht. Ver­schwö­rungs­theo­re­ti­kern fie­len die vie­len exakt glei­chen Buch­sta­ben in der Urkun­de auf. Eigent­lich soll­ten sich die ein­zel­nen Buch­sta­ben hin­rei­chend von­ein­an­der unter­schei­den, wenn man das Doku­ment ver­grö­ßert, da das Ori­gi­nal immer ganz leicht schräg ein­ge­zo­gen oder auf­ge­legt wird.

Hier­zu emp­feh­le ich das eben­so unter­halt­sa­me wie erhel­len­de und erschre­cken­de Video von David Kriesel.

Halt- und Les­bar­keit der Medien

Das wirk­lich inter­es­san­te (Grund-)Problem ist doch ein ganz ande­res: Womit kann ich die Daten wie­der aus­le­sen, wenn (falls!) sie einen län­ge­ren Zeit­raum unbe­scha­det über­stan­den haben? Eine Stein­ta­fel, eine Per­ga­ment­rol­le, eine Ton­ta­fel oder ein Buch kann ich pro­blem­los direkt und ohne Hilfs­mit­tel lesen, wenn ich die Spra­che ver­ste­he. Auch alte Film­strei­fen kann ich mir anse­hen, zu Not mit einer ein­fa­chen Lupe. Glei­ches gilt für Micro­fi­che. Selbst eine Schall­plat­te kann man sich mit ein­fachs­ten Mit­teln anhö­ren. Zwei Schall­plat­ten wur­den des­halb sogar in den Welt­raum geschickt.

Viel­leicht wird man sich aber bereits in 100 Jah­ren fra­gen, wie wir – die Men­schen der digi­ta­len Gegen­wart – über­haupt gelebt haben. Jahr­tau­sen­de alte Schrif­ten, die in Stein gehau­en wur­den, haben Krie­ge, Kata­stro­phen und Kul­tu­ren über­lebt – auch Bücher aus Leder, Per­ga­ment oder schnö­den Papier über­dau­er­ten die Jahr­hun­der­te und gewäh­ren uns heu­te einen Ein­blick in das dama­li­ge Leben aus Gesell­schaft, Poli­tik, Wis­sen­schaft und Kunst. Lei­der ist nicht jede Papier­sor­te zur Lang­zeit­ar­chi­vie­rung geeig­net. Gera­de die Sor­ten, die mit der Indus­tria­li­sie­rung ein­ge­führt wur­den, lei­den unter Papier­zer­fall durch ver­schie­de­ne Fak­to­ren.

Urkunde Taiwan
(
Nach­druck einer tai­wa­ni­schen Schrift)

Magne­ti­sche Medien

Es ist all­ge­mein bekannt, dass bei magne­ti­schen Medi­en die Beschich­tung bereits durch einen unsach­ge­mä­ßen Aus­le­se­ver­such irrepa­ra­bel beschä­digt wer­den kann? Dass nicht jedes dafür eigent­lich geeig­ne­te Lese­ge­rät die Daten auch kor­rekt aus­le­sen kann, weil die Lese­köp­fe durch Seri­en­schwan­kun­gen leicht unter­schied­lich ein­ge­stellt sind? Dass die Antriebs­riem­chen in den Lauf­wer­ken mit den Jah­ren ver­sprö­den und Ersatz nicht für Geld und gute Wor­te zu bekom­men ist? Dass es nicht die Fra­ge ist, ob ein digi­ta­ler Daten­spei­cher kaputt geht, son­dern nur wann?

Opti­sche Medien

Selbst gebrann­te CDs, DVDs und Blu­Rays hal­ten in etwa fünf bis zehn Jah­re, bevor die orga­ni­sche Spei­cher­schicht zer­fällt und sie unles­bar wer­den. Gepress­te CDs, DVDs und BRs hal­ten bis zu 80 Jah­re. Ein­zig die M‑Discs sol­len laut Her­stel­ler angeb­lich bis zu 1.000 Jah­re hal­ten. Wobei die Fra­ge gestat­tet sein darf, womit man in 1.000 Jah­ren eine M‑Disc eigent­lich aus­le­sen kann.

Flash (NAND)-Medien

Flash­spei­cher, scheint von den digi­ta­len Daten­trä­gern bis­her der zuver­läs­sigs­te in Hin­blick auf die Lang­zeit­ar­chi­vie­rung zu sein. Er altert eigent­lich nur durch Lösch­vor­gän­ge, bei denen die Oxid­schicht der Spei­cher­zel­len immer wie­der leicht beschä­digt wird.

Ana­lo­ge Medi­en der Vergangenheit

Viel­leicht hast Du im Album noch Bil­der Dei­nes Urgroß­va­ters? Die­se kannst Du jeder­zeit und ohne Hilfs­mit­tel anse­hen. Stel­le Dir sich vor, er hät­te die Bil­der mit einer Art Digi­tal­ka­me­ra gemacht und auf einer Schell­lack­plat­te oder einer Wach­strom­mel abge­spei­chert – Du hät­test dann heu­te die glei­chen Pro­ble­me wie sie Dei­ne Kin­der mit Super-8-Fil­men haben und Dei­ne Enkel mit Digi­tal­ka­me­ra­bil­dern haben wer­den. Es wird schlicht kein Abspiel­ge­rät mehr geben oder zumin­dest nie­man­den, der ein vor­han­de­nes noch repa­rie­ren könnte.

soldat
(Mein Urgroß­va­ter in sei­nem zwei­ten Weltkrieg)

KB S8 Karten
(v.r.n.l.: 36mm Klein­bild­film, Super 8‑Filmkassette (unent­wi­ckelt), Smart­Me­di­a­Card, xD-Card)

Super 8
(
Kod­ak, ent­wi­ckel­te Super 8‑Filmrolle mit 250m Län­ge (ca. 33 min. Spiel­zeit), 1964)


Und heute?

Jeder Arbeits­platz­rech­ner hat die Spei­cher­ka­pa­zi­tät von Mil­li­ar­den Stein­ta­feln und zig hun­dert­tau­sen­den Büchern, die alle bei einem klei­nen Defekt schon unrett­bar ver­lo­ren sein kön­nen. Die anfal­len­de Daten­men­ge steigt auch in Pri­vat­haus­hal­ten rapi­de an. Es sind nicht nur die ein­ge­scann­ten Zeug­nis­se oder die elek­tro­ni­sche Steu­er­erklä­rung, es sind vor allem Bil­der und Vide­os, deren Spei­cher­platz­be­darf ste­tig steigen.

Nie­mand braucht soviel Speicherplatz!

Nicht nur Bill Gates bla­mier­te sich mit der Aus­sa­ge, dass kein Mensch mehr als 640 KB RAM benö­ti­ge. Auch Ver­käu­fer erzähl­ten damals ger­ne: „Die Fest­plat­te hat 10 Mega­byte! Die bekom­men Sie im Leben nicht voll!”. Heu­te sagen vie­le: „Mehr als ein Tera­byte gro­ße Fest­plat­ten benö­tigt kein Mensch!”. Die­se Sprü­che haben eines gemein­sam: Sie sind eben­so grif­fig wie falsch.

Mehr Infor­ma­tio­nen über den Speicherplatzbedarf

Hat­te ein Bild einer guten Digi­tal­ka­me­ra mit 1,3 Mega­pi­xeln im Jah­re 1999 nur rund 400 KB, so waren es fünf Jah­re spä­ter, bei 3.0 MP Auf­lö­sung, bereits 900 KB. Wei­te­re fünf Jah­re spä­ter waren 7.1 Mega­pi­xel üblich – die Spei­cher­kar­ten grö­ßer und bil­li­ger, die Kom­pri­mie­rung muss­te nicht mehr so stark sein – so dass hier etwa 3 Mega­byte an Daten für nur ein Bild anfie­len. Wie­der fünf Jah­re wei­ter mach­te die Spei­cher­tech­no­lo­gie enor­me Fort­schrit­te und immer mehr Kame­ras spei­cher­ten im soge­nann­ten RAW-For­mat (qua­si die Roh­da­ten aus dem Kame­ra­sen­sor) mit weni­ger Kom­pri­mie­rung und dadurch höhe­rer Qua­li­tät. Inner­halb von 15 Jah­ren stieg folg­lich die Auf­lö­sung um mehr als das zehn­fa­che und der Spei­cher­platz­be­darf erhöh­te sich auf knapp 13 MB pro Bild.

Ein Pra­xis­bei­spiel: gehen wir ein­mal von durch­ge­hend 1.000 Bil­dern im Jahr aus. In Wirk­lich­keit steigt die Anzahl der Bil­der natür­lich an, da die Leu­te durch die Kame­ras in den Han­dys auch mehr foto­gra­fie­ren. Wei­ter­hin gehen wir von einer durch­schnitt­li­chen Ver­dop­pe­lung der Mega­pi­xel alle fünf Jah­re aus. Grob und ver­ein­facht gesagt neh­men dann die Bil­der der neu­en Kame­ra bereits nach etwa zwei­ein­halb Jah­ren mehr Platz weg als alle Bil­der zusam­men, die man in den Jah­ren davor geschos­sen hat.

Hier als Bei­spiel mei­ne eige­ne Media­thek für den Zeit­raum zwi­schen 1999 und 2012:

Kamera Daten 1999 2012.003
(Wie viel Spei­cher­platz benö­tigt ein ein­zel­nes Bil­de der jewei­li­gen Kame­ra? Hier die Stei­ge­rung im Lau­fe der Jahre)

Kamera Daten 1999 2012.001
(Wie viel Spei­cher­platz neh­men die Bil­der der Kame­ra pro Jahr ins­ge­samt für sich in Anspruch?)

Kamera Daten 1999 2012.002
(Wie viel Platz neh­men die Bil­der der jewei­li­gen Jah­re pro­zen­tu­al von der gesam­ten Bil­der­samm­lung in Anspruch?)

Ein Fami­li­en­vi­deo in FullHD (1080p) benö­tigt um die 260 Giga­byte pro Stun­de – also das zwan­zig­fa­che. Mit Action­cams, die mit höhe­rer Bild­wie­der­hol­fre­quenz auf­neh­men kön­nen, kann sich die­ser Wert mehr als ver­dop­peln. Das SD-Video (576i) einer Mini-DV-Kame­ra benö­tig­te hin­ge­gen nur 12 GB pro Stun­de. Anders aus­ge­drückt: 1 Stun­de HD-Video benö­tigt soviel Spei­cher­platz wie 20 Stun­den SD-Video­ma­te­ri­al. Das liegt zum Teil auch an der ver­grö­ßer­ten Farb­tie­fe der HD-Vide­os. 4K-Vide­os benö­ti­gen etwa das 12-fache des Spei­cher­plat­zes von HD-Vide­os, also bereits 3TB die Stun­de. Bei 8K sind wir im pro­fes­sio­nel­len Bereich bei rund 10 Tera­byte pro Stun­de. Die­se Wer­te schwan­ken teils sehr stark, jeweils abhän­gig von dem gewähl­ten Kom­pri­mie­rungs­ver­fah­ren und ‑stu­fen.

Man sieht: 1 Tera­byte Spei­cher­platz ist „nichts”.

Daten­ver­lust vorprogrammiert?

Die Daten­men­gen stei­gen – und damit auch die Gefahr eines Daten­ver­lus­tes, da das ein­zel­ne Bild immer mehr Platz auf der Fest­plat­te belegt, aber die Daten­si­cher­heit des Medi­ums an sich nicht zuge­nom­men hat. Bereits im Jahr 2007 hat das CERN eine Stu­die zur „Silent Data Cor­rup­ti­on” ver­öf­fent­licht, bei der von 33.700 Datei­en bereits 22 Datei­en nicht mehr kor­rekt les­bar waren. Und hier­bei han­del­te es sich um ein Ser­ver­sys­tem mit den dort übli­chen Sicher­heits­sys­te­men zur Abwen­dung eines Daten­ver­lus­tes. Rech­ner im Haus­halt sind weit, weit unzuverlässiger.

Mehr Infor­ma­tio­nen zur Gefahr des Datenverlustes

Wir kön­nen also davon aus­ge­hen, dass min­des­tens eines von 1.000 Bil­der nicht mehr les­bar ist. In mei­ner eige­nen digi­ta­len Bil­der­samm­lung befin­den sich etwa 64.000 Bil­der. Ich kann also davon aus­ge­hen, dass bereits 64 Bil­der zer­stört wur­den. Da ich natür­lich die­se Bil­der in den ver­gan­ge­nen 17 Jah­ren zig mal beim Auf­rüs­ten des Rech­ners von einer Fest­plat­te auf eine ande­re kopiert habe, steigt die Feh­ler­ra­te natür­lich mas­siv an. Vide­os, die viel mehr Platz benö­ti­gen als Bil­der, sind gefähr­de­ter, da bei einem kom­pri­mier­ten Vide­os ein ein­zel­ner Feh­ler bereits irrepa­ra­bel sein kann.

Aber selbst wenn man heu­te eine Fest­plat­te, eine SSD, eine Blu­ray-Disc oder einen USB-Stick mit dem (feh­ler­frei­en!) Back­up der Fami­li­en­pho­tos und ‑vide­os in einen Tre­sor legt, so wer­den bereits unse­re Enkel nicht mehr ohne wei­te­res in der Lage sein, sich die­se Bil­der und Vide­os anzu­se­hen. Die Fest­plat­ten fin­den schlicht kei­nen geeig­ne­ten Anschluss am PC – oder was man dann auch immer als PC-Ersatz benutzt. Für die Blu­ray­discs wird es längst kei­ne Lauf­wer­ke mehr geben und auch USB-Sticks wer­den nicht mehr an den Rech­ner pas­sen. Von dem Datei­sys­tem, auf dem die­se Daten gespei­chert wur­den, oder den moder­nen Über­tra­gungs­we­gen wie HDMI, die Bild und Ton nur an „aut­ho­ri­sier­te” Gerä­te aus­ge­ben, gar kei­ne Rede.

Baby­lo­ni­sche Formatvielfalt

Kann Dein aktu­el­ler Com­pu­ter die Doku­men­te lesen, die Du vor 20 Jah­ren Dei­nem DOS-PC anver­traut hast? Moder­ne Rech­ner haben kein 3,5 Zoll-Dis­ket­ten­lauf­werk mehr, geschwei­ge denn eines für die sei­ner­zeit weit ver­brei­te­ten 5,25 Zoll Dis­ket­ten oder die noch grö­ße­ren und älte­ren 8 Zoll Dis­ket­ten. Erin­nerst Du Dich noch an Daten­trä­ger mit dem Namen Zip, LS120, QIC, DDS, MO oder Micro­dri­ve (Sin­c­lair /​ IBM)? Hast Du gar noch einen HD-DVD-Play­er zu Hau­se? Dei­ne Fami­li­en­vi­de­os befin­den sich auf Digital8- oder MiniDV-Kas­set­ten? Die Lieb­lings­songs Dei­ner Jugend hat­test Du auf DCC oder Mini­Disc? Das pas­sen­de Abspiel­ge­rät liegt noch im Kel­ler? Das funk­tio­niert auch noch?
Bist Du sicher?

Hier eini­ge Bei­spie­le für Daten­trä­ger, für die man nur noch schwer ein pas­sen­des Aus­le­se­ge­rät findet:

Ver­ges­se­ne Datenträger

- Loch­kar­te
– Video-Data-Sys­tem: ISA-Steck­kar­te umd Video­re­cor­der anzu­steu­ern Kapa­zi­tät auf 8h-Band: 736 MB, Geschwin­dig­keit: 1,33 MB/​min

3 zoll disks
(Hita­chi-Maxell, magne­ti­sche 3 Zoll Dis­ket­te, 180 KB pro Sei­te, Anfang 1980er)

DAT
(
HP/​Sony, magne­ti­sche DDS-1-Kas­set­te, 2 GB unkom­pri­miert, 1989)

benoulli
(Iome­ga, magne­ti­sche Ber­nouil­li-Disk, bis zu 230 MB, 1983)

SD Card offen
(San­Disk, offe­ner Flash­spei­cher SD-Card, ab 8 MB bis zu 2 TB (2016), 2001)

LS 120
(Iomega/​Imation, opto-magne­ti­sche 3,5″ Dis­ket­te LS-120, 120 MB, 1994)

QIC 80
(
3M, magne­ti­sche Band­cas­set­te QIC-80, 80 bis 500 MB, 1972)

tote speicherkarten
(Smart­Me­dia-Card (1996, Toshi­ba, 2–128MB), Com­pace­Flash-Card (1994, San­Disk,  bis 256GB) und xD-Card (2002, Olympus/​Fuji, bis 2GB)

5 25 C64 Disks
(5,25″ Dis­ket­te, bis 1,2 MB, Shug­art, 1976)

CF PCMCIA
(PCMCIA ATA Card Typ III (PCMCIA-Fest­plat­te), 1991, Com­pace­Flash-Card (1994, San­Disk, bis 256GB)

Nintendo Diskette
(Nin­ten­do Fami­con Disk Sys­tem (FDS), 65 KB, 1986)

Unse­re Enkel

Soll­ten es die Enkel aber doch schaf­fen, die Daten­trä­ger irgend­wie an den Rech­ner anzu­schlie­ßen, so wer­den die Betriebs­sys­te­me der Zukunft die Datei­sys­te­me und die Bil­der­da­ten längst nicht mehr aus­le­sen kön­nen. Es wird so sein, als ob die Daten in einer frem­den, längst ver­ges­se­nen Spra­che geschrie­ben wären. Kennst Du noch die Kod­ak Pho­to-CD oder For­ma­te wie aml, lbm oder msp? Daten kön­nen aber nicht nur durch das For­mat der Datei schwer zu lesen sein. Manch­mal ich der Erstel­ler der Datei auch dar­auf erpicht, dass nicht jeder an die Infor­ma­tio­nen her­an­kommt, die­se also ver­trau­lich sind.

Ver­schlüs­se­lung ist ein Problem

Ich fan­ge dabei gar nicht mal an von den (frei­wil­li­gen) Ver­schlüs­se­lungs­ver­fah­ren zu reden, die in unse­rer über­wach­ten Welt lei­der immer wich­ti­ger wer­den. Ich ver­lie­re auch kein Wort über die auf­ge­zwun­ge­ne digi­ta­le Rech­te­ver­wal­tung (DRM) oder das unsäg­li­che TPM, bei dem teil­wei­se nie­mand so genau weiß, wem die ein­zel­nen Schlüs­sel gehö­ren, woher sie eigent­lich stam­men und wer die Kon­trol­le dar­über hat. Das sind wei­te The­men­be­rei­che, die aber das digi­ta­le Erin­nern unmög­lich machen werden.

Wer besitzt Dein Leben?

Suche doch ein­mal bei Stu­diVZ nach einem alten Post von Dir… wie? Stu­diVZ und Schü­lerVZ gibt es nicht mehr? Kein The­ma, Du bist ja noch bei Wer-kennt-wen! Wie? Die haben auch in den Sack gehau­en? Aber bei fun​on​line​.de, da geht noch was, oder? Gut, dann suche eben bei Face­book. Wie jetzt? Face­book zu durch­su­chen geht prak­tisch nicht? Du kommst an Dei­ne eige­nen Bei­trä­ge nur mehr durch müh­sa­mes durch­blät­tern der Posts der letz­ten Jah­re ran? Gut, dann sicherst Du Dei­ne Time­li­ne und durch­suchst sie ben online. Wie bit­te? Das sichern funk­tio­niert nicht? Da bekommt man nur sei­ne Bil­der, nicht sei­ne Bei­trä­ge? Tja, Pech gehabt. Wenn Du Dei­ne eige­nen Bei­trä­ge nun frus­triert löschen löschen willst, geht das nur immer ein­zeln und mit je drei Klicks?
Aha.
Wer hat also die Macht über Dei­ne Daten?

Digi­ta­le Daten sind auf der ande­ren Sei­te extrem schnell zu ver­viel­fäl­ti­gen. Das kann schlecht sein, wenn jemand Ihr Bank­kon­to leer räumt, oder online mit Ihrer Iden­ti­tät im gro­ßen Stil shop­pen geht.
Das kann aber auch gut sein, sie­he den Fall um Edward Snow­den. Ihm wäre nie­mals gelun­gen die­se Daten­ber­ge unauf­fäl­lig außer Haus zu schaf­fen, wenn er einen Kopie­rer hät­te ein­set­zen müs­sen. In der Zeit, in der so ein Gerät eine Sei­te kopiert, wird ein gan­zer Leitz-Ord­ner auf einen USB-Stick kopiert. Aber neh­men wir an, er hät­te die­se Daten mit­neh­men kön­nen, so wäre jede wei­te­re Kopie schlech­ter les­bar gewe­sen und er hät­te damit nicht so schnell so vie­le Jour­na­lis­ten auf ein­mal mit den Infor­ma­tio­nen ver­sor­gen können.

Digi­ta­le Daten sind so oder so gefähr­det. Ent­we­der, weil ver­trau­li­che Daten in fal­sche Hän­de kom­men kön­nen, oder weil sie von eher flüch­ti­ger Natur sind.

Daten­schutz und Bil­dung im Neuland

Wir freu­en uns über Whist­leb­lower. Sie ste­hen unge­ach­tet ihrer Beweg­grün­de für Demo­kra­tie und (digi­ta­le) Frei­heit. Auf der ande­ren Sei­te wol­len wir aber eben­falls die (ver­meint­li­che) Kon­trol­le über unse­re eige­nen Daten behal­ten. Face­book ist böse, Goog­le eine üble Daten­kra­ke. Alle wol­len mit unse­ren Daten Geld ver­die­nen. Also geben wir ihnen so wenig Daten wie mög­lich. Glau­ben wir jeden­falls. Jeder, der das Netz benutzt hin­ter­lässt aber auch immer Spu­ren. Und sei es die Kom­bi­na­ti­on aus der Hard­ware und Soft­ware, die wir benut­zen, die einem Fin­ger­ab­druck schon sehr nahe kommt. Stich­wort: Brow­ser Fin­ger­prin­ting.

In Zei­ten des Ter­rors glau­ben vie­le, dass „bes­se­re” Geset­ze mehr Schutz bie­ten wür­den. Alle die­se Geset­ze haben aber nur ein Ziel: noch mehr Über­wa­chung! „Aber ich habe doch nichts zu ver­ber­gen!”, hört man den deut­schen Michel, der einem Gar­ten­zwerg gleich, stau­nend über Mer­kels Neu­land blickt, dabei aber ver­gisst, wer wirk­lich der größ­te Daten­händ­ler ist.
Goog­le Earth schaut in Eure Vorgärten?
Falsch!
Face­book ver­kauft Dei­ne Wohnanschrift?
Falsch!
Es sind die Gemein­den, die uns aus­spio­nie­ren und unse­re Daten ver­scha­chern. Jeder Häus­le­bau­er hat schon ein­mal eine Berech­nung über die ver­sie­gel­te Flä­che sei­nes Grund­stü­ckes bekom­men. Das hat die Gemein­de nicht Goog­le Earth nach­ge­se­hen, nein! Sie hat sel­ber die Bil­der von den Häu­sern der Bür­ger machen las­sen. Sie erhebt sel­ber, wie alt die Autos im Schnitt im Wohn­ge­biet sind. Und danach wer­den die Daten der Bür­ger im Paket ver­kauft.

Das Inter­net ver­gisst nicht?

Wir hören auch oft: “Das Inter­net ver­gisst nichts!”. Das macht es nur sehr kurz­fris­tig nicht, wie jeder merkt, der im Daten­meer nach tech­ni­schen Unter­la­gen oder Berich­ten aus ers­ter Hand zu poli­ti­schen oder gesell­schaft­li­chen Ereig­nis­sen fischt. Geht man nach dem Inter­net, so exis­tiert die Mensch­heit erst ca. Mit­te der 1990er Jah­re – alles was davor geschah, fin­det man nur noch als spä­ter nie­der­ge­schrie­be­ne Berich­te. Zeit­ge­nös­si­sche Arti­kel aus den 90er Jah­ren und frü­her haben es kaum in das welt­wei­te digi­ta­le Netz geschafft, auch wenn es auch dafür Bestre­bun­gen gibt.

Als pla­ka­ti­ves Bei­spiel kann ich die Zeit­schrift c’t aus dem Hei­se-Ver­lag nen­nen. Da der Ver­lag kei­ne Rech­te an der abge­druck­ten Wer­bung inne­hält, fin­det man die­se auch nicht in den digi­ta­len Heft­ar­chiv. Das ist tat­säch­lich ein Ver­lust, wenn man nicht nur die rei­ne Infor­ma­ti­on benö­tigt, son­dern sich auch ein umfas­sen­de­res Bild der Zeit machen möch­te, in der der Arti­kel ent­stand. Wer­bung bleibt im Kopf, das ist kei­ne Bin­sen­weis­heit. Für den Pri­vat­ge­brauch schnitt ich ein­mal unter­schied­li­che Fern­seh­wer­bun­gen zusam­men. Haupt­au­gen­merk rich­te­te ich auf Wer­bung für Com­pu­ter und Video­ga­mes. Die­se misch­te ich mit Wer­bung von Ver­si­che­run­gen, Wasch­mit­tel, Süßig­kei­ten und Kraft­fahr­zeu­gen. Auf Aus­stel­lun­gen zeig­te ich das Video vie­len Besu­chern. Alle staun­ten sel­ber dar­über, dass sie die tech­nik-frem­de Wer­bung zeit­lich viel näher an der Gegen­wart ver­or­te­ten, als die für die digi­ta­len Geräte.

Ret­tungs­be­mü­hun­gen

Mitt­ler­wei­le gibt es Bestre­bun­gen, wie das Pro­jekt Guten­berg, alte Schrif­ten in die digi­ta­le Welt zu ret­ten, aber sind die dar­aus erstell­ten Datei­en auch wirk­lich sicher? Wer­den die Com­pu­ter in 100 Jah­ren die­se Datei­en über­haupt noch lesen können?

Selbst wenn die Daten noch phy­si­ka­lisch les­bar wären und nicht durch Alte­rungs­er­schei­nun­gen auf dem Medi­um unrett­bar ver­lo­ren sind, so man­gelt es immer an den Lese­ge­rä­ten, denn die­se wur­den meist dem Recy­cling zugeführt.

CD RW Laufwerk
(CD-RW-Lauf­werk, bis 900 MB Taio Yuden, 1988)

Arten von Daten (gro­be Einteilung)

Pri­va­te Daten

Die­se sind dezen­tral gespei­chert. Zyni­ker könn­ten anfüh­ren, dass die NSA und ande­re Geheim­diens­te die­se Daten „für uns” spei­chern wür­den, aber selbst dafür fehlt denen die Spei­cher­ka­pa­zi­tät. Ich schät­ze den pri­va­ten Daten­satz pro Jahr auf ca. 100 GB (Stand 2015), ten­denz stark stei­gend. Mit immer grö­ße­ren Dau­er­da­ten­spei­chern (Fest­plat­ten/SSDs/SD-Cards) und immer hoch­auf­lö­sen­de­ren Kame­ras in Foto­ap­pa­ra­ten, Video­ka­me­ras, Mobil­te­le­fo­nen, Action­cams und Dash­cams stei­gen die anfal­len­den Daten­men­gen rapi­de an. Ob alles davon für die Nach­welt erhal­tens­wert ist, sei dahin­ge­stellt. „Lus­ti­ge” Kat­zen­vi­de­os zei­chen aber viel­leicht ein ähn­li­ches (Zerr-)Bild unse­rer Gesell­schaft wie der See­len­strip Her­an­wach­sen­der auf You­tube. Aus­sor­tie­ren und bewer­ten kann die­se aber kein Mensch und (noch) kei­ne Maschine.

Wirt­schaft­li­che Daten

Die­se sind eben­falls dezen­tral gespei­chert. Welt­wei­te Kon­zer­ne wer­den dabei in der Regel ein bes­se­res, zen­tra­le­res und umfang­rei­che­res Daten­ma­nage­ment haben als der klei­ne Hand­wer­ker um die Ecke. Sie­he dazu wei­ter unten: „Big Data”. Aber die Quint­essenz die­ser Daten wird letzt­lich dann doch noch zen­tral auf Staats­ebe­ne gespei­chert: bei den Finanzämtern.

Staat­li­che Daten

Unser Staat (Bund, Län­der, Krei­se und Gemein­den) ist tat­säch­lich einer der größ­ten Daten­samm­ler und ‑händ­ler. Wer glaubt, dass z.B. die Bil­der auf Goog­le Earth vom Goog­le-Kon­zern gemacht oder gar auch nur beauf­tragt wur­den, der liegt gründ­lich falsch. Unser eige­ner Staat macht die hoch­auf­lö­sen­den Bil­der unse­rer Häu­ser und Vor­gär­ten. Spä­tes­tens wenn die Was­ser­wer­ke die Abrech­nung für die Flä­chen­ver­sie­ge­lung mit Luft­auf­nah­men des eige­nen Gründ­stü­ckes bele­gen, soll­te doch klar sein, wel­chen Sinn die Auf­nah­men haben. Eben­so wer­den die

Kul­tu­rel­le Daten

Wie oben ange­führt zäh­len dazu auch Com­pu­ter- und Video­spie­le. Bei dem Wort „Kul­tur” denkt aber jeder­mann zu Recht an Lite­ra­tur, Musik oder bil­den­de Küns­te. Lite­ra­tur, Musik und Fil­me las­sen sind gut digi­tal abspei­chern. Wenn es aber um klas­si­sche Male­rei, Buch­dru­cker­kunst oder hand­werk­li­che Küns­te geht, ist eine digi­ta­le Abtas­tung zwar mög­lich, wird der Kunst aber viel­leicht nicht gerecht. Hin­zu kom­men recht­li­che Fra­gen wie das Urheberrecht.

Wis­sen­schaft­li­che Daten

Wis­sen­schaft­li­che Daten las­sen sich heu­te sehr gut archi­vie­ren, denn sie wer­den meist auch digi­tal ver­öf­fent­licht. Aber auch hier gibt es wie­der (Urhe­ber-) recht­li­che Probleme.

Ist „Big Data” die Lösung?

Schwie­ri­ge Fra­ge. Die Grund­idee ist dabei das mas­si­ve Sam­meln aller Daten, deren man hab­haft wer­den kann, damit man sie aus­wer­ten kann – wenn nicht jetzt, dann viel­leicht in eini­gen Jah­ren, wenn die Rechen­leis­tung wei­ter ange­stie­gen ist. Ob die Rechen­leis­tung jemals stär­ker stei­gen wird als die Daten­men­ge ist aber zwei­fel­haft. Mit unse­rer heu­ti­gen, grund­le­gen­den Com­pu­ter­tech­nik wird das wohl eher nicht der Fall sein. Wie dem auch sei. Es wer­den also (weit­ge­hend unkon­trol­liert) gigan­ti­sche Daten­men­gen ange­häuft. Aber eben zumeist mit kom­mer­zi­el­len Hin­ter­ge­dan­ken, weil man hofft, dass die­se Daten einen mone­tä­ren Wert dar­stel­len. Ist es aber von gesell­schaft­li­chen oder kul­tu­rel­len Inter­es­se, wer wann wo was ange­klickt hat, oder wer wann wo etwas gekauft hat? Für das Gesamt­bild ist das sicher­lich völ­lig unin­ter­es­sant. Big Data ist kei­ne Lösung des Pro­blems der digi­ta­len Demenz, denn es wür­de ewig dau­ern, aus die­ser unvoll­stell­ba­ren digi­ta­len Müll­kip­pe rele­van­te kul­tu­rel­le Infor­ma­tio­nen her­aus­zu­fil­tern – wenn die dort über­haupt gespei­chert sind. Für kom­mer­zi­el­le oder geheim­dienst­li­che Belan­ge ist Big Data sicher deut­lich inter­es­san­ter. Als Gesell­schaft bringt es uns aber nicht weiter.

Fazit

Die Zeit drängt, denn digi­ta­le Daten sind flüch­tig und ken­nen kein ver­blas­sen oder abblät­tern­de Far­be. Wenn sie ver­lo­ren sind, dann für immer. Das Erbe der digi­ta­len Revo­lu­ti­on steht auf dem Spiel.

Die Auf­ar­bei­tung und Bewah­rung der Tech­no­lo­gie­his­to­rie ist mass­geb­li­che Vor­aus­set­zung, in einer immer kom­ple­xer und schnel­ler wer­den­den Welt, die Wur­zeln des Com­pu­ter­zeit­al­ters zu ver­ste­hen und dadurch des­sen Zukunft gestal­ten zu können.

Schreibe einen Kommentar

Ich bin mit der Datenschutzerklärung und der Speicherung meiner eingegebenen Daten einverstanden.