Was ist eigent­lich Big Data?

Lese­dau­er 5 Minu­ten

Was ist Big Data und war­um betrifft mich das über­haupt per­sön­lich? Wer sam­melt mei­ne per­sön­li­chen Daten? Und war­um? Was geschieht damit? Ist Big Data gefähr­lich? Was hat Big Data mit Daten­schutz zu tun? War­um brau­chen wir dafür Regeln? War­um ist unse­re Poli­tik damit eigent­lich überfordert?

Data­mi­ning
Frü­her schürf­te man nach Gold und Dia­man­ten, grub nach Koh­le und bohr­te nach Öl. Der Roh­stoff nach dem es der digi­ta­len Indus­trie gelüs­tet, sind Daten. Unglaub­lich vie­le Daten. Die­se gewinnt man durch das soge­nann­te Data­mi­ning. Minen fin­den sich gewöhn­lich in Ber­gen. In unse­rem Fall ist es ein gan­zes Gebir­ge. Nen­nen wir es „Big Data“. Des­sen Ber­ge sind nicht geo­lo­gisch gewach­sen, sie sind von uns auf­ge­häuft wor­den und wach­sen immer noch. Sehr rasant sogar. Sanf­te Hügel und grü­ne Täler fin­den wir dort kaum. Data­mi­ning braucht mas­si­ve Gebir­ge. Die weni­gen Aus­läu­fer die­ses Gebirgs­zu­ges wur­den von klei­nen Fir­men und selbst­stän­di­gen Ent­wick­lern gestal­tet. Die­se sam­meln zum Bei­spiel Daten der Nut­zer ihrer Handyspiele.

Der Mount Ever­est unter die­sen Ber­gen dürf­te der Mount Face­book sein. Beim Gra­ben bil­den sich gro­ße Abraum­hal­den aus Kat­zen­vi­de­os, Essens­fo­tos („Food­porn”), Ein­horn­bil­dern, pein­li­chen Memes (vol­ler Recht­schreib­feh­ler) – und immer glei­chen Geburtstagsglückwünschen.

Vie­le Gift­stof­fe wie Por­nos, Tier­quä­le­rei, Ent­haup­tungs­vi­de­os und Auf­ru­fe zur Gewalt wer­den aus­ge­fil­tert, bevor sie den Mount Face­book errei­chen und höher machen könn­ten. Da Men­schen welt­weit zum Wachs­tum des Ber­ges bei­tra­gen, ist die Bewer­tung, was ein Gift­stoff ist, in jedem Kul­tur­kreis eine andere.

Face­book gräbt sich durch die­sen gigan­ti­schen Berg. Auf der Suche nach Infor­ma­tio­nen, die es ermög­li­chen den Tou­ris­ten (Benut­zer) am Fuße des Ber­ges ein schö­nes Pan­ora­ma („opti­ma­les Nut­zer­erleb­nis“) zu besche­ren – und natür­lich per­fekt pas­sen­de Wer­bung zu offerieren.

Wenn wir völ­lig unkri­tisch mit uns selbst sind und jeden Mist in Face­book und ähn­li­che Platt­for­men pumpen, 
dann haben wir nichts gewon­nen.
David Krie­sel, 33c3

Sozia­le Netz­wer­ke sind also Teufelszeug?
Es wäre unfair, wür­den wir jetzt Face­book, Goog­le & Co allei­ne an den Pran­ger stel­len, denn es gibt noch genü­gend ande­re impo­san­te Ber­ge im Big-Data-Mas­siv. Die kön­nen wir nur sehr schwer ent­de­cken. Es glit­zern kei­ne Schnee­kop­pen auf deren Gip­feln. Sie lie­gen unauf­fäl­lig im Schatten.

Zum Wach­sen all die­ser Daten­ber­ge tra­gen wir sel­ber aktiv bei. Wir könn­ten ein­fach auf­hö­ren, Puz­zle­tei­le unse­res Lebens an die sozia­len Netz­wer­ke oder über Instant­mess­an­ger weiterzugeben.
Pro­blem gelöst!
Stimmt das wirklich?
Natür­lich nicht.

big data Wortwolke 800


Was ist also wirk­lich Big Data?

Eigent­lich ist Big Data vor allem eines: gro­ße, unstruk­tu­rier­te Daten­men­gen. Die­se Daten wer­den meist bei Fir­men und staat­li­chen Stel­len mit Hil­fe von Algo­rith­men ver­ar­bei­tet. Daten aus ver­schie­de­nen Quel­len sind oft unter­schied­lich for­ma­tiert und kön­nen sich teil­wei­se wider­spre­chen. Ein Algo­rith­mus ist ein „Pro­blem­lö­ser“, ein Com­pu­ter­pro­gramm, wel­ches ein­ge­hen­de Daten ver­ar­bei­tet und eine Aus­ga­be nach vor­ge­ge­be­nen Para­me­tern gene­riert. Algo­rith­men sind von Men­schen gemacht und daher sel­ten (bis gar nicht) neu­tral. Big Data ist im Prin­zip die Suche nach der Nadel im Heu­hau­fen – nur eben sehr viel schnel­ler und deut­lich erfolgversprechender.

Daten sind also die Wäh­rung unse­rer Zeit. Sie wer­den ger­ne nach dem Mot­to „Haben ist bes­ser als brau­chen!” erfasst. Auch ohne unse­re akti­ve Mit­hil­fe. Daten­er­fas­sung ist leicht, bil­lig und geschieht ohne umständ­li­che Fra­ge­bö­gen oder For­mu­la­re. Ohne unser akti­ves Zutun. Ohne unse­re Zustim­mung. Ganz unbe­merkt. Ganz neben­bei. Die Vor­ge­hens­wei­sen wider­spre­chen dabei sehr oft dem Bun­des­da­ten­schutz­ge­setz. Aber man kann den Fir­men und Insti­tu­tio­nen nur in den sel­tens­ten Fäl­len nach­wei­sen, in wel­chem Umfang sie unse­re Daten sam­meln und aus­wer­ten.

„Poli­zis­ten spei­chern, was sie wis­sen, elek­tro­nisch ein – alles kann ja irgend­wann und irgend­wie mal wich­tig sein.”
(Extra­breit, „Poli­zis­ten”, 1981)


Die wei­ßen Rit­ter kommen?

Immer wie­der ver­spre­chen Fir­men ihren Kun­den hohen Daten­schutz. Stell­ver­tre­tend dafür neh­me ich eine bekann­te Fir­ma aus Cup­er­ti­no. Apple hat den Ruf eines Daten­schüt­zers. Den pflegt die Fir­ma sehr ger­ne. Apple Smart­pho­nes sol­len die Daten des Benut­zers bes­ser schüt­zen als Tele­fo­ne mit Goo­g­les Android. Per­sön­lich habe ich dar­an aber Zwei­fel. Jedes Unter­neh­men will sei­ne Kun­den ver­ste­hen, damit es sie bes­ser bin­den kann. Dazu braucht das Unter­neh­men Daten. Per­sön­li­che Daten.

Goog­le ver­kauft Wer­bung, das ist klar.
Die muss pas­sen, sonst wird sie nicht akzeptiert.
Dazu brau­che ich Nut­zer- und Nutzungsdaten.

Apple ver­kauft Hard­ware, das ist klar.
Die muss pas­sen, sonst wird sie nicht akzeptiert.
Dazu brau­che ich Nut­zer- und Nutzungsdaten.

Apple ver­spricht, dass sie die Daten nicht her­aus­ge­ben. Nicht ein­mal an Geheim­diens­te! Ob sich selbst die wert­volls­te Fir­ma der Welt tat­säch­lich gegen den eige­nen Staat stellt, wenn es um den Schutz der per­sön­li­chen Daten ihrer Kun­den geht?
Egal wie die Ant­wort aus­fällt: sie beun­ru­higt mich.


Also ist Big Data per se böse?

Natür­lich nicht! Big Data bie­tet der Mensch­heit unglaub­li­che Chan­cen, ver­heißt tat­säch­lich einen deut­lich schnel­le­ren Fort­schritt und kann Ant­wor­ten auf drän­gen­de Fra­gen geben. Viel­leicht sogar auf die Fra­ge nach „dem Sinn des Lebens, dem Uni­ver­sum und dem gan­zen Rest”. Die Ant­wort wird dabei sicher nicht, wie Dou­glas Adams pro­phe­zei­te, „42” sein, son­dern tat­säch­lich brauch­bar. Die Hoff­nung ist, dass wir, wenn wir nur genü­gend Daten zur Ver­fü­gung haben, eine Struk­tur in den Din­gen sehen und Ant­wor­ten fin­den kön­nen. Gera­de in den Berei­chen künst­li­cher Intel­li­genz (was ich mit äußers­ten Magen­grim­men betrach­te), Medi­zin und Phy­sik sind die sich anbah­nen­den Mög­lich­kei­ten wirk­lich phan­tas­tisch. Dazu brau­chen wir wirk­lich jede Men­ge Daten.

Aber brau­chen wir Big Data um die Men­schen – uns sel­ber – zu bewer­ten und zu kate­go­ri­sie­ren? Ganz sicher nicht. Dies wür­de zu einer neu­en Klas­sen­ge­sell­schaft füh­ren, es wäre der sozia­le und gesell­schaft­li­che Rück­sturz in längst hin­ter uns geglaub­te Jahr­hun­der­te. Per­so­nen­be­zo­ge­ne Daten dür­fen im Rah­men von Big Data nur anony­mi­siert ver­wen­det wer­den, sonst führt dies in eine Dik­ta­tur der Algo­rith­men. Oder sogar in eine Art Religionsersatz?

Du wirst nun ein­wen­den, dass ich mit hin­rei­chend zur Ver­fü­gung ste­hen­den Daten jeder­mann ein­deu­tig iden­ti­fi­zie­ren kann, selbst wenn ich nur anony­mi­sier­te Daten zur Ver­fü­gung habe. Das ist voll­kom­men kor­rekt. Des­we­gen brau­chen wir drin­gend gesetz­li­che Rah­men­be­din­gun­gen und wirk­lich emp­find­li­che Stra­fen für die­je­ni­gen, die Big Data z.B. für wirt­schaft­li­che Zwe­cke miss­brau­chen wol­len und dafür Per­so­nen ent­an­ony­mi­sie­ren. Solch eine Vor­ge­hens­wei­se wider­spricht ein­deu­tig den ers­ten bei­den Absät­zen des Arti­kel 1 des Grundgesetzes:

 

(1) Die Wür­de des Men­schen ist unan­tast­bar. Sie zu ach­ten und zu schüt­zen ist Ver­pflich­tung aller staat­li­chen Gewalt.

(2) Das Deut­sche Volk bekennt sich dar­um zu unver­letz­li­chen und unver­äu­ßer­li­chen Menschenrechten
als Grund­la­ge jeder mensch­li­chen Gemein­schaft, des Frie­dens und der Gerech­tig­keit in der Welt.

 

Unse­re Dau­er­kanz­le­rin Ange­la Mer­kel for­dert, dass Daten­schutz Big Data nicht ver­hin­dern darf. Ich wider­spre­che ihr dabei im Prin­zip nicht, denn ver­hin­dern kann und wird der Daten­schutz Big Data nicht. Aber zur Siche­rung des gesell­schaft­li­chen Frie­dens brau­chen wir stren­ge Regeln für Nut­zung von Big Data. Des­halb benö­ti­gen wir die Daten­schutz­be­auf­trag­ten der Län­der und den des Bundes.

Big Data ist kein Spiel­zeug für die Mäch­ti­gen in Poli­tik und Wirt­schaft. Wenn wir Deutsch­land fit für die digi­ta­le Zukunft machen wol­len, dann brau­chen wir selbst­ver­ständ­lich flä­chen­de­ckend schnel­les Inter­net, eine gute Aus­bil­dung unse­rer Kin­der und auch (und vor allem) Netz­neu­tra­li­tät. Deutsch­land muss füh­rend wer­den der Gestal­tung der digi­ta­len Zukunft. Das wird aber mit den meis­ten aktu­el­len Poli­ti­kern (gleich wel­cher Par­tei oder „Alter­na­ti­ve”) nicht durch­setz­bar sein, denn die sind aus einer längst ver­gan­ge­nen, ana­lo­gen Zeit. Bes­tes Bei­spiel ist Gün­ther Oettin­ger, Digi­tal­kom­mis­sar, Mario­net­te und Sprach­rohr der Lob­by­is­ten. Wir brau­chen jun­ge Men­schen in der Poli­tik, wir brau­chen dort digi­tal Nati­ves.
Und eine Kon­trol­le durch die Datenschützer.

Schreibe einen Kommentar

Ich bin mit der Datenschutzerklärung und der Speicherung meiner eingegebenen Daten einverstanden.