Was ist eigentlich Big Data?

Was ist Big Data und warum betrifft mich das überhaupt persönlich? Wer sammelt meine persönlichen Daten? Und warum? Was geschieht damit? Ist Big Data gefährlich? Was hat Big Data mit Datenschutz zu tun? Warum brauchen wir dafür Regeln? Warum ist unsere Politik damit eigentlich überfordert?

Datamining
Früher schürfte man nach Gold und Diamanten, grub nach Kohle und bohrte nach Öl. Der Rohstoff nach dem es der digitalen Industrie gelüstet, sind Daten. Unglaublich viele Daten. Diese gewinnt man durch das sogenannte Datamining. Minen finden sich gewöhnlich in Bergen. In unserem Fall ist es ein ganzes Gebirge. Nennen wir es „Big Data“. Dessen Berge sind nicht geologisch gewachsen, sie sind von uns aufgehäuft worden und wachsen immer noch. Sehr rasant sogar. Sanfte Hügel und grüne Täler finden wir dort kaum. Datamining braucht massive Gebirge. Die wenigen Ausläufer dieses Gebirgszuges wurden von kleinen Firmen und selbstständigen Entwicklern gestaltet. Diese sammeln zum Beispiel Daten der Nutzer ihrer Handyspiele.

Der Mount Everest unter diesen Bergen dürfte der Mount Facebook sein. Beim Graben bilden sich große Abraumhalden aus Katzenvideos, Essensfotos („Foodporn“), Einhornbildern, peinlichen Memes (voller Rechtschreibfehler) – und immer gleichen Geburtstagsglückwünschen.

Viele Giftstoffe wie Pornos, Tierquälerei, Enthauptungsvideos und Aufrufe zur Gewalt werden ausgefiltert, bevor sie den Mount Facebook erreichen und höher machen könnten. Da Menschen weltweit zum Wachstum des Berges beitragen, ist die Bewertung, was ein Giftstoff ist, in jedem Kulturkreis eine andere.

Facebook gräbt sich durch diesen gigantischen Berg. Auf der Suche nach Informationen, die es ermöglichen den Touristen (Benutzer) am Fuße des Berges ein schönes Panorama („optimales Nutzererlebnis“) zu bescheren – und natürlich perfekt passende Werbung zu offerieren.

Wenn wir völlig unkritisch mit uns selbst sind und jeden Mist in Facebook und ähnliche Plattformen pumpen,
dann haben wir nichts gewonnen.
David Kriesel, 33c3

Soziale Netzwerke sind also Teufelszeug?
Es wäre unfair, würden wir jetzt Facebook, Google & Co alleine an den Pranger stellen, denn es gibt noch genügend andere imposante Berge im Big-Data-Massiv. Die können wir nur sehr schwer entdecken. Es glitzern keine Schneekoppen auf deren Gipfeln. Sie liegen unauffällig im Schatten.

Zum Wachsen all dieser Datenberge tragen wir selber aktiv bei. Wir könnten einfach aufhören, Puzzleteile unseres Lebens an die sozialen Netzwerke oder über Instantmessanger weiterzugeben.
Problem gelöst!
Stimmt das wirklich?
Natürlich nicht.


Was ist also wirklich Big Data?

Eigentlich ist Big Data vor allem eines: große, unstrukturierte Datenmengen. Diese Daten werden meist bei Firmen und staatlichen Stellen mit Hilfe von Algorithmen verarbeitet. Daten aus verschiedenen Quellen sind oft unterschiedlich formatiert und können sich teilweise widersprechen. Ein Algorithmus ist ein „Problemlöser“, ein Computerprogramm, welches eingehende Daten verarbeitet und eine Ausgabe nach vorgegebenen Parametern generiert. Algorithmen sind von Menschen gemacht und daher selten (bis gar nicht) neutral. Big Data ist im Prinzip die Suche nach der Nadel im Heuhaufen – nur eben sehr viel schneller und deutlich erfolgversprechender.

Daten sind also die Währung unserer Zeit. Sie werden gerne nach dem Motto „Haben ist besser als brauchen!“ erfasst. Auch ohne unsere aktive Mithilfe. Datenerfassung ist leicht, billig und geschieht ohne umständliche Fragebögen oder Formulare. Ohne unser aktives Zutun. Ohne unsere Zustimmung. Ganz unbemerkt. Ganz nebenbei. Die Vorgehensweisen widersprechen dabei sehr oft dem Bundesdatenschutzgesetz. Aber man kann den Firmen und Institutionen nur in den seltensten Fällen nachweisen, in welchem Umfang sie unsere Daten sammeln und auswerten.

„Polizisten speichern, was sie wissen, elektronisch ein – alles kann ja irgendwann und irgendwie mal wichtig sein.“
(Extrabreit, „Polizisten“, 1981)


Die weißen Ritter kommen?

Immer wieder versprechen Firmen ihren Kunden hohen Datenschutz. Stellvertretend dafür nehme ich eine bekannte Firma aus Cupertino. Apple hat den Ruf eines Datenschützers. Den pflegt die Firma sehr gerne. Apple Smartphones sollen die Daten des Benutzers besser schützen als Telefone mit Googles Android. Persönlich habe ich daran aber Zweifel. Jedes Unternehmen will seine Kunden verstehen, damit es sie besser binden kann. Dazu braucht das Unternehmen Daten. Persönliche Daten.

Google verkauft Werbung, das ist klar.
Die muss passen, sonst wird sie nicht akzeptiert.
Dazu brauche ich Nutzer- und Nutzungsdaten.

Apple verkauft Hardware, das ist klar.
Die muss passen, sonst wird sie nicht akzeptiert.
Dazu brauche ich Nutzer- und Nutzungsdaten.

Apple verspricht, dass sie die Daten nicht herausgeben. Nicht einmal an Geheimdienste! Ob sich selbst die wertvollste Firma der Welt tatsächlich gegen den eigenen Staat stellt, wenn es um den Schutz der persönlichen Daten ihrer Kunden geht?
Egal wie die Antwort ausfällt: sie beunruhigt mich.


Also ist Big Data per se böse?

Natürlich nicht! Big Data bietet der Menschheit unglaubliche Chancen, verheißt tatsächlich einen deutlich schnelleren Fortschritt und kann Antworten auf drängende Fragen geben. Vielleicht sogar auf die Frage nach „dem Sinn des Lebens, dem Universum und dem ganzen Rest„. Die Antwort wird dabei sicher nicht, wie Douglas Adams prophezeite, „42“ sein, sondern tatsächlich brauchbar. Die Hoffnung ist, dass wir, wenn wir nur genügend Daten zur Verfügung haben, eine Struktur in den Dingen sehen und Antworten finden können. Gerade in den Bereichen künstlicher Intelligenz (was ich mit äußersten Magengrimmen betrachte), Medizin und Physik sind die sich anbahnenden Möglichkeiten wirklich phantastisch. Dazu brauchen wir wirklich jede Menge Daten.

Aber brauchen wir Big Data um die Menschen – uns selber – zu bewerten und zu kategorisieren? Ganz sicher nicht. Dies würde zu einer neuen Klassengesellschaft führen, es wäre der soziale und gesellschaftliche Rücksturz in längst hinter uns geglaubte Jahrhunderte. Personenbezogene Daten dürfen im Rahmen von Big Data nur anonymisiert verwendet werden, sonst führt dies in eine Diktatur der Algorithmen. Oder sogar in eine Art Religionsersatz?

Du wirst nun einwenden, dass ich mit hinreichend zur Verfügung stehenden Daten jedermann eindeutig identifizieren kann, selbst wenn ich nur anonymisierte Daten zur Verfügung habe. Das ist vollkommen korrekt. Deswegen brauchen wir dringend gesetzliche Rahmenbedingungen und wirklich empfindliche Strafen für diejenigen, die Big Data z.B. für wirtschaftliche Zwecke missbrauchen wollen und dafür Personen entanonymisieren. Solch eine Vorgehensweise widerspricht eindeutig den ersten beiden Absätzen des Artikel 1 des Grundgesetzes:

 

(1) Die Würde des Menschen ist unantastbar. Sie zu achten und zu schützen ist Verpflichtung aller staatlichen Gewalt.

(2) Das Deutsche Volk bekennt sich darum zu unverletzlichen und unveräußerlichen Menschenrechten
als Grundlage jeder menschlichen Gemeinschaft, des Friedens und der Gerechtigkeit in der Welt.

 

Unsere Dauerkanzlerin Angela Merkel fordert, dass Datenschutz Big Data nicht verhindern darf. Ich widerspreche ihr dabei im Prinzip nicht, denn verhindern kann und wird der Datenschutz Big Data nicht. Aber zur Sicherung des gesellschaftlichen Friedens brauchen wir strenge Regeln für Nutzung von Big Data. Deshalb benötigen wir die Datenschutzbeauftragten der Länder und den des Bundes.

Big Data ist kein Spielzeug für die Mächtigen in Politik und Wirtschaft. Wenn wir Deutschland fit für die digitale Zukunft machen wollen, dann brauchen wir selbstverständlich flächendeckend schnelles Internet, eine gute Ausbildung unserer Kinder und auch (und vor allem) Netzneutralität. Deutschland muss führend werden der Gestaltung der digitalen Zukunft. Das wird aber mit den meisten aktuellen Politikern (gleich welcher Partei oder „Alternative“) nicht durchsetzbar sein, denn die sind aus einer längst vergangenen, analogen Zeit. Bestes Beispiel ist Günther Oettinger, Digitalkommissar, Marionette und Sprachrohr der Lobbyisten. Wir brauchen junge Menschen in der Politik, wir brauchen dort digital Natives.
Und eine Kontrolle durch die Datenschützer.

Über den Autor

Hessi

Hessi

Michael "Hessi" Heßburg ist ein erfahrener Technik-Enthusiast und ehemaliger Informatiker. Seine Website, die er seit über 25 Jahren betreibt, deckt vielfältige Themen ab, darunter Haus & Garten, Hausrenovierung, IT, 3D-Druck, Retrocomputing und Autoreparatur. Zudem behandelt er gesellschaftspolitische Themen wie Datenschutz und Überwachung. Hessi ist seit 20 Jahren freiberuflicher Autor und bietet in seinem Blog fundierte Einblicke und praktische Tipps. Seine Beiträge sind sorgfältig recherchiert und leicht verständlich, um Leser bei ihren Projekten zu unterstützen.

Schreibe einen Kommentar

Ich bin mit der Datenschutzerklärung und der Speicherung meiner eingegebenen Daten einverstanden.