Hashtag Big Data
Hashtag Big Data
Der Text ist eine Seminararbeit, erscheint in einem Hochschulmagazin und richtet sich an Laien, die von Big Data und Datensammlung wenig bis keine Ahnung haben.
„Wir beenden deine Beziehung bevor du überhaupt weißt, dass du sie beenden möchtest! “ so oder so ähnlich könnte schon bald ein neuer Dienst von Facebook heißen. Man klicke hier und bestätige da, der Schlussmacher wurde aktiviert und hat seine Aufgabe erledigt. Dieses Szenario ist keine Wahnvorstellung, denn das soziale Netzwerk ist mittlerweile in der Lage mit etwa acht wöchiger Genauigkeit vorherzusagen, dass eine Beziehung beendet wird, besagt eine Studien zweier Forscher der Cornell University in New York. Die beiden Datenexperten haben herausgefunden, dass Anhand der Facebook-Freundeslisten zweier Partner ihrer Verflechtung und Entwicklung festzustellen ist, wie ihre Beziehung verlaufen wird. Diese Prophezeiung ist natürlich nicht die Einzige, die durch das Informationspotential, das wir täglich mit Event-Zusagen, Standortsdaten aber auch privaten Nachrichten – jedem Klick und Wort - bereichern, getroffen werden kann.
Internet sei Dank hat sich der Begriff „private Daten“ weit ausgedehnt. Die privaten Daten sind längst nicht nur der Name, die Wohnadresse oder die Telefonnummer. Jede Facebook-Nachricht, Google-Suche oder Googlemaps-Anfrage, Youtube-Suche, Amazon-Bestellung, aber auch jede EC-Kartenzahlung, Online-Lieferservice-Bestellung oder online gekaufte Flugtickets gelten als nichtöffentliche Daten. Diese Informationen sind begehrt wie noch nie. Firmen spezialisieren sich darauf möglichst viele und genaue Daten zu erfassen, speichern, auszuwerten, ihre Zusammenhänge zu erschließen, personenbezogene Profile zu erstellen und diese zu verkaufen. Dass dieses Vorgehen heutzutage kein Problem darstellt, resultiert aus günstigen und effizienten Rechenleistungen, Speicher- und Analysetechniken.
Die Wirtschaft ist von Daten fasziniert und entdeckte die generierten Daten als neuen Rohstoff von größerer Bedeutung als Erdöl. Dabei ist die Beschaffung in der Regel banal – bei jeder EC-Karten-Zahlung werden beispielsweise alle Einkaufsinformationen erfasst: was, wo, wann gekauft wurde. Trägt man diese Informationen zusammen und wertet sie aus, lässt es sich relativ einfach feststellen, ob man ein gesunder Bio- oder eher ein Tiefkühlwarenkonsument ist. Solch eine Auswertung könnte für die Versicherungensbranche goldwert sein – sie könnten so ihre Beiträge an den jeweiligen Lebensstil anpassen. Doch nicht jeder könne sich regelmäßig Bio-Lebensmittel leisten. Ein hoher Versicherungsbeitrag würde dieser Gruppe nicht gerade dabei behilflich sein einen gesunderen Lebensstandard zu erreichen.
Außerdem haben Banken und die Schufa natürlich ein noch größeres Interesse daran ihre Kunden möglichst präzise einzuschätzen, um ihre Kreditwürdigkeit festzustellen, erläutert IT-Sicherheitsexperte der Hochschule München Prof. Dr. Hof.
Die Schufa kam bereits auf die Idee das digitale Menschenbild bei Facebook und Twitter unter die Lupe zu nehmen und mit der Realität verschmelzen zu lassen. Mit den Profilinformationen, Statusmeldungen, Freunden und Freundesfreunden wollte die Schutzgemeinschaft für allgemeine Kreditsicherung herausfinden in welchem (Kreditwürdigen-)Umfeld man sich befindet und dies als einen schwer gewichteten Faktor in die Bonitätsprüfung hineinfließen lassen. Dieses Projekt wurde allerdings aus Datenschutz- und Sicherheitsgründen nicht umgesetzt.
Der Begriff „Big Data“ beschreibt genau dieses Vorgehen: globaler Auffassung, Echtzeit-Auswertung und Verknüpfung möglichst aller Daten in riesigen Datenbanken. Im Jahr 2013 sind etwa 2,0 Zettabyte Daten produziert worden schreibt der wissenschaftliche Dienst des Deutschen Bundestags. Das sind in etwa 2 Trilliarden Bytes. Würde man diese Datenmenge auf iPads abspeichern und diese iPads in einer Reihe nebeneinanderlegen, könnte man eine 21000 Kilometer lange Kette bilden – das entspricht ungefähr dem halben Aquätorumfang, also einer halben Weltreise. Laut den Forscher der International Data Corporation (IDC) wird bis zum Jahr 2020 die jährliche Datenproduktion auf 40 Zettabytes steigen.
Firmen wie Google – mit ihren Diensten wie Youtube, Mail, Maps, Streetview – Amazon, Twitter und natürlich Facebook haben sich auf solche präparierten Daten spezialisiert und fahren mit ihnen hohe Gewinne ein. Facebook verdient ca. 1,8 Milliarden Doller innerhalb von drei Monaten durch personalisierte Werbeanzeigen.
Doch heutzutage im Zeitalter der datafizierten Gesellschaft ist die angepasste Werbung ein Bruchteil der Möglichkeiten, die mit Hilfe von privaten und öffentlichen Daten und ihrer Korrelationen erschlossen werden können.
Es geht nicht mehr um Werbung und Werben sondern um die Erkenntnisse, die aus den Daten getroffen werden können. Diese können das Menschenleben retten oder das Leben bequemer machen, allerdings sind sie auch in der Lage lebensgefährlich zu werden. Im Gesundheitssektor eröffnet Datenauswertung neue Möglichkeiten, beispielsweise bei Tumorerkrankungen. Wie der Bundesverband Informationswirtschaft, Telekommunikation und neue Medien e.V. (BITKOM) an der Big Data Pressekonferenz während der Informationstechnik Messe CeBIT berichtete, könne die Big-Data-Technolgie unter Berücksichtigung der genetischen Ausgangslage des Patienten aus hunderten klinischen Studien eine spezifische Behandlungsmethode zusammenstellen. Diese neuen Möglichkeiten seien sehr erfolgreich, sagt BITKOM-Sprecher Micheal Kleinmeier. Da es zwischen vielen verschiedenen Krebsarten und sehr individuellen Krankheitsverläufen auch stetig mehr Medikamente und Therapien gibt, ist eine individuelle Diagnose entscheidend. Dies bietet das neue digitale Werkzeug in einer sehr kurzen Zeit. Auf diese Art und Weise können also Medikamente präzise angepasst und die Nebenwirkungen minimiert werden, außerdem die Diagnose kontinuierlich optimiert je nach Behandlungsverlauf. Die aus Big Data gewonnenen Erkenntnisse können in jedem medizinischen Bereich Anwendung finden.
Auch im Verkehrswesen verbirgt sich hinter Big Data ein riesiges Potenzial. Yahoo verfügt beispielsweise über eine Datenbank mit ca. 200 Milliarden in der Vergangenheit online gekauften Flugtickets. Mit dieser ist der Dienstleister in der Lage hervorzusagen, ob der Preis des gesuchten Tickets zu einem späteren Zeitpunkt günstiger Ausfallen könnte als er es jetzt ist. Und das nur anhand von angehäuften Daten und ihrer Auswertung, sagt die Internetaktivistin Anke Domscheit-Berg im Rahmen des Zündfunk Netzkongresses #42.
Auch der Autobahnverkehr könnte ein kleines Stück revolutioniert werden, erläutert Prof. Dr. Hof. Es werden im Moment wenig bis gar keine Autobahndaten aufgezeichnet. Würde man allerdings jedes auf der Autobahn sich befindende Fahrzeug erfassen, wäre man in der Lage eine intelligente Verkehrssteuerung zu schaffen, so Staus vermeiden oder den Verkehr zu den Hauptverkehrszeiten einfacher und effizienter regeln. Man könnte den Autofahren für beispielsweise einen Tankgutschein oder ähnlichen Anreizen anbieten eine andere Route zu nehmen, die im optimal Fall genauso lang, aber schneller ist. Ein ähnliches Prinzip könnte die Deutsche Bahn gegen die überfüllten Züge einführen. Um die Effizienz des Konzepts zu erfahren, müssten man lediglich die Daten auswerten, was bei der Deutschen Bahn ein kleineres Problem darstellen dürfte als auf den Autobahnen.
Neben der positiven Big Data bedingten Entwicklung auch in weiteren Bereichen wie Umwelt, Wirtschaft und Politik, verbirgt sich in dieser Datenmaschinerie eine riesige Gefahr für die Gesellschaft.
Viele Experten, unter ihnen Prof. Hof und Frau Domscheit-Berg, sind sich einig, dass die Verarbeitung persönlicher Daten ein unbekanntes Ausmaß an Wertung jedes einzelnen Menschen bietet und den Entzug jeglicher Privatsphäre bedeuten könnte. Ein Schubladendenken gesteuert von Algorithmen, welche keine Ethik oder Moral besitzen gar erst die Möglichkeit zum Widerspruch der gedeuteten Rückschlüsse. Die von uns produzierten Daten entstehen überall und werden meist bei wenigen Internetgiganten gelagert und verarbeitet.
Das verdanken wir den größten Profiteuren der Internetgeschichte wie Google, Amazon oder Apple. Sie ködern die Kunden mit einem All inklusiv-Service. Sie stellen nicht nur die Geräte wie iPhone, iPad oder Kindle her, sondern bieten gleichzeitig auch viele nützliche Dienste zur Verfügung ala Maps, E-Books-Shops, Clouds usw. Dabei haben sie natürlich großes Interesse an Informationen was, wann, wo, wie lange gesucht, gelesen oder gespeichert wurde. Mit diesen freiwillig abgegebenen Daten lassen sich diese Unternehmen ihre Dienste bezahlen.
Diese Daten - in Händen dieser Internetdirigenten - verraten mehr über das Eigene-ich als man sich vorstellen kann. Das ist natürlich im Interesse des Unternehmens. Die AGB lesen meinst nur die Datenschützer, die nach der Lektüre Alarmschlagen. Sonst wird man an keiner Stelle über die Datensammlung informiert.
Amazon geht ein Schritt weiter. Neben den „Das könnte Sie auch interessieren“ -Vorschlägen passt der dienst die Zahlungsmethode an das eigene Umfeld an, ähnlich wie es die Schufa versucht hatte, erzählt Prof. Hof. Nach einem Umzug während seiner Studienzeit konnte er plötzlich nicht mehr per Rechnung bei dem Verkaufsgiganten bestellen. Das hatte Prof. Hof dem sogenannten „Scoring-Wert“ zu verdanken, der in seiner neuen Umgebung nicht so gut war, wie zuvor. Die Scoring-Werte berechnet das Unternehmen selbstständig und ausschließlich anhand der vorhandenen Daten. Diese werden mit den Ergebnissen der im Umfeld Wohnenden verglichen und daraus Rückschlüsse gezogen, wie es um die eigene Bonität stehe.
Dieses Vorgehen erinnert stark an die Bonitätsprüfung der Schufa. Da gibt es allerdings zumindest eine Möglichkeit der Ansicht und Löschung eigener Daten. Anders im Fall von Big Data. Hier gibt es keine Möglichkeit des Widerspruchs oder Löschens, das Internet vergisst bekanntlich nie. Das ist fatal, denn möglicherweise entspricht die erreichte Schätzung nicht der Realität und ist schlicht nicht wahr. Eine Korrektur oder eine Option auf Überprüfung des Werts sucht man vergeblich, was zu Folge ein Schubladendenken der Algorithmen hervorruft. Man stelle sich nur vor man bekäme kein Handyvertrag, keine Versicherung oder keine Arbeitsstelle, da Anhand falschen Interpretationen ein verfälschtes Bild des Eignen-ichs entwickelt wurde.
Das Problem der persönlichen Daten könnte durch Anonymisierung geregelt werden, behaupten viele, doch das ist nahezu unmöglich. Zwei Forscher aus dem Massachusetts Institute of Technology haben 1,5 Millionen anonyme Standortsdaten zu 95% reidentifizieren können. Dass Anonymisierung schwierig bis unmöglich ist, bestätigt ebenfalls der wissenschaftliche Dienst des deutschen Bundestags.
Nun könnte man meinen, dass der Staat in der Verantwortung steht seine Bürger vor dem Datenmissbrauch zu schützen, doch das ist nicht unbedingt der Fall. Denn wie wir aus den Überwachungsskandalen und einigen Gesetzesbeschlüssen wissen, ist unter anderem auch der Staat stark am Gläsernen-Bürger interessiert. Auf diese Art und Weise soll Sicherheit gewährt werden. Doch ob das Konformität mit der Abgabe jeglicher persönlichen Information und einiger Freiheiten findet, ist stark fraglich. Wenn ein Staat mit Unternehmen wie Facebook mit dem Vorwand der Verbrechensaufklärung kooperiert, ist jeder Nutzer dieses sozialen Netzwerks ein potentieller Verbrecher und verändert sein Verhalten, was wiederrum sehr auffällig und merkwürdig für die dauernd speichernden Algorithmen erscheinen könnte.
Auf Grund der Brisanz, unvorstellbaren Konsequenzen der Big Data Technologie plädiert Anke Domscheit-Berg für eine Art Big Data-TÜV. Dieser Dienst stelle sicher, dass die Abläufe Transparent sind, die Grundrechte eingehalten werden und das von Chaos Computer Clubs geprägte Zitat „öffentliche Daten nützen, private Daten schützen“ gewahrt wird.
Big Data ist ein Werkzeug mit einem riesigen Potential für die Gesellschaft, allerdings nur wenn es richtig und sicher genutzt wird.
Und vielleicht sind wir eines Tages in der Lage nicht nur den Facebook-Schluss-Macher zu aktivieren, sondern auch den Facebook-finde-den-Traumpartner zu betätigen, um die datenbasierte besser Hälfte zu finden. Die Frage ist nun, ob wir das wollen.












