Lockende Datenmeere

Die Schufa wirbt mit dem Slogan: "Wir schaffen Vertrauen" (Foto: Schufa)

Die Schufa wirbt mit dem Slogan: "Wir schaffen Vertrauen" (Foto: Schufa)

Es war eine Notbremse der panischen Art: Vergangene Woche stieg das private Hasso-Plattner-Institut (HPI) aus einem gemeinsamen Forschungsprojekt mit der Schufa Holding AG aus. Die Projektpartner wollten eigentlich überprüfen, welche Informationen sich aus im Web öffentlich verfügbaren Daten gewinnen lassen. Eine direkte Verknüpfung der Bonitätsprüfung mit den Angabe aus sozialen Netzwerken wie Facebook war zwar nicht geplant, als aber die Kritik geradezu explodierte, zog das HPI die Reißleine. Eigentlich unverständlich, denn Forschungsvorhaben dieser Art sind keine Seltenheit.


Und so ist es erstaunlich, dass die HPI-Forscher nicht auf ihrer Forschungsfreiheit beharrten und dem öffentlichen Druck so schnell nachgaben, nur weil es “manche Missverständnisse in der Öffentlichkeit” gab, die eine “unbelastete” Durchführung des Projekts “mit der nötigen Ruhe” verhindert hätten, wie die Forscher selbst den Schritt begründeten.

Menschen-Ranking

Die Schufa bestimmt mit Hilfe des Scorings die Kreditwürdigkeit einzelner Personen. In die personenbezogenen Scores fließen verschiedene Faktoren ein – und an der Angst vor einem Scorings auf Facebook-Basis entzündete sich die Kritik. Zwar verwies ein HPI-Sprecher auf die fehlerhaften automatisierten Übersetzungsprogramme und sagte, es sei “absurd zu vermuten, Informatikwissenschaftler würden der Schufa helfen, derartig ungenaue Texterkennungssoftware über die Zahlungsfähigkeit eines Menschen mitentscheiden zu lassen” - trotzdem wird überall an der Analyse der im Netz umherschwirrenden Daten geforscht.

Wie zutreffend ein Scoring aufgrund der Angaben sein kann, die Facebook-Mitglieder über sich gemacht haben, zeigt aber beispielsweise die neue Berufssuchmaschine “Identified.”

Sie bewertet Personen mit Scorewerten zwischen 0 und 100, damit potenzielle Arbeitgeber eine bessere Auswahl unter Bewerbern treffen können. Dabei fließen die Angaben über Ausbildung, Berufsleben sowie Facebook-Kontakte in die Bewertung ein. Die Entwickler Brendan Wallace und Adeyemi Ajao von der Stanford Graduate School of Business bezeichnen ihr Verfahren als “Google-Ranking für Menschen.”

Big Data für viele Zwecke

Die Forscher aus Potsdam hätten auch auf andere ähnlich geartete Datamining-Projekte verweisen können, die seit einigen Jahren in wachsender Anzahl vornehmlich in den USA betrieben werden. Die Ziele sind nicht weniger sensibel: Betrugserkennung, zielgenaues Marketing, Innere Sicherheit, Katastrophen-Kommunikation. Die Auswertung von “Big Data” – also den Datenmassen, die von Smartphones, Sensoren aller Art oder sozialen Netzwerken generiert werden – ist in vielen Forschungsbereichen derzeit weltweit en vogue. Der Phantasie sind keine Grenzen gesetzt. Die Bezahldienstleister American Express, Paypal oder Visa durchforsten ständig aktuelle Daten nach ungewöhnlichen Mustern, die auf Betrug hinweisen könnten. Marketingunternehmen nutzen Daten aus Sozialen Netzwerken, um Kunden noch zielgenauer anzusprechen. In den USA wurde bereits überlegt, die Daten aus Social-Media-Diensten zu nutzen, um Stimmungen in der Bevölkerung zu registrieren und sie für die Katastrophenkommunikation zu nutzen.

Nutzer sollen selbst entscheiden

Wie der gescheiterte Schufa-Versuch haben all diese Ansätze ein grundsätzliches Problem: Die im Netz verfügbaren Daten werden zunehmend auf eine Art und Weise genutzt, die diejenigen nicht im Sinn hatten, die die Daten produziert haben. Genau diese Zweckentfremdung ist es jedoch, die den Widerstand und die Empörung der Nutzer wie im Falle des Schufa-Projekts anfachten. Denn die meisten Internetnutzer kennen die Schufa und ihre Aufgabe und können sich vorstellen, was eine Auswertung ihrer Profile für Folgen haben könnte.

Das Schufa-HPI-Projekt ist gestorben, die Erforschung öffentlicher Daten geht jedoch an anderer Stelle ungehindert weiter. Daher sollte jetzt die Diskussion beginnen, ob und wie diese Daten genutzt werden dürfen. Die Creative-Commons-Lizenzen weisen in eine Richtung, die das informationelle Selbstbestimmungsrecht in den Vordergrund stellt. Der Urheber – z.B. von Blogeinträgen oder Fotografien – legt selbst fest, unter welchen Bedingungen andere diese Werke verwenden dürfen. Vielleicht könnten Nutzer ja mit einer noch zu entwickelnden Data-Commons-Lizenz ebenso einfach anzeigen, ob und unter welchen Umständen sie einer Datenverarbeitung zustimmen. Crawler und andere automatischen Auswertungsverfahren wüssten dann, ob sie von diesen Daten die Finger lassen sollen.

(Das ZDF ist für den Inhalt externer Internetseiten nicht verantwortlich; der Beitrag gibt die Meinung des Autors wieder)

4 Kommentare | 12. Juni 2012 | 14:41 Uhr | Twittern | Facebook

4 Kommentare

  1. “welche Informationen sich aus im Web öffentlich verfügbaren Daten gewinnen lassen” Soweit ich es beurteilen kann ist es durchaus fragwürdig, ob Daten, auf die man nur mit Passwort Zugang hat, öffentlich sind. Man könnte facebook auch durchaus als privaten (nichtöffentlichen) Raum betrachten, was rechtlich einen erheblichen Unterschied macht ;)

    marc | 12. Juni 2012 | 15:58
  2. Anscheinend spricht sich mittlerweile rum, dass es nicht unbedingt clever sein muss, sich in sozialen Netzwerken rumzutreiben. Hierzu gab es eine Diskussionsrunde zwischen Politikern (Vorsitzender der Piratenpartei, Landesverband Bayern), Datenschützer (Präsident des Bayerischen Landesamts für Datenschutzaufsicht, Wirtschaft pro (Consline AG, Webtrekk GmbH) und contra Schnüffelei (Uniscon GmbH) (Quelle: http://www.inar.de/glasern-im-web-%e2%80%9edie-entwicklung-kann-erschreckende-zuge-annehmen%e2%80%9c/).

    Ich hätte bisher gedacht, dass die Daten vom US-amerikanischem Geheimdienst benutzt werden, sowie eine starke Anziehkraft auf Hacker etc. ausüben…

    Wilhelm Grünbach | 12. Juni 2012 | 16:31
  3. “Erforschung öffentlicher Daten geht jedoch an anderer Stelle ungehindert weiter. Daher sollte jetzt die Diskussion beginnen, ob und wie diese Daten genutzt werden dürfen.”

    Isn diesem Zusammenhang geht oft unter, dass es in der Wirtschaft umfangreiche Offline – Datenbanken gibt, deren Informationsgehalt ebenalls sehr hoch ist. Die beiden Welten (On- und Offline) sollten zu diesem Themabnicth getrennt betrachtet werden, sondern nur gemeinsam.

    Wir haben eine Genossenschaft gegründet, deren Zweck die Umsetzung der Selbstbestimmung über die eigenen Daten ist -

    andreas schumann | 12. Juni 2012 | 23:41
  4. Tja, was diese Datensammelwut angeht, kann man schon durchaus gegensteuern. Denn die Frage ist wirklich: brauchen wir solche Datenkraken wir Google oder Facebook überhaupt?? Meine Antwort ist: NEIN. Niemand braucht die Google-Suchdienste oder diese Plattform Facebook!! Zeigt diesen Diensten doch mal die rote Karte und macht eure Suchen mit Diensten, die eure Privatsphäre schützen.

    Ihr mein, es gibt keine Alternativen zu Google?? Doch, die gibt es. Schaut mal hier:

    http://duckduckgo.com/

    https://startpage.com/

    https://ixquick.com/

    Bei diesen Diensten werden keine Userdaten gespeichert.

    Und für die Kommunikation untereinander gibt es ebenfalls Alternativen. Legt euch jabber-Konten zu. Diese könnt ihr dann mit ICQ, mit Pidgin oder auch mit den vielen Programmen unter Linux wie z.B. Empathy oder ebenfalls Pidgin oder anderen Chatprogrammen nutzen!!

    Und um eure IP im Internet zu verbergen, solltet ihr immer grundsätzlich den Tor-Button benutzen!! Darüber hinaus sollte man sich in Firefox diese Add-ons installieren:

    https://addons.mozilla.org/de/firefox/addon/adblock-plus/?src=cb-dl-mostpopular

    https://addons.mozilla.org/de/firefox/addon/noscript/?src=cb-dl-mostpopular

    https://addons.mozilla.org/de/firefox/addon/betterprivacy/?src=cb-dl-mostpopular

    https://addons.mozilla.org/de/firefox/addon/browserprotect/?src=cb-dl-toprated

    Und auch bei Email gibt es in Thunderbird die Funktion Enigmail (Email-Verschlüsselung).

    Fazit: man kann schon eine ganze Menge tun, um sich und seine Daten im Internet-Verkehr zu schützen.

    Linuxhelfer | 13. Juni 2012 | 14:48