Κάνω Like, άρα υπάρχω!

Μια έρευνα, που χρηματοδοτήθηκε από την Microsoft Research και την Boeing, είχε σαν στόχο να επιτευχθεί αυτόματη και ακριβής διαδικασία πρόβλεψης ευαίσθητων προσωπικών πληροφοριών και όλα αυτά με μοναδική πηγή τα δεδομένα που είναι καταχωρημένα στο facebook. Η έρευνα διεξαχθεί με την βοήθεια των 58.000 εθελοντές που παραχώρησαν τα Likes του στην επιστημονική ομάδα.

Βέβαια από την αρχή της δημιουργίας του κυβερνοχώρου, δημιουργήθηκαν, έμμεσα, αρχεία δεδομένων όπου ήταν ικανά να προδώσουν τις διάφορες προτιμήσεις των χρηστών, όπως το αρχείο καταγραφής ερωτημάτων αναζήτησης από τις ίδιες της μηχανές αναζήτησης αλλά και όπως το ιστορικό των browser. Η διαφορά όμως με τα likes, και τα υπόλοιπα δεδομένα του facebook, είναι ότι τα δεύτερα είναι δημόσια by default.

Η έρευνα προσπάθησε από πάσης φύσεως δεδομένα, που είχαν καταγράφει στο facebook profile του κάθε εθελοντή, να παράγουν εκτιμήσεις για ευαίσθητα δεδομένα, όπως ο σεξουαλικός του προσανατολισμός και γενικότερα δεδομένα που στις περισσότερες περιπτώσεις οι εθελοντές δεν είχαν επιλέξει να αποκαλύψουν. Στην έρευνα χρησιμοποιήθηκαν τα wall posts, likes σε wall posts, groups και pages αλλά και ο αριθμός των φιλών μαζί με τις ηλικίες (των φίλων) τους αλλά και η κύρια γλώσσα που προτιμούν και διάφορα άλλα δεδομένα που είναι αποθηκευμένα στους servers του πασίγνωστου αυτού social network. Μάλιστα δε, χρησιμοποιήθηκε ως σημείο αναφοράς και παραλληλισμού το case ενός μεγάλου αμερικάνικου δικτύου λιανικής πώλησης, το όποιο χρησιμοποιούσε το αρχείο των πωλήσεων έτσι ώστε να προβλέπει αν μια πελάτισσα είναι έγκυος, ώστε να προβούν στην αποστολή στοχευμένων προσφορών.

Οι εκροές της έρευνας είναι εντυπωσιακές, αφού κατάφεραν να προβλέψουν ακόμη και την χρήση ουσιών, κατά πόσο είναι ευτυχισμένος από την ζωή αλλά και αν είναι τέκνο χωρισμένων γονέων. Παρακάτω ακολουθεί ο πίνακας με όλες τις παραμέτρους που ήταν εφικτό να παράγουν, μαζί με τις πιθανότητες να είναι σωστές οι εκάστοτε προβλέψεις.

Στο διάγραμμα αυτό απεικονίζεται το ποσοστό επιτυχούς πρόβλεψης προσωπικών στοιχείων

Στο διάγραμμα αυτό απεικονίζεται το ποσοστό επιτυχούς πρόβλεψης προσωπικών στοιχείων κάθε ατόμου, με βάση τις προτιμήσεις που δήλωσε κάνοντας Like στο Facebook.

Η ανάλυση των likes στην ουσία ήταν ένας συσχετισμός ανάμεσα των επιθυμητών συμπερασμάτων για τις προτιμήσεις και διάφορων ενδεικτικών λέξεων ή φράσεων κλειδιών. Ενδεικτικά παραδείγματα είναι ότι το like στην λέξη Mozart ήταν αρκετή ώστε να βγει το συμπέρασμα ότι ο συγκεκριμένος εθελοντής είχε υψηλό IQ. Αν σε κάποιον άρεσε ο προγραμματισμός ή τα RPG έχει πιθανότητες να καταταχθεί στους ντροπαλούς και εσωστρεφής και αντίθετα ένας άντρας που είχε μια αδυναμία …στην μάρκα καλλυντικών «Mac Cosmetics», η έρευνα τον θέλει ομοφυλόφιλο. Στο παρακάτω συνημμένο αρχείο ακολουθεί ο πλήρης πίνακας των ομαδοποιήσεων χαρακτηριστικών λέξεων ή φράσεων. Τέλος, κάτι που μου έκανε εντύπωση είναι ότι, η αρέσκεια προς το trademark «Hello Kitty» υποδηλώνει ότι κάποιος είναι «ανοιχτός» άνθρωπος.

Η έρευνα καταλήγει στο ότι τέτοιου είδους αναλύσεις θα μπορούσαν να βελτιώσουν τις προτάσεις ενός τμήματος μάρκετινγκ ή το διαφημιστικό μήνυμα που θα στέλνουν στις επιθυμητές ομάδες χρηστών. Από την άλλη, οι ερευνητές κρούουν τον κώδωνα του κινδύνου, αφού τέτοιες αναλύσεις μπορούν να γίνουν χωρίς την ρητή συναίνεση του χρήστη αλλά και χωρίς να το αντιληφθούν. Επιχειρήσεις, κυβερνητικοί οργανισμοί, και γιατί όχι και υποψήφιοι μνηστήρες, θα μπορούσαν να χρησιμοποιήσουν τα δεδομένα που αποθηκεύονται και διακινούνται στο Facebook έτσι ώστε να μάθουν στοιχεία όπως η νοημοσύνη, ο σεξουαλικός προσανατολισμός ή οι πολιτικές θέσεις αλλά και γενικότερα πεποιθήσεις που ίσως δεν σκόπευε να αποκαλύψει ο χρήστης όταν έκανε Like. Επι της ουσίας θα πρέπει να αρχίσουμε να φανταζόμαστε περιπτώσεις όπου τέτοιες ομαδοποιήσεις με βάση πιθανά προσωπικά στοιχεία, που στην τελική μπορεί να μην είναι σωστά ή να συμπληρώθηκαν με επιπολαιότητα, θα μπορούσαν να αποτελέσουν απειλή για την ευημερία, την ελευθερία ή ακόμα και την ζωή του ατόμου που υπέστη την οποιαδήποτε ανάλυση των Like του. Θα έλεγα ότι δεν αρκεί να αποκρύπτει κανείς επιμελώς πχ την σεξουαλική του ταυτότητα, αφού μπορεί να αποκαλυφθεί από τα ψηφιακά του «ίχνη»…

Eπισυνάπτω ολόκληρη την έρευνα: ΚάνωLikeΆραΥπάρχω.pdf