Ma davvero Cambridge Analytica ha manipolato il voto usando i dati online degli utenti?
In seguito alle vicende delle ultime settimane che hanno messo sotto accusa Facebook per l’incapacità di tutelare la privacy dei suoi utenti, l’interesse per l’impatto della metodologia di Cambridge Analytica sui risultati elettorali di Donald Trump e della Brexit sembra essersi riacceso: i metodi di Cambridge Analytica rappresentano una minaccia per la democrazia? Quanto sono stati efficaci i messaggi personalizzati sulla base delle caratteristiche di personalità, che qualcuno ha definito i “demoni interni” dell’elettorato americano? C’è il rischio di una manipolazione di massa dell’elettorato da parte di agenzie di comunicazione politica?
Per rispondere a queste domande, in moltissimi articoli si è fatto ricorso a diverse tipologie di fonti: le dichiarazioni contraddittorie da parte dei vertici di Cambridge Analytica, opinioni di ex clienti dell’agenzia, catastrofiche dichiarazioni da parte degli ex impiegati dell’agenzia inglese, argomentazioni di carattere teorico formulate da prestigiosi esponenti accademici ed evidenze delle ricerche sperimentali. In questo articolo si cercherà di rispondere alle incognite relative all’efficacia del metodo proposto da Cambridge Analytica, chiarendo quali siano le evidenze a disposizione e operando una distinzione tra le opinioni, le argomentazioni di carattere teorico e i risultati di studi scientifici.
Su quali fonti si è basato il dibattito sino ad oggi? Prima di rispondere alle domande relative all’efficacia del metodo di Cambridge Analytica, è utile operare una distinzione sulle fonti che verranno prese in esame:
Opinioni. Sono state riportate diverse testimonianze, in particolare quelle basate sull’esperienza degli ex clienti di Cambridge Analytica. Sebbene le opinioni siano ampiamente prese in considerazione nelle scienze sociali, quando trattate in isolamento ci dicono poco sull’efficacia di un intervento. Ad esempio, nel caso delle opinioni di un cliente di un’agenzia di comunicazione politica, potrebbero interferire alcuni bias: aspettative irrealistiche, profezie auto-avveranti, scetticismo, mancata comprensione della metodologia e attribuzione di responsabilità all’esterno (se ho fallito, è stata colpa dell’agenzia). Per quanto riguarda opinioni e argomentazioni basate su teorie abbiamo usato come fonte l’articolo “The big data panic” pubblicato da Felix Salmon su Medium.
Argomentazioni basate su teorie. Evidenze non empiriche, basate sulla logica ossia l’interconnessione tra teorie e risultati di studi precedenti. Queste argomentazioni consentono di formulare delle ipotesi, da sottoporre al vaglio di una ricerca scientifica.
Evidenze empiriche. Sono i risultati di ricerche scientifiche, ricavati attraverso dei protocolli progettati per ridurre l’effetto degli errori sistematici (ad esempio tramite tecniche di campionamento, l’uso della statistica e così via).
Le 4 principali questioni su cui verte il dibattito
Le criticità inerenti al metodo di Cambridge Analytica riguardano le diverse fasi del processo, che Alexander Nix, amministratore delegato di Cambridge Analytica, descrisse durante il Concordia Summit del 2016 negli Stati Uniti. Il CEO dichiarò di poter creare contenuti cuciti su misura basandosi sul profilo di personalità, orientamento politico, religioso ed etnia di ogni singolo elettore. Nix in quell’occasione non spiegò, però, in che modo Cambridge Analytica era entrata in possesso dei dati sensibili di gran parte dell’elettorato americano. In un’inchiesta del Guardian del 2015 fu reso noto che l’agenzia aveva ricavato quei dati tramite un’applicazione di Facebook (nelle scorse settimane è emerso che si chiamava “thisisyourdigitallife”) sviluppata da Aleksandr Kogan, docente dell’università di Cambridge.
I 320.000 utenti che scaricarono l’App risposero alle domande di un test di personalità, che permetteva a Kogan di conoscere i livelli di estroversione, apertura alle nuove esperienze, stabilità emotiva, coscienziosità e piacevolezza, ossia i 5 tratti fondamentali del modello Big 5. Un’impostazione di Facebook, nota come “friend permission”, consentiva agli sviluppatori di accedere non solo ai profili di chi scaricava l’app ma anche ai dati di tutti i loro amici e ciò permise a Kogan di accedere alle informazioni di 87 milioni di utenti (si tratta, ha specificato Facebook, di un calcolo per eccesso utilizzato per capire il possibile numero di utenti coinvolti) che non avevano scaricato l’App e che includevano tutto ciò che può essere condiviso all’interno di un profilo di Facebook: Like, immagini, link, contenuti testuali e così via.
Facebook nel 2015 decise di rimuovere la funzione “friends permissions”, di eliminare l’App di Kogan e richiese a Cambridge Analytica di cancellare tutti i dati da loro raccolti. Tutta la vicenda è riesplosa nei giorni scorsi con le confessioni a The Observer e New York Times dell’ex dipendente di Cambridge Analytica, Christopher Wylie, che avrebbe dichiarato che la società era ancora in possesso dei dati e di averli usati per le campagne elettorali di Donald Trump e della Brexit. Ipotesi negate da Cambridge Analytica. Per comprendere dunque se il metodo di Cambridge Analytica abbia avuto un impatto nelle elezioni in cui è stata coinvolta, è necessario sapere se tutti i passaggi della metodologia funzionano.
1. È possibile ricavare un profilo di personalità attendibile attraverso le impronte digitali (“Like” di Facebook, Post, Tweet e così via)?
Per creare dei contenuti persuasivi, la strategia dichiarata da Cambridge Analytica è personalizzare il messaggio elettorale combinando i dati socio-anagrafici (sesso, etnia, religione, orientamento politico) con le caratteristiche di personalità dell’elettore. Sia i dati socio-anagrafici che i dati psicologici furono raccolti tramite l’App sviluppata da Kogan thisisyourdigitallife attraverso due principali modalità: le risposte alle domande di un test di personalità e l’incrocio di una molteplicità di impronte digitali (“Like” di Facebook, immagini, link). Gli utenti che scaricarono l’App di Kogan risposero alle 120 domande di un questionario che si chiama IPIP-NEO, la versione online e open-source del test del Big 5. Ricerche empiriche mostrano che il questionario possiede buone proprietà psicometriche e questo implica che Kogan disponesse di dati accurati riguardo il profilo di personalità dei 320mila utenti Facebook che scaricarono l’app.
Per quanto riguarda gli amici di chi scaricò l’app invece, Kogan adoperò un procedimento statistico chiamato analisi fattoriale, una tecnica che consente di estrapolare un numero ridotto di tratti latenti (ad esempio, i cinque tratti di personalità del modello Big 5) partendo da una moltitudine di variabili direttamente osservabili (i “Like” di Facebook, ad esempio). Una volta estrapolati i tratti di personalità attraverso l’analisi fattoriale, Kogan avrebbe potuto continuare a utilizzare e implementare il modello persino nel caso in cui Cambridge Analytica avesse davvero cancellato i dati grezzi di Facebook. Come spiega Matthew Hindman, professore della George Washington University, è come se una foto in alta risoluzione venisse convertita in una qualità più bassa, per poi essere cancellata: l’immagine continuerebbe a esistere, seppur in una versione semplificata.
Su quanto l’analisi fattoriale abbia permesso a Cambridge Analytica di ricavare dati utili emerge una prima contraddizione tra evidenze empiriche e dichiarazioni di due protagonisti della vicenda, Kogan e Nix, rilasciate il 20 marzo, pochi giorni dopo lo scoppio dello scandalo di Facebook. Il famoso articolo di Kosinski e Stilwell del 2013 fu il primo studio scientifico a osservare che attraverso i like di Facebook fosse possibile conoscere i tratti di personalità degli utenti con una soddisfacente accuratezza.
Una conferma a tali evidenze è arrivata da una recente meta-analisi, che ha confrontato 24 studi inerenti la valutazione della personalità di un’utente attraverso l’analisi delle sue impronte digitali (immagini, testi, like): i ricercatori osservarono che le tracce digitali possono essere utilizzate per ricavare i tratti di personalità con un’accuratezza che varia da 0,29 per il tratto di personalità piacevolezza a 0,40 per l’estroversione. Questi valori corrispondono ad un indice conosciuto come “coefficiente di personalità” che descrive la forza predittiva della personalità sui comportamenti in genere come ad esempio il divorzio e il successo lavorativo. La meta-analisi riporta, inoltre, che, combinando le tracce digitali con dati demografici, la precisione della previsione aumenta. In contraddizione con i risultati di questi studi, arriva una dichiarazione che Kogan rilascia per la CNN, in cui spiega che il modello adoperato non aveva funzionato granché bene e un’altra di Nix per la BBC, durante la quale in maniera sorprendente afferma “non siamo d’accordo con la maggior parte di coloro che decantano la potenza dei dati da noi impiegati. Abbiamo testato molti modelli e, quando abbiamo scoperto che i dati non erano utili, ci siamo mossi su percorsi differenti”. Tuttavia, ad oggi, le dichiarazioni di Kogan e Nix non possono essere verificate in quanto non è stato pubblicato alcuno studio scientifico basato sui dati raccolti tramite thisisyourdigitallife. Inoltre, come nota Matthew Hindman, professore della George Washington University, chiunque sarebbe pronto a sottostimare il suo contributo nel bel mezzo di uno scandalo di così alta portata.
Per personalizzare un messaggio elettorale, conoscere la personalità di qualcuno non è sufficiente ed uno dei dati più importanti da ricavare è indubbiamente l’orientamento politico.
Nell’articolo del 2013 di Kosinski e colleghi, venne riportato che i “Like” di Facebook possono essere utilizzati per ricavare con l’85% di accuratezza informazioni sull’orientamento al partito democratico o repubblicano. A differenza da quanto riportato da Felix Simon su Medium come prova dell’inconsistenza del modello di Cambridge Analytica, l’agenzia non utilizzò i profili di personalità per anticipare l’orientamento politico (infatti, la relazione tra personalità e orientamento politico è solo del 5%) ma adoperò le impronte digitali degli utenti Facebook.
2. Personalizzare il messaggio sulla base della personalità rappresenta una strategia efficace per influenzare il comportamento d’acquisto?
L’idea di personalizzare il messaggio elettorale combinando i dati socio-anagrafici (sesso, etnia, religione) con le caratteristiche di personalità dell’elettore è stata probabilmente ispirata dagli studi dei ricercatori di Cambridge che hanno applicato il metodo nella vendita di prodotti commerciali.
Fig. 1 Esempi di messaggi pubblicitari personalizzati per persone con alta e bassa estroversione (A) e alta e bassa apertura alle nuove esperienze (B)
Nella pubblicazione del 2017, che incluse tre esperimenti effettuati su un campione di 3,5 milioni di persone, Kosinski e i colleghi di Cambridge osservarono che messaggi pubblicitari personalizzati sulla base del profilo di personalità influenzavano in maniera significativa il comportamento degli utenti. In uno dei tre studi, i ricercatori personalizzarono i messaggi pubblicitari di un’azienda di cosmetici suddividendo il target in donne estroverse (energiche, attive, socievoli) e introverse (timide, riservate, taciturne).
Per i profili estroversi vennero progettati una decina di messaggi come, ad esempio, “balla come se nessuno ti stesse guardando (anche se in realtà sei sotto gli occhi di tutti)”, e lo stesso fu fatto per i profili introversi (fig. 1). I risultati mostrano che i gruppi che ricevettero messaggi coerenti rispetto al profilo di personalità cliccavano il 40% delle volte in più sui banner pubblicitari e portavano a termine l’acquisto il 50% delle volte in più rispetto al gruppo di controllo e alla controparte che riceveva messaggi incoerenti.
Sebbene le evidenze riportate da questi studi siano solide, l’efficacia di una strategia di marketing applicata ai prodotti non può essere estesa alla comunicazione elettorale, in quanto la scelta di un candidato o di un fondotinta si basano su processi decisamente diversi.
3. Dunque, personalizzare il messaggio sulla base della personalità è una strategia efficace per influenzare il comportamento elettorale?
Il targeting mirato è stato impiegato in politica per la prima volta da Barack Obama sia nella campagna elettorale del 2008 sia nel 2012. Secondo le opinioni di alcuni accademici, tra cui Bruce Newman, tale strategia fu decisiva per il successo elettorale di Obama. In un’intervista del 2016, Newman spiega: “Esaminando ciò che successe nel 2012, per esempio, vediamo che Obama raggiunse la maggioranza sul voto popolare con il 3% di margine, mentre sul Collegio Elettorale ottenne un vantaggio di circa il 30%.
Ciò è accaduto perché il micro-targeting e i big data sono stati impiegati per inviare messaggi personalizzati all’elettorato, lo stesso meccanismo del marketing di un prodotto o di un servizio”. Tuttavia, non vi sono ad oggi studi sperimentali a supporto della tesi di Newman. Cambridge Analytica avrebbe aggiunto un nuovo ingrediente alla ricetta adottata da Obama: utilizzare non solo i dati socio-anagrafici, ma anche i profili di personalità dell’elettorato americano per creare messaggi personalizzati.
Molti articoli recenti, hanno reagito con scetticismo alle dichiarazioni riportate da Wylie in un’intervista per The Guardian: “Abbiamo sfruttato Facebook per raccogliere i profili di milioni di persone e costruito modelli per sfruttare ciò che sappiamo di loro e colpire i loro demoni interiori”. Per destrutturare “la narrativa dell’onnipotenza” di Cambridge Analytica, sono state riportate, sino ad oggi, le opinioni dei protagonisti di questa vicenda e le argomentazioni dei docenti universitari basate su teorie. (segue)
Ricorda di citare la fonte: Valigiablu
Licenza cc-by-nc-nd valigiablu.it