Le foto finite nel database di Clearview Ai

Sono finito nei database della più discussa società di riconoscimento facciale al mondo, Clearview Ai. Senza aver mai dato il consenso, tredici mie fotografie sono state usate per allenare gli algoritmi di questa azienda, che dichiara di vendere la sua tecnologia per identificare i volti e tracciare le persone alle forze dell’ordine, ma anche ad aziende private, per esempio casinò per premiare i clienti più fedeli. Per addestrare i meccanismi di riconoscimento facciale, Clearview Ai ha pensato bene di avvalersi dei miliardi di immagini di volti disponibili su internet. Fotografie pubbliche, delle decine in cui potete imbattervi se consultate il programma di un festival, per esempio, o gli albi dei docenti di un’università, online per tutt’altro scopo che aiutare un algoritmo a distinguere un paio di baffi o familiarizzare con il taglio degli occhi.

All’inizio di febbraio il Garante della privacy canadese ha dichiarato l’attività di Clearview Aiillegale”, poiché ha creato un sistema che “infligge un danno su vasta scala a tutti i componenti della società, che si ritrovano di continuo in uno schedario della polizia”, prestandosi a una sorveglianza senza limiti. Basti pensare che la startup, sede a New York, afferma di avere nel proprio database 3 miliardi di immagini. Tredici di queste sono le mie. Ma qualcuna potrebbe essere anche vostra.
WiredLeaks banner

Come scoprire se hanno le tue foto

Scoprirlo non è difficile. Sul sito di Clearview Ai si può inviare una domanda di accesso al database. L’azienda richiede una mail per spedire le comunicazioni, l’assenso a usare un’immagine per cercare abbinamenti nel suo archivio, una foto del volto propria o della persona per conto della quale si fa domanda e copia di un documento di identità. A metà marzo, a un mese dalla richiesta, mi è arrivato il pdf con il responso. Tredici immagini, di cui otto dal sito di Webit, che organizza eventi sul digitale. Lo scorso maggio sono intervenuto in un panel sulla cybersecurity e ho fornito un ritratto, scattato nel 2019 dal fotografo ufficiale del Wired Next Fest (il principale evento organizzato da Wired), Umberto Costamagna, per le locandine. Tutte puntualmente intercettate da Clearview Ai.

L’altro scatto invece risale ai tempi in cui lavoravo al Giorno, dono di un’ex collega. Lo uso spesso come foto profilo. E Clearview Ai l’ha beccato due volte: su Twitter e per un blog sul quale ho scritto alcuni articoli. Stranamente non ha riconosciuto la stessa immagine sul mio profilo autore di Wired, mentre l’ha archiviata da quella di uno condiviso con la collega, Elisa Murgese. A rigor di logica ci dovrebbe essere allora anche la foto del profilo doppio che condivido con il collega Raffaele Angius. Invece no.

Foto di una collega associata al mio volto e finita nel database di Clearview Ai
Foto di una collega associata al mio volto e finita nel database di Clearview Ai

Un algoritmo oscuro

Questo rende ancora più oscuri i criteri già poco trasparenti con cui Clearview Ai fa pesca a strascico di immagini sul web. Per esempio, una veloce ricerca su Google, Duckduckgo e Bing con il mio nome e cognome restituisce nella sezione immagini una discreta varietà in più delle foto che la chiacchierata startup ha acquisito a mia insaputa. Come funziona lo scraping (tecnica per estrarre dati dal web)? Perché ha escluso alcune foto? Una mia immagine presente su Google, quando ancora potevo scuotere una folta chioma riccia, non è stata riconosciuta dall’algoritmo (che quindi funziona meno bene di quanto vuol far credere l’azienda) o non è stata acquisita per altre ragioni?

Vorrei saperlo, ma la comunicazione dell’azienda è, per usare un eufemismo, stringata. “Il motore di ricerca per immagini di Clearview Ai opera nei limiti delle leggi applicabili e cerca solo informazioni disponibili pubblicamente, come su Google o altri motori di ricerca”, si legge nella nota inviata a Wired in risposta ad alcune domande.

Quel che è certo è che alcune aziende, dopo aver scoperto che Clearview Ai faceva scorpacciate delle fotografie pubblicate sulle loro piattaforme, hanno alzato la voce. Una di queste è Facebook. Un portavoce del social network ha precisato che “lo scraping di informazioni personale viola le nostre politiche, per questo abbiamo chiesto a Clearview Ai di smettere di accedere o usare dati da Facebook o Instagram”. Menlo Park sta valutando tutte le opzioni perseguibili, se l’azienda, che non ha mai rivelato quante immagini di utenti di Facebook o Instagram abbia acquisito, non rispetterà le sue regole. Anche Linkedin si è opposta: la mia foto profilo, infatti, pur presente su Google non compare nella lista di Clearview Ai. Così come Youtube. Mentre l’altolà di Twitter non deve aver funzionato altrettanto bene, dato che l’immagine del mio account è nel database della startup.

Ad ogni modo la tecnica di tracciamento dell’azienda è tanto controversa che lo scorso novembre la polizia di Los Angeles, la terza più grande degli Stati Uniti, ha preso le distanze dal software e annunciato che userà solo tecnologie proprietarie per il riconoscimento facciale. A Wired Clearview Ai ha inviato una dichiarazione di circostanza del suo amministratore delegato, Hoan Ton-That, nella quale si spiega che la startup “non ha mai avuto contratti con alcun cliente nell’Unione europea e non è disponibile al momento nell’Unione”. È noto però che ci abbia provato, prendendo contatti anche con l’Italia.

Come si accede al database di Clearview Ai
Come si accede al database di Clearview Ai

Lo scudo del Gdpr

A tutelare i cittadini dell’Unione europea interviene il regolamento generale per la protezione dei dati (Gdpr), che prevede espressamente un consenso quando si trattano informazioni personali. Vale anche per Clearview Ai, sebbene abbia casa a New York, quando maneggia dati di persone che vivono all’interno dell’Unione. Quindi sia con le foto che raccoglie dal web, sia con quelle che chiede per fare ricerca nei suoi archivi. In entrambi i casi servirebbe il consenso informato. Invece nel primo caso gli utenti non sono neanche a conoscenza di essere nel database, mentre nel secondo si devono accontentare di un semplice Acconsento. “Clearview continuerà a completare richieste di opt-out o cancellazione in virtù del Gdpr”, ha detto l’ad.

Come si accede al Come si accede al database di Clearview Ai
Come si accede al database di Clearview Ai

Lo ha fatto, a quanto apprende Wired, anche con le immagini di Matthias Marx, informatico tedesco e componente del collettivo di attivisti e hacker del Chaos computer club. Dopo aver scoperto che Clearview Ai aveva delle sue foto, Marx, assistito dall’organizzazione non governativa per i diritti digitali Noyb, fondata dall’attivista austriaco Max Schrems (noto per aver fatto invalidare con le sue cause i due patti che regolavano lo scambio di dati tra Unione europea e Stati Uniti due volte), ha ottenuto dal garante per la protezione dei dati di Amburgo, a cui aveva fatto ricorso, la cancellazione degli hash, ossia i valori numerici associati alle immagini per identificare un volto, ma non delle immagini stesse. Per Noyb è una vittoria a metà, visto che, peraltro, il garante si è pronunciato sul caso specifico, senza dare a Clearview Ai un ordine valido per tutto il mercato europeo. Per questo, nelle ore precedenti alla pubblicazione di questo articolo, ho depositato un reclamo formale al garante della privacy italiano (qui i moduli).

Come si accede al database di Clearview Ai
Come si accede al database di Clearview Ai

Rispetto al fatto che occorra fornire dati personali aggiuntivi per avere contezza della presenza dei propri dati nel database della startup e la cancellazione (si può fare online), Alan Dahi, legale di Noyb, spiega a Wired che “è un po’ come chiedersi se venga prima l’uovo o la gallina, visto che in primo luogo loro non dovrebbe possedere quei dati. Ma, dato per assodato che li abbiano, devono anche mettere in campo misure per prevenire che chiunque possa usare lo strumento della richiesta di accesso per raccogliere informazioni e devono verificare che sia proprio tu che lo stai chiedendo”. E aggiunge: “Quello che è importante è che non abusino dei dati forniti e cancellino documenti di identità e foto dopo il processo di verifica, quei meccanismi dietro le quinte di cui noi non abbiamo piena conoscenza. Possiamo solo fidarci delle loro risposte”. A detta di Clearview, sul database sono salvate solo immagini, senza nomi, cognomi o altri identificativi, motivo per cui la startup chiede una foto per cercare eventuali abbinamenti.

Come si accede al database di Clearview Ai
Come si accede al database di Clearview Ai

Come ci possiamo difendere

L’unico modo per difendersi è esercitare i propri diritti: scoprire se si è nella loro rete e, in caso, fare reclamo al garante”, spiega Riccardo Coluccini, tra i promotori di #ReclaimYourFace, una campagna internazionale per tutelare i cittadini dalle raccolte incontrollate di dati biometrici. Lo stesso garante e il Centro Hermes per i diritti digitali offrono modulistica e assistenza per esercitare i diritti previsti dal Gdpr. Coluccini, che già nel 2019 ha fatto un accesso ai dati di Clearview e scoperto di essere nel database, osserva che “servirebbe un’azione di concerto delle varie autorità europee, visto che il regolamento è lo stesso, per dichiarare questo sistema illegale, come ha fatto il Canada”.

Come si accede al database di Clearview Ai
Come si accede al database di Clearview Ai

Un altro approccio a queste raccolte di dati biometrici è possibile. Coluccini cita il caso di Mozilla, la no profit dietro il browser Firefox, che “per l’addestramento di un sistema di riconoscimento vocale chiedeva di partecipare, leggendo ad alta voce una frase”. C’era un consenso dei partecipanti, quindi, e basandosi la ricerca su una specifica frase, non era possibile caricare audio a caso. Al polo opposto c’è la pesca a strascico di Clearview Ai. “Ma è solo il caso più eclatante – commenta Coluccini -. C’è una dilagazione di questi dataset biometrici raccolti senza consenso”.

The post Ho scoperto che la più discussa società di riconoscimento facciale al mondo ha le mie foto appeared first on Wired.



Leggi l’articolo su wired.it