Categoria: Big Data

Ognuno di noi risiede almeno in un Big Data

La parola Big Data ci fa subito pensare ad un grande file, un grande server che può contenere altrettanto grandi archivi di dati.

Se fino a qualche anno fa, per una analisi o per fini di marketing era indispensabile lavorare su un numero minimo di dati (es. per fini statistici si parlava di “campione statistico”) oggi, con la diffusione di internet il numero dei dati raccolti è passato in secondo piano, infatti è piuttosto semplice raccogliere una grande mole di dati sul web o tramite un app e le attuali tecnologie permettono di gestire database con milioni di dati; l’interesse per le aziende che fanno dei nostri dati il loro business è avere Big Data sempre più “larghi” piuttosto che lunghi! ossia che aggiungono nuove caratteristiche ad una persona fisica che possano poi essere profilati.

Ecco come sono cresciuti nel tempo i big data in termini di spazio occupato :

  • nel 2000 i dati occupavano 2,2 ExaBytes;
  • nel 2007 i dati occupavano  65 ExaBytes;
  • nel 2014 i dati occupavano 650 ExaBytes
( 1 ExaByte = 1 trilione di bytes = 10 exp 18 bytes

Notiamo a tal proposito che i sondaggi telefonici o la richiesta di compilazione di “cartoline” con strane “domandine” sono praticamente scomparse dalla circolazione già da qualche anno, contemporaneamente sono aumentate le occasioni di raccolta dei dati in vari contesti digitali e non manca mai la richiesta di compilazione dei campi nome e cognome ed email unitamente ad altri campi apparentemente di secondo rilievo; in molte occasioni i nominativi richiesti potrebbero essere inutili soprattutto se il fine è quello di erogare servizi una tantum o dove il fruitore non è tenuto a fare il login.

Ciò implica conservazione occulta ed il trattamento dei nostri dati in discordanza delle leggi vigenti che lo consentono solo se risultano indispensabili e non eccedenti rispetto allo scopo per cui sono stati forniti.

Il web si è sviluppato secondo la logica di offrire servizi gratuiti (es. caselle email, invio di sms gratuiti, spazio web ecc.) con il chiaro intento di ripagarsi con gli introiti pubblicitari; i banner sono stati sin dall’inizio l’unica fonte di guadagno per retribuire i giornalisti che scrivono sui blog o sulle testate online, o per pagare i servizi offerti.

Noterete che oggi i banner sono molto più rari che qualche anno fa, e per di più anche i click sui link o sui banner viene retribuito circa l’80% in meno rispetto a 5 anni fa; come possono allora esistere app, software, servizi e quotidiani online gratuiti?

La risposta è : registrando i dati e i comportamenti dell’utilizzatore lo scopo è quello di accrescere i big data.

I social network offrono app e spazi gratuiti dove poter condividere immagini e pensieri, gli stessi vendono la pubblicità agli inserzionisti ma in modo profilato, ovvero l’acquirente potrà scegliere a chi far vedere la propria pubblicità scegliendo tra centinaia di caratteristiche; non c’è niente di male se siamo noi ad avere autorizzato la profilazione dei nostri dati, ma siamo sicuri di avere autorizzato l’utilizzo di tutti i nostri dati ? Siamo sicuri che tali strumenti non estraggano anche ciò che scriviamo e non ci assegnino anche un’ “etichetta” comportamentale ?

Se fino a qualche anno fa era inimmaginabile, oggi è piuttosto semplice e poco costoso sviluppare algoritmi anche “predittivi” che analizzano i big data.

Gli algoritmi sono software di analisi capaci di estrarre gruppi di nominativi presenti nel big data che con buona approssimazione possono avere un comportamento desiderato.

Facciamo un esempio:  l’estrazione dei nominativi e delle email di persone con la propensione al gioco d’azzardo sono sicuramente una platea di persone interessanti per un casinò virtuale.

Raggiungere una nicchia così profilata di persone senza doverglielo chiedere esplicitamente non è poi così difficile, basterebbe estrarre dai big data :

    • tutte le persone con almeno una carta di credito
    • tutte le persone che si sono recate almeno una volta in un certo lasso di tempo in una sala slot

I comportamenti di ognuno di noi vengono raccolti a seguito di ogni azione compiuta online; anche uno smartphone dotato di gps traccia il percorso e lo trasferisce, è facile rendersene conto effettuando una ricerca online di un esercizio commerciale, noteremo che si otterranno immediatamente anche le informazioni sull’affluenza e i sui tempi di permanenza; appare evidente che il gps dello smartphone non restituisca solo la posizione sulla mappa quando necessitiamo di un navigatore satellitare, trasferisce la nostra posizione in tempo reale su un server (a noi sconosciuto, per cui non ci si può nemmeno opporre al trattamento) che la registra e la elabora! Se pensiamo che ad ogni dispositivo è associata anche la nostra identità, il dato di posizione raccolto avrebbe ancor più valore se fosse associato al comportamento del singolo e non solo come dato statistico.

Gli stessi siti e social network raccolgono dati sui nostri comportamenti, addirittura riconoscono i siti visitati prima dell’ingresso e all’uscita, il nostro dispositivo, il sistema operativo, il tempo di permanenza ecc. ovviamente se il sito sul quale stiamo navigando ci richiede il login, è in grado di associare i comportamenti all’email e altri dati personali diventando anch’essi aggregatori di big data.

Da ultimo i dispositivi wearable e IoT ( Internet of things), ovvero tutti gli accessori hardware connessi a internet potrebbero anch’essi trasformarsi in sensori per profilare i nostri comportamenti.

A tal proposito Finantial Times già nel 2013 ha pubblicato un tool che permette di calcolare il valore di un dato personale profilato.

E’ facile stimare che ogni dato profilato ha un “valore di mercato” compreso tra € 1-3, capite bene quanto può valere un big data con milioni di utenti profilati.

Afferma il giurista Stefano Rodotà

Ci si interroga intorno agli effetti dei “Big Data”, espressione che non descrive soltanto la crescita quantitativa delle informazioni raccolte, ma nuove modalità della loro gestione, con effetti nelle più diverse dimensioni della vita sociale. Se non si vuole che qui si riproducano, persino ingigantiti, i rischi di concentrazioni incontrollabili di potere, di controlli sempre più capillari e diffusi, è indispensabile disporre dell’attrezzatura istituzionale necessaria che ribadisca la necessità che i Big Data vengano utilizzati in un ambiente che non perde il suo fondamento nelle libertà e nei diritti.”