Una grande quantità di dati

E’ sicuramente particolare che il termine scelto dall’ingegnere e matematico Claude Shannon per indicare l’unità di misura dell’informazione sia proprio “bit”. Il “bit” è infatti anche una delle tantissime unità di misura usate in ambito informatico. Non vi è necessariamente un collegamento tra i due differenti “bit”, come spiega la voce di Wikipedia.

Certo il fatto è però curioso. L’informatica del resto può essere intesa come una “costola” dell’informazione, come mi insegnava un solerte professore di scienze alle medie. Informatica è infatti un termine che nasce dall’unione di due parole, “informazione automatica”.

L’esigenza di veicolare in modo rapido le informazioni è tra le cause principali delle stupefacenti evoluzioni tecniche e tecnologiche degli ultimi anni.

A che punto siamo oggi? Siamo diventati bravissimi a veicolare e trasmettere le informazioni (che ci assaltano ormai da tutte le parti), ma abbiamo dei problemi sia nella gestione della quantità delle informazioni prodotte che nella cernita qualitativa delle stesse.

sistema binario

E chiamali server…

Le due cose sono strettamente collegate. Ciò che spesso ci interessa di una informazione, potremmo dire, è la sua qualità, ciò che essa ci comunica, il senso di tale informazione. E tuttavia l’informazione è “sempre” indissolubilmente legata alla materia. Avendo l’informazione una dinamica che parte da un “emittente” ed arriva ad un recettore necessita di un supporto che permetta tale passaggio.

Pensiamo per un attimo al linguaggio verbale, via fondamentale della comunicazione. E’ affascinante notare come esso viva persistentemente a cavallo tra la realtà materiale e quella immateriale. E’ movimento del corpo che diviene voce, onda invisibile ma materiale che colpisce le orecchie e poi la mente di chi ascolta. Poi di nuovo il silenzio, ma non tutto scompare, perché dovrebbe restare il senso di ciò che è stato detto, nell’altro. Una materialità dileguantesi.

I problemi quantitativi iniziano quando tali informazioni vanno conservate, archiviate, registrate. Come accade con internet.

Quando navighiamo e saltiamo allegramente da un link all’altro nell’universo virtuale tendiamo a dimenticarci di questa insopprimibile “matericità”. Basta però qualche foto per riportarcela alla mente:

Questa è la server farm di Facebook in California (Santa Clara), fotografata dal Times. Questi invece i datacenter di Google.

La matericità gentile e discreta della voce è l’antenata dimenticata di questi “circuiti di mille valvole”.

Misurare i dati: il sitema binario

Per orientarsi in questa immane mole di dati bisogna avventurasi nelle unità di misura tipiche dell’informatica.

Come è noto, l’informatica ha diffuso a livello planetario delle modalità di calcolo differenti rispetto a quelle che utilizziamo comunemente. La nostra matematica quotidiana si basa sul sistema numerico decimale, utilizziamo cioè 10 cifre (0, 1, 2, 3, 4, 5, 6, 7, 8, 9). In pratica contiamo da zero fino a nove, e poi ricominciamo.

In informatica invece è divenuto standard il sistema binario che utilizza due sole cifre (tradizionalmente 0 e 1). Per intendersi, contare con un sistema binario significa arrivare a 1, e poi ricominciare. Si può chiaramente tradurre i numeri del sistema decimale in quelli del sistema binario. 0 e 1 del sistema decimale corrispondono a 0 e 1 del sistema binario. Ma già il 2 del sistema decimale non esiste come cifra nel sistema binario, che quindi deve “ricominciare il conto” mescolando le due cifre che ha a disposizione. Il 2 del decimale diviene quindi 10, nel sistema binario, e così via (3 – 11, 4 – 100, 5 – 101…).

A questi due numeri si possono associare dei valori logici. Per fare un esempio, 0 può corrispondere al falso, 1 al vero. Le combinazioni delle due cifre del sistema binario sono potenzialmente infinite, e così anche le possibili combinazioni logiche.

In informatica è detto “bit” una delle due cifre del sistema binario, 0 o 1, con ad essa associato un determinato “stato logico”, se così si può dire. Una qualsiasi logica matematica così espressa, può essere simulata da un circuito elettronico basato su due livelli differenti di tensione elettrica (da qualcosa, quindi, di materiale).

Negli oggetti tecnologici di uso comune, sequenze di bit vengono tradotte e poi restituiteci in diverse modalità. Per fare un esempio, i caratteri che utilizziamo per la scrittura dei testi vengono tradotti in sequenze di bit secondo varie codifiche (UTF-8 e ASCII).

Il “bit” ha tantissimi multipli. Il byte, per esempio, corrisponde ad 8 bit. Per avvicinarci a comprendere la quantità di dati che circolano nell’universo digitale dobbiamo introdurre un multiplo veramente notevole: lo Zettabyte. Tale unità di misura corrisponde a due cifre diverse (per incomprensioni nella standardizzazione di uno dei suoi sottomultipli), entrambe impressionanti: 1021 byte (ossia 1 triliardo di byte), 270 byte.

Un’analisi di qualche anno fa della compagnia di ricerche di mercato IDC può aiutarci ad avere un’idea della vastità dell’universo digitale. Stando a tale ricerca l’universo digitale era nel 2013 di 4,3 zettabytes e avrebbe raggiunto i 44 zettabytes nel 2020.

Per avere una misura più vicina alla nostra esperienza possiamo utilizzare alcuni esempi. Se volessimo immagazzinare questi dati in dei DVD, l’insieme dei DVD coprirebbe la distanza dalla terra alla luna due volte. Se utilizzassimo invece dei Samsung S5 per immagazzinare tali dati, potremmo costruire una catena di smartphone in grado di abbracciare la terra 121,8 volte.