Immaginate di guardare la sezione di una montagna. Una parete di roccia tagliata verticalmente, dove improvvisamente compaiono bande diverse: sabbia compressa, argilla, sedimenti scuri, strati di calcare. Ogni livello racconta un’epoca diversa, un clima diverso, una trasformazione del paesaggio avvenuta molto prima che qualcuno arrivasse lì a osservare. I geologi chiamano questi livelli strata. Strati.
L’idea che ispira l’articolo Data Strata firmato da Elena Etter e pubblicato su Towards Data Science parte proprio da questa immagine: i dati funzionano molto più come una stratificazione geologica che come una superficie liscia. Guardare un dataset significa spesso guardare solo il primo strato, quello più visibile, mentre sotto esistono livelli di decisioni, infrastrutture e comportamenti che raramente vengono presi in considerazione. E una volta che iniziate a pensarci, è difficile tornare indietro.

Immagine dell’autrice ispirata da geological cross-section drawing e data visualisation diagram
La superficie dei dati
Il primo strato dei dati è quello che tutti vedono. Le righe e le colonne. Le percentuali. I grafici. È il livello su cui lavorano la maggior parte degli strumenti di analisi: fogli di calcolo, dashboard, modelli statistici. Qui i dati appaiono come oggetti chiari, definiti, pronti per essere interrogati. Le piattaforme digitali sono maestre nel costruire questa superficie perfetta.
Quando aprite le analytics di Instagram o TikTok, per esempio, vedete numeri limpidi: visualizzazioni, engagement rate, tempo medio di visione. Tutto sembra raccontare con precisione chirurgica cosa stanno facendo le persone. Il problema è che questa chiarezza è solo il primo strato. È la superficie.
Lo strato delle decisioni
Sotto ogni dataset esiste un livello molto meno visibile: quello delle decisioni che hanno prodotto quei dati. Ogni dataset nasce da scelte precise. Prendiamo Spotify. Quando l’app calcola le canzoni più ascoltate dell’anno, cosa conta davvero come “ascolto”? Una canzone riprodotta per tre secondi? Per trenta? Fino alla fine? E cosa succede se qualcuno lascia la musica in sottofondo mentre cucina o studia?
Il dataset non registra queste sfumature: registra solo ciò che il sistema ha deciso di considerare rilevante. Questo è uno degli aspetti centrali della metafora degli strati: i dati sono il risultato di un sistema di scelte progettuali.
Lo strato delle infrastrutture
Ancora più in profondità c’è lo strato dell’infrastruttura tecnologica. Molti dataset contemporanei nascono da un ecosistema complesso di sensori, piattaforme e sistemi di raccolta automatica. I dati vengono registrati inizialmente in forma grezza e poi trasformati in dataset leggibili attraverso una lunga catena di sistemi tecnici.
Pensate alla mobilità urbana. Le mappe del traffico che vedete su Google Maps o Waze sembrano semplici: linee rosse, arancioni, verdi. Ma quelle linee sono il risultato di milioni di segnali GPS provenienti dagli smartphone delle persone, raccolti, filtrati e aggregati da algoritmi che cercano di stimare la velocità media dei veicoli. Quando guardate quella mappa, vedete solo l’ultimo livello. Sotto esistono sensori, protocolli, algoritmi di pulizia dei dati, sistemi di aggregazione. Uno strato sopra l’altro.

diagramma degli strati geologici. fonte qui
Lo strato dei comportamenti
Poi c’è uno strato ancora più fragile: i comportamenti umani.
Molti dataset digitali sembrano descrivere azioni precise: click, acquisti, spostamenti. Ma dietro ogni riga del dataset esiste una situazione reale molto più ambigua. Un click su un sito può significare curiosità, distrazione, errore; un acquisto online può essere una decisione ponderata o un impulso notturno; un percorso GPS può essere la routine quotidiana o un evento eccezionale.
Il dataset comprime queste differenze. È uno dei motivi per cui i dati digitali sembrano così ordinati: gran parte della complessità del comportamento umano viene semplificata nel processo di registrazione.
Lo strato delle interpretazioni
E poi c’è l’ultimo livello, quello più instabile: l’interpretazione.
Ogni dataset può essere letto in molti modi diversi. Lo stesso insieme di dati può raccontare storie completamente diverse a seconda di chi lo osserva e delle domande che decide di porre. Pensate ai dati delle piattaforme di consegna di cibo.
Per una startup sono indicatori di performance logistica; per un urbanista diventano mappe dei flussi urbani; ma per un sociologo possono rivelare nuove forme di lavoro precario. Il dataset è lo stesso, cambiano le domande. E con le domande cambia lo strato interpretativo.

I dati come paesaggi
Pensare ai dati come a una stratificazione cambia profondamente il modo in cui li osserviamo. Significa riconoscere che un dataset non è mai un oggetto singolo. È piuttosto un paesaggio composto da livelli sovrapposti: infrastrutture tecnologiche, decisioni progettuali, comportamenti umani, interpretazioni analitiche.
Quando guardiamo solo la superficie numerica perdiamo gran parte di questa profondità. È un po’ come osservare una città soltanto attraverso una mappa. La mappa mostra strade e edifici, però non racconta le persone che attraversano quelle strade, le abitudini quotidiane, le decisioni che costruiscono la vita urbana. I dati funzionano allo stesso modo.
La profondità dei dati
Questa idea degli strati suggerisce anche un’altra cosa interessante: la profondità dei dati non dipende dalla quantità.
Molto spesso associamo dataset enormi a una maggiore ricchezza informativa. Ma la ricchezza dei dati non è solo una questione di volume. Dipende anche dalla capacità di riconoscere i diversi livelli che compongono un dataset.
Un dataset relativamente piccolo può essere estremamente profondo se riusciamo a leggere le decisioni che lo hanno prodotto, il contesto in cui è stato raccolto e i comportamenti che rappresenta. Al contrario, dataset giganteschi possono restare sorprendentemente superficiali se li osserviamo soltanto attraverso correlazioni statistiche.
L’idea dei Data Strata suggerisce quindi una cosa molto semplice dunque, ovvero che lavorare con i dati significa innanzitutto “scavarli”. E così, quando iniziate a guardare i dataset in questo modo, smettono di essere tabelle e diventano archivi.


