Luigi Minnaja descrive il significato delle quattro V del Big Data
Le quattro V
La tecnologia Big Data si basa su quattro concetti fondamentali meglio conosciuti come le quattro V:
- Volume
- Velocity
- Variety
- Veracity
Volume
Con volume si intende la mole di dati da immagazzinare e successivamente analizzare. Il volume di dati generato ogni secondo è enorme e si parla ormai di Zattabytes o Brontobytes.
I nuovi tools utilizzati nell'ambito del Big Data si basano su sistemi distribuiti per poter gestire enormi quantità di dati.
Velocity
Con velocity ci si riferisce alla velocità con cui i nuovi dati vengono generati e la velocità con cui si muovono nella rete. Pensiamo ad esempio ad un messaggio su un social network che diventa virale. La tecnologia Big Data permette di analizzare i dati non appena vengono generati senza nemmeno doverli precedentemente registrare su uno storage, questa tecnica è conosciuta come in-memory analytics.
Variety
Con variety si intende la varietà di dati che si possono analizzare. In passato venivano analizzati esclusivamente dati strutturati che ben si adattavano a tabelle e database relazionali. Al giorno d'oggi la maggior parte dei dati generati sono non strutturati (testi, immagini, video, audio, etc.). La tecnologia Big Data permette la gestione di dati disomogenei.
Veracity
Con veracity si intende la qualità del dato inteso come correttezza e attendibilità. Se pensiamo ad esempio ai dati generati dal social network Twitter i messaggi contengono un elevato numero di errori di battitura, hashtag, abbreviazioni, forme colloquiali, inoltre l'attendibilità di questi dati è tutta da verificare.
<< Big Data 3° parte - Big Data 5° parte >>
Indice Articoli - Luigi Minnaja