4 Motivi per cui dovresti usare JSON invece di CSV

Dati
16 Marzo 2014 * 3 minuti di lettura

Avete a che fare con grandi volumi di dati? I tuoi dati contengono informazioni gerarchiche (ad esempio, più recensioni per un singolo prodotto)? Quindi è necessario utilizzare JSON come formato di dati go-to invece di CSV.

Offriamo viste CSV quando si scaricano dati da Datafiniti per comodità, ma incoraggiamo sempre gli utenti a utilizzare le viste JSON. Dai un’occhiata a questi motivi per vedere come la tua pipeline di dati può trarre vantaggio dal passaggio.

JSON è migliore nel mostrare dati gerarchici / relazionali

Considera un singolo record aziendale in Datafiniti. Ecco una ripartizione dei campi che potresti vedere

  • Nome aziendale
  • Indirizzo aziendale
  • Un elenco di categorie
  • Un elenco di recensioni (ognuna con una data, utente, valutazione, titolo, testo e fonte)

Consideriamo ora un elenco di questi record di prodotto. Ogni prodotto avrà un diverso numero di prezzi e recensioni.

Ecco come appaiono alcuni dati di esempio in CSV (collegamento Datafiniti):

Ed ecco gli stessi dati in JSON (collegamento Datafiniti):

La vista JSON sembra molto meglio, giusto?

CSV perderà i dati

Se si guarda da vicino i dati CSV di cui sopra, si noterà che abbiamo un determinato numero di prezzi e recensioni per ogni prodotto. Questo perché siamo costretti a fare qualche cut-off per quanti prezzi e recensioni mostriamo. Se non lo facessimo, ogni riga avrebbe un numero diverso di colonne, il che renderebbe impossibile l’analisi dei dati. Sfortunatamente, molti prodotti hanno dozzine o addirittura centinaia di prezzi e recensioni. Ciò significa che si finisce per perdere molti dati preziosi utilizzando la vista CSV.

L’applicazione CSV reader standard (Excel) è terribile

Excel è ottimo per caricare file di fogli di calcolo piccoli e altamente strutturati. È terribile caricare file che possono avere 10.000 righe, oltre 100 colonne, con alcune di queste colonne popolate da testo non strutturato come recensioni o descrizioni. Si scopre che Excel non segue gli standard di formattazione CSV, quindi anche se codifichiamo correttamente tutti i caratteri, Excel non sa come leggerlo. Ciò si traduce in alcuni campi che si riversano in colonne adiacenti, il che rende i dati illeggibili.

JSON è più facile da lavorare su scala

Senza dubbio, JSON è la scelta de-facto quando si lavora con i dati su scala. La maggior parte delle API moderne sono RESTful e quindi supportano nativamente l’input e l’output JSON. Diverse tecnologie di database (inclusa la maggior parte delle varianti NoSQL) lo supportano. È molto più facile lavorare con la maggior parte dei linguaggi di programmazione. Basta dare un’occhiata a questo semplice codice PHP per lavorare con alcuni JSON da Datafiniti:

Ulteriori letture

Dai un’occhiata a questi link utili per familiarizzare con JSON:

  • Le basi di JSON
  • Introduzione a JSON

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.