hanterar du stora datamängder? Innehåller dina data hierarkisk information (t. ex. flera recensioner för en enda produkt)? Då måste du använda JSON som ditt go-to-dataformat istället för CSV.
vi erbjuder CSV-vyer när du hämtar data från Datafiniti för enkelhetens skull, men vi uppmuntrar alltid användare att använda JSON-vyerna. Kolla in dessa skäl för att se hur din datapipeline kan dra nytta av att byta.
JSON är bättre på att visa hierarkiska / relationsdata
Tänk på en enda affärsrekord i Datafiniti. Här är en uppdelning av de fält du kan se
- företagsnamn
- företagsadress
- en lista med kategorier
- en lista med recensioner (var och en med datum, användare, betyg, titel, text och källa)
Tänk nu på en lista över dessa produktposter. Varje produkt kommer att ha ett annat antal priser och recensioner.
här är hur vissa exempeldata skulle se ut i CSV (Datafiniti länk):
och här är samma data i JSON (Datafiniti link):
JSON view ser så mycket bättre ut, eller hur?
CSV kommer att förlora data
om du tittar noga på CSV-data ovan kommer du att märka att vi har ett visst antal priser och recensioner för varje produkt. Detta beror på att vi är tvungna att göra några cut-off för hur många priser och recensioner vi visar. Om vi inte gjorde det skulle varje rad ha ett annat antal kolumner, vilket skulle göra det omöjligt att analysera data. Tyvärr har många produkter dussintals eller till och med hundratals priser och recensioner. Det betyder att du slutar förlora mycket värdefull data genom att använda CSV-vyn.
standard CSV-läsarprogrammet (Excel) är hemskt
Excel är bra för att ladda små, mycket strukturerade kalkylblad. Det är hemskt att ladda filer som kan ha 10 000 rader, 100+ kolumner, med några av dessa kolumner befolkade av ostrukturerad text som recensioner eller beskrivningar. Det visar sig att Excel inte följer CSV-formateringsstandarder, så även om vi korrekt kodar alla tecken, vet Excel inte hur man läser det. Detta resulterar i att vissa fält spills över i intilliggande kolumner, vilket gör data oläsliga.
JSON är lättare att arbeta med i skala
utan fråga är JSON de facto-valet när man arbetar med data i skala. De flesta moderna API: er är vilsamma och stöder därför JSON-ingång och-utgång. Flera databastekniker (inklusive de flesta NoSQL-variationer) stöder den. Det är betydligt lättare att arbeta med inom de flesta programmeringsspråk också. Ta bara en titt på denna enkla PHP-kod för att arbeta med några JSON från Datafiniti:
Vidare läsning
kolla in dessa användbara länkar för att bli mer bekant med JSON:
- grunderna i JSON
- komma igång med JSON