heeft u te maken met grote hoeveelheden data? Bevatten uw gegevens hiërarchische informatie (bijv. meerdere beoordelingen voor één product)? Dan moet u gebruik maken van JSON als uw go – to data formaat in plaats van CSV.
we bieden CSV-weergaven bij het downloaden van gegevens van Datafiniti voor het gemak, maar we moedigen gebruikers altijd aan om de JSON-weergaven te gebruiken. Bekijk deze redenen om te zien hoe uw data pipeline kan profiteren van het maken van de switch.
JSON is beter in het tonen van hiërarchische / relationele gegevens
beschouw een enkele zakelijke record in Datafiniti. Hier is een uitsplitsing van de velden die u kunt zien
- bedrijfsnaam
- zakelijk adres
- een lijst met categorieën
- een lijst met beoordelingen (elk met een datum, gebruiker, waardering, titel, tekst en bron)
overweeg nu een lijst van deze productrecords. Elk product heeft een ander aantal prijzen en beoordelingen.
hier is hoe sommige voorbeeldgegevens eruit zouden zien in CSV (Datafiniti link):
en hier zijn dezelfde gegevens in JSON (Datafiniti link):
de JSON view ziet er veel beter uit, toch?
CSV verliest gegevens
als u de bovenstaande CSV-gegevens goed bekijkt, zult u merken dat we een vast aantal prijzen en beoordelingen voor elk product hebben. Dit komt omdat we gedwongen zijn om een cut-off te maken voor hoeveel prijzen en beoordelingen we laten zien. Als we dat niet deden, zou elke rij een ander aantal kolommen hebben, wat het ontleden van de gegevens bijna onmogelijk zou maken. Helaas hebben veel producten tientallen of zelfs honderden prijzen en beoordelingen. Dit betekent dat je uiteindelijk verliest veel waardevolle gegevens met behulp van de CSV view.
de standaard CSV reader applicatie (Excel) is verschrikkelijk
Excel is geweldig voor het laden van kleine, zeer gestructureerde spreadsheet bestanden. Het is verschrikkelijk in het laden van bestanden die 10.000 rijen, 100+ kolommen kunnen hebben, met sommige van deze kolommen gevuld met ongestructureerde tekst zoals beoordelingen of beschrijvingen. Het blijkt dat Excel niet CSV-opmaakstandaarden volgt, dus hoewel we alle tekens correct coderen, Weet Excel niet hoe dat te lezen. Dit resulteert in sommige velden morsen over in aangrenzende kolommen, waardoor de gegevens onleesbaar.
JSON is gemakkelijker om mee te werken op schaal
zonder twijfel is JSON de de-facto keuze bij het werken met data op schaal. De meeste moderne API ‘ s zijn rustgevend en ondersteunen daarom JSON input en output. Verschillende databasetechnologieën (waaronder de meeste NoSQL-varianten) ondersteunen het. Het is aanzienlijk gemakkelijker om te werken met binnen de meeste programmeertalen ook. Neem een kijkje op deze eenvoudige PHP-code voor het werken met een aantal JSON van Datafiniti:
verder lezen
bekijk deze nuttige links om meer vertrouwd te raken met JSON:
- de basis van JSON
- aan de slag met JSON