håndterer du store mængder data? Indeholder dine data hierarkiske oplysninger (f. eks. flere anmeldelser for et enkelt produkt)? Derefter skal du bruge JSON som dit go-to-dataformat i stedet for CSV.
vi tilbyder CSV-visninger, når du henter data fra Datafiniti for nemheds skyld, men vi opfordrer altid brugerne til at bruge JSON-visningerne. Tjek disse grunde for at se, hvordan din datapipeline kan drage fordel af at skifte.
JSON er bedre til at vise hierarkiske / relationelle data
overvej en enkelt forretningsrekord i Datafiniti. Her er en oversigt over de felter, du muligvis ser
- firmanavn
- forretningsadresse
- en liste over kategorier
- en liste over anmeldelser (hver med en dato, bruger, vurdering ,titel, tekst og kilde)
overvej nu en liste over disse produktregistre. Hvert produkt vil have et andet antal priser og anmeldelser.
Sådan ser nogle eksempler på data ud i CSV (Datafiniti link):
og her er de samme data i JSON (Datafiniti link):
JSON-udsigten ser så meget bedre ud, højre?
CSV mister data
hvis du ser nøje på CSV-dataene ovenfor, vil du bemærke, at vi har et bestemt antal priser og anmeldelser for hvert produkt. Dette skyldes, at vi er tvunget til at gøre nogle cut-off for hvor mange priser og anmeldelser, vi viser. Hvis vi ikke gjorde det, ville hver række have et andet antal kolonner, hvilket ville gøre det umuligt at analysere dataene. Desværre har mange produkter snesevis eller endda hundredvis af priser og anmeldelser. Dette betyder, at du ender med at miste en masse værdifulde data ved hjælp af CSV-visningen.
standard CSV-læserapplikationen er forfærdelig
er fantastisk til indlæsning af små, meget strukturerede Regnearksfiler. Det er forfærdeligt at indlæse filer, der kan have 10.000 rækker, 100+ kolonner, med nogle af disse kolonner befolket af ustruktureret tekst som anmeldelser eller beskrivelser. Det viser sig, at vi ikke følger CSV-formateringsstandarder, så selvom vi korrekt koder alle tegnene, ved vi ikke, hvordan man læser det. Dette resulterer i, at nogle felter spildes over i tilstødende kolonner, hvilket gør dataene ulæselige.
JSON er lettere at arbejde med i skala
uden tvivl er JSON det de facto valg, når man arbejder med data i skala. De fleste moderne API ‘ er er afslappende og understøtter derfor naturligt JSON input og output. Flere databaseteknologier (inklusive de fleste Noskl-variationer) understøtter det. Det er også betydeligt lettere at arbejde med inden for de fleste programmeringssprog. Bare tag et kig på denne enkle PHP kode til at arbejde med nogle JSON fra Datafiniti:
yderligere læsning
tjek disse nyttige links for at blive mere fortrolig med JSON:
- det grundlæggende i JSON
- Kom godt i gang med JSON