4 Gründe, warum Sie JSON anstelle von CSV verwenden sollten

 Datafiniti
Mär 16, 2014 · 3 min Lesezeit

Haben Sie mit großen Datenmengen zu tun? Enthalten Ihre Daten hierarchische Informationen (z. B. mehrere Bewertungen für ein einzelnes Produkt)? Dann müssen Sie JSON als Datenformat anstelle von CSV verwenden.

Wir bieten CSV-Ansichten an, wenn Sie Daten aus Datafiniti herunterladen, aber wir empfehlen Benutzern immer, die JSON-Ansichten zu verwenden. Sehen Sie sich diese Gründe an, um zu sehen, wie Ihre Datenpipeline von der Umstellung profitieren kann.

JSON kann hierarchische / relationale Daten besser anzeigen

Betrachten Sie einen einzelnen Geschäftsdatensatz in Datafiniti. Hier finden Sie eine Aufschlüsselung der angezeigten Felder

  • Firmenname
  • Geschäftsadresse
  • Eine Liste der Kategorien
  • Eine Liste der Bewertungen (jeweils mit Datum, Benutzer, Bewertung, Titel, Text und Quelle)

Betrachten Sie nun eine Liste dieser Produktdatensätze. Jedes Produkt hat eine andere Anzahl von Preisen und Bewertungen.

So würden einige Beispieldaten in CSV aussehen (Datafiniti link):

Und hier sind die gleichen Daten in JSON (Datafiniti link):

Die JSON-Ansicht sieht so viel besser aus, oder?

CSV verliert Daten

Wenn Sie sich die CSV-Daten oben genau ansehen, werden Sie feststellen, dass wir für jedes Produkt eine festgelegte Anzahl von Preisen und Bewertungen haben. Dies liegt daran, dass wir gezwungen sind, einen Grenzwert für die Anzahl der Preise und Bewertungen festzulegen, die wir anzeigen. Andernfalls hätte jede Zeile eine andere Anzahl von Spalten, was das Analysieren der Daten nahezu unmöglich machen würde. Leider haben viele Produkte Dutzende oder sogar Hunderte von Preisen und Bewertungen. Dies bedeutet, dass Sie durch die Verwendung der CSV-Ansicht viele wertvolle Daten verlieren.

Die Standard-CSV-Reader-Anwendung (Excel) ist schrecklich

Excel eignet sich hervorragend zum Laden kleiner, hochstrukturierter Tabellenkalkulationsdateien. Es ist schrecklich, Dateien zu laden, die 10.000 Zeilen, 100+ Spalten haben können, wobei einige dieser Spalten mit unstrukturiertem Text wie Bewertungen oder Beschreibungen gefüllt sind. Es stellt sich heraus, dass Excel nicht den CSV-Formatierungsstandards folgt, und obwohl wir alle Zeichen richtig codieren, weiß Excel nicht, wie man das liest. Dies führt dazu, dass einige Felder in benachbarte Spalten übergehen, wodurch die Daten nicht lesbar werden.

JSON ist einfacher zu skalieren

Ohne Frage ist JSON die De-facto-Wahl, wenn Sie mit skalierten Daten arbeiten. Die meisten modernen APIs sind RESTful und unterstützen daher nativ JSON-Eingabe und -Ausgabe. Mehrere Datenbanktechnologien (einschließlich der meisten NoSQL-Varianten) unterstützen es. Es ist auch in den meisten Programmiersprachen wesentlich einfacher zu arbeiten. Schauen Sie sich einfach diesen einfachen PHP-Code an, um mit JSON von Datafiniti zu arbeiten:

Weiterführende Literatur

Lesen Sie diese hilfreichen Links, um sich mit JSON vertraut zu machen:

  • Die Grundlagen von JSON
  • Erste Schritte mit JSON

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.