czy masz do czynienia z dużymi ilościami danych? Czy Twoje dane zawierają hierarchiczne informacje (np. wiele recenzji dla jednego produktu)? Następnie musisz używać JSON jako swojego formatu danych zamiast CSV.
oferujemy widoki CSV podczas pobierania danych z Datafiniti dla wygody, ale zawsze zachęcamy Użytkowników do korzystania z widoków JSON. Zapoznaj się z tymi powodami, aby zobaczyć, jak potoki danych mogą skorzystać na przejściu.
JSON jest lepszy w pokazywaniu danych hierarchicznych / relacyjnych
rozważ pojedynczy rekord biznesowy w Datafiniti. Oto zestawienie pól, które możesz zobaczyć
- Nazwa firmy
- Adres firmy
- Lista kategorii
- lista recenzji (każda z datą, użytkownikiem, oceną, tytułem, tekstem i źródłem)
teraz rozważ listę tych rekordów produktów. Każdy produkt będzie miał inną liczbę cen i opinii.
oto jak wyglądałyby przykładowe dane w pliku CSV (Datafiniti link):
a oto te same dane w JSON (Datafiniti link):
widok JSON wygląda o wiele lepiej, prawda?
CSV straci dane
jeśli przyjrzysz się bliżej powyższym danym CSV, zauważysz, że mamy określoną liczbę cen i opinii dla każdego produktu. Dzieje się tak dlatego, że jesteśmy zmuszeni do dokonania pewnych odcięć od tego, ile pokazujemy cen i opinii. Gdybyśmy tego nie zrobili, każdy wiersz miałby inną liczbę kolumn, co uniemożliwiłoby przetwarzanie danych. Niestety wiele produktów ma dziesiątki, a nawet setki cen i recenzji. Oznacza to utratę wielu cennych danych za pomocą widoku CSV.
standardowa aplikacja CSV reader (Excel) jest okropna
Excel świetnie nadaje się do ładowania małych, wysoce ustrukturyzowanych plików arkuszy kalkulacyjnych. To straszne w ładowaniu plików, które mogą mieć wiersze 10,000, kolumny 100+, z niektórymi z tych kolumn wypełnionymi niestrukturalnym tekstem, takim jak recenzje lub opisy. Okazuje się, że Excel nie przestrzega standardów formatowania CSV, więc mimo że poprawnie kodujemy wszystkie znaki, Excel nie wie, jak to odczytać. Powoduje to, że niektóre pola rozlewają się do sąsiednich kolumn, co sprawia, że dane są nieczytelne.
JSON jest łatwiejszy do pracy w skali
bez wątpienia JSON jest de facto wyborem podczas pracy z danymi w skali. Większość nowoczesnych interfejsów API jest spokojna i dlatego natywnie obsługuje wejścia i wyjścia JSON. Obsługuje je kilka technologii bazodanowych (w tym większość wersji NoSQL). Jest to znacznie łatwiejsze do pracy w większości języków programowania, jak również. Wystarczy spojrzeć na ten prosty kod PHP do pracy z jakimś JSON z Datafiniti:
Czytaj dalej
Sprawdź te pomocne linki, aby lepiej zapoznać się z JSON:
- podstawy JSON
- pierwsze kroki z JSON