大量のデータを処理していますか? データには階層情報が含まれていますか(単一の製品の複数のレビューなど)。 次に、CSVの代わりにJSONをデータ形式として使用する必要があります。
Datafinitiからデータをダウンロードする際には、利便性のためにCSVビューを提供していますが、常にJSONビューを使用することをお勧めします。 これらの理由をチェックして、データパイプラインがスイッチを作ることからどのように利益を得
JSONは、階層/リレーショナルデータを表示する方が優れています
Datafinitiの単一のビジネスレコードを考えてみてください。 ここでは、
- 会社名
- 会社住所
- カテゴリのリスト
- レビューのリスト(日付、ユーザー、評価、タイトル、テキスト、ソース)が表示される可能性のあるフィールドの内訳)
次に、これらの製品レコードのリストを考えてみましょう。 各製品には、価格とレビューの数が異なります。
いくつかのサンプルデータがCSV(Datafinitiリンク)でどのように見えるかは次のとおりです):
そして、ここにJSONの同じデータがあります(Datafinitiリンク):
JSONビューは、右、そんなに良く見えますか?
CSVはデータを失います
上記のCSVデータをよく見ると、各製品の価格とレビューの数が設定されていることがわかります。 これは、私たちが表示する価格とレビューの数のためにいくつかのカットオフを余儀なくされているからです。 そうしなかった場合、各行には異なる数の列があり、データの解析が不可能になります。 残念なことに、多くの製品には数十または数百の価格とレビューがあります。 これは、CSVビューを使用して多くの貴重なデータを失うことになることを意味します。
標準のCSVリーダーアプリケーション(Excel)はひどいです
Excelは、小さな、高度に構造化されたスプレッドシートファイルをロードするのに最適です。 レビューや説明のような構造化されていないテキストが入力されたこれらの列のいくつかで、10,000行、100以上の列を持つ可能性のあるファイルをロードす ExcelはCSV形式の標準に従っていないため、すべての文字を適切にエンコードしても、Excelはそれを読み取る方法を知らないことが判明しました。 これにより、いくつかのフィールドが隣接する列にこぼれ落ち、データが読めなくなります。
JSONは大規模で作業する方が簡単です
間違いなく、JSONは大規模でデータを操作するときの事実上の選択です。 最新のApiのほとんどはRESTfulであるため、JSONの入出力をネイティブにサポートしています。 いくつかのデータベース技術(ほとんどのNoSQLバリエーションを含む)がそれをサポートしています。 ほとんどのプログラミング言語内でも作業する方が大幅に簡単です。 DatafinitiからいくつかのJSONを扱うためのこの単純なPHPコードを見てみましょう:
さらに読む
JSONをよりよく理解するために、これらの有用なリンクをチェックしてください:
- JSONの基本
- JSONの入門