4 Motivos para Você Usar o JSON em Vez de CSV

Datafiniti
Mar 16, 2014 · 3 min de leitura

você lida com grandes volumes de dados? Seus dados contêm informações hierárquicas (por exemplo, várias análises para um único produto)? Então você precisa estar usando JSON como seu formato de dados go-to em vez de CSV.

oferecemos visualizações CSV ao baixar dados do Datafiniti por conveniência, mas sempre incentivamos os usuários a usar as visualizações JSON. Confira esses motivos para ver como seu pipeline de dados pode se beneficiar ao fazer a troca.

JSON é melhor em Mostrar dados hierárquicos / relacionais

considere um único registro comercial no Datafiniti. Aqui está uma repartição dos campos você pode ver

  • nome da empresa
  • Business address
  • Uma lista de categorias
  • Uma lista de comentários (cada um com uma data, usuário, classificação, título, texto, e da fonte de)

Agora, considere uma lista de registros de produtos. Cada produto terá um número diferente de preços e avaliações.

veja como alguns dados de exemplo ficaria como CSV (Datafiniti link):

E aqui é que mesmo dados em JSON (Datafiniti link):

O JSON vista parece muito melhor, certo?

CSV vai perder dados

se você olhar atentamente para os dados CSV acima, você vai notar que temos um número definido de preços e comentários para cada produto. Isso ocorre porque somos forçados a fazer algum corte para quantos preços e comentários mostramos. Se não o fizéssemos, cada linha teria um número diferente de colunas, o que tornaria a análise dos dados quase impossível. Infelizmente, muitos produtos têm dezenas ou até centenas de preços e avaliações. Isso significa que você acaba perdendo muitos dados valiosos usando a visualização CSV.

o aplicativo CSV reader padrão (Excel) é terrível

o Excel é ótimo para carregar arquivos de planilha pequenos e altamente estruturados. É terrível ao carregar arquivos que podem ter 10.000 linhas, mais de 100 colunas, com algumas dessas colunas preenchidas por texto não estruturado, como revisões ou descrições. Acontece que o Excel não segue os padrões de formatação CSV, portanto, embora codifiquemos corretamente todos os caracteres, o Excel não sabe como ler isso. Isso resulta em alguns campos derramando em colunas adjacentes, o que torna os dados ilegíveis.

JSON é mais fácil de trabalhar em escala

sem dúvida, JSON é a escolha de fato ao trabalhar com dados em escala. A maioria das APIs modernas são RESTful e, portanto, suportam nativamente entrada e saída JSON. Várias tecnologias de banco de dados (incluindo a maioria das variações NoSQL) o suportam. É muito mais fácil trabalhar com a maioria das linguagens de programação também. Basta dar uma olhada no que este simples código PHP para trabalhar com alguns JSON a partir de Datafiniti:

Leitura Adicional

confira estes links úteis para ficar mais familiarizado com JSON:

  • O Básico do JSON
  • primeiros passos com JSON

Deixe uma resposta

O seu endereço de email não será publicado.