lo Hacen para tratar con grandes volúmenes de datos? ¿Sus datos contienen información jerárquica (por ejemplo, múltiples revisiones de un solo producto)? Luego, debe usar JSON como formato de datos de referencia en lugar de CSV.
Ofrecemos vistas CSV al descargar datos de Datafiniti por comodidad, pero siempre alentamos a los usuarios a usar las vistas JSON. Echa un vistazo a estas razones para ver cómo tu canalización de datos puede beneficiarse de hacer el cambio.
JSON es mejor para mostrar datos jerárquicos / relacionales
Considere un solo registro de negocio en Datafiniti. Este es un desglose de los campos que puede ver
- Nombre de la empresa
- Dirección de la empresa
- Una lista de categorías
- Una lista de opiniones (cada una con fecha, usuario, calificación, título, texto y fuente)
Ahora considere una lista de estos registros de productos. Cada producto tendrá un número diferente de precios y comentarios.
Así es como se verían algunos datos de muestra en CSV (enlace Datafiniti):
Y aquí están los mismos datos en JSON (enlace Datafiniti):
La vista JSON se ve mucho mejor, ¿verdad?
CSV perderá datos
Si observa detenidamente los datos CSV anteriores, notará que tenemos un número establecido de precios y reseñas para cada producto. Esto se debe a que nos vemos obligados a hacer un corte para cuántos precios y comentarios mostramos. Si no lo hiciéramos, cada fila tendría un número diferente de columnas, lo que haría casi imposible analizar los datos. Desafortunadamente, muchos productos tienen docenas o incluso cientos de precios y reseñas. Esto significa que termina perdiendo una gran cantidad de datos valiosos al usar la vista CSV.
La aplicación de lector de CSV estándar (Excel) es terrible
Excel es ideal para cargar archivos de hoja de cálculo pequeños y altamente estructurados. Es terrible para cargar archivos que pueden tener 10,000 filas, más de 100 columnas, con algunas de estas columnas pobladas por texto no estructurado, como reseñas o descripciones. Resulta que Excel no sigue los estándares de formato CSV, por lo que a pesar de que codificamos correctamente todos los caracteres, Excel no sabe cómo leer eso. Esto hace que algunos campos se extiendan a columnas adyacentes, lo que hace que los datos sean ilegibles.
Es más fácil trabajar con JSON a escala
Sin lugar a dudas, JSON es la opción de facto cuando se trabaja con datos a escala. La mayoría de las API modernas son RESTful y, por lo tanto, admiten de forma nativa entradas y salidas JSON. Varias tecnologías de base de datos (incluidas la mayoría de las variaciones NoSQL) lo soportan. También es significativamente más fácil trabajar con la mayoría de los lenguajes de programación. Simplemente eche un vistazo a este sencillo código PHP para trabajar con algunos JSON de Datafiniti:
Leer más
Echa un vistazo a estos enlaces útiles para familiarizarte con JSON:
- Los conceptos básicos de JSON
- Primeros pasos con JSON