Apache Parquet, c'est quoi ??
Вставка
- Опубліковано 27 сер 2024
- 📽️ Abonnez-vous : bit.ly/2UnOdgi
🖥️ Devenir membre VIP : bit.ly/3dItQU9
👂 Podcast : podcast.ausha....
Apache Parquet est un format de fichier très connu dans le stockage de la données et notamment pour le stockage en datascience. Dans ce tutoriel, nous allons découvrir ses particularités notamment pour ses performances en matière de compression et d'encodage.
En outre, nous abordons les fichiers parquet dans la playlist #clickhouse car ils font partie des formats supportés par clichouse. Parquet est utilisable par de nombreux outil tels que drill, duckdb, trino... Et ses capacités de compression et d'interrogation le rendre très pratique pour valoriser du stockage S3.
Site officiel : parquet.apache...
Github : github.com/apa...
Sommaire de plus de 1500 vidéos :
- sur github : bit.ly/2P5x8Xj
- sur gitlab : bit.ly/2BvYouO
➡️ ➡️ Vous voulez m'encourager likez la vidéo, commentez-là et abonnez-vous ! 😃
Merci beaucoup !
Merci pour cette vidéo très intéressante et pratique !
Avec plaisir 🙂
Intéressant! ! mais un peu plus compliqué qu'un fichier CSV
Yes l'objectif c'est la performance et la volumétrie.
À la place de Marseille, il fallait mettre Orange comme ville ça aurait fait Caen Paris Orange (Campari orange). OK je sors 😅
Excellent bien vu faut la trouver celle-ci 😁
Je ne savais pas que pandas pouvait être utilisé sans jupyter ou autres !
Euh c'est juste du python oui