Apache Parquet, c'est quoi ??

Поділитися
Вставка
  • Опубліковано 27 сер 2024
  • 📽️ Abonnez-vous : bit.ly/2UnOdgi
    🖥️ Devenir membre VIP : bit.ly/3dItQU9
    👂 Podcast : podcast.ausha....
    Apache Parquet est un format de fichier très connu dans le stockage de la données et notamment pour le stockage en datascience. Dans ce tutoriel, nous allons découvrir ses particularités notamment pour ses performances en matière de compression et d'encodage.
    En outre, nous abordons les fichiers parquet dans la playlist #clickhouse car ils font partie des formats supportés par clichouse. Parquet est utilisable par de nombreux outil tels que drill, duckdb, trino... Et ses capacités de compression et d'interrogation le rendre très pratique pour valoriser du stockage S3.
    Site officiel : parquet.apache...
    Github : github.com/apa...
    Sommaire de plus de 1500 vidéos :
    - sur github : bit.ly/2P5x8Xj
    - sur gitlab : bit.ly/2BvYouO
    ➡️ ➡️ Vous voulez m'encourager likez la vidéo, commentez-là et abonnez-vous ! 😃

КОМЕНТАРІ • 9

  • @an955
    @an955 Рік тому +2

    Merci beaucoup !

  • @higiniofuentes2551
    @higiniofuentes2551 Рік тому +1

    Merci pour cette vidéo très intéressante et pratique !

    • @xavki
      @xavki  Рік тому +1

      Avec plaisir 🙂

  • @claude_1c74
    @claude_1c74 Рік тому +1

    Intéressant! ! mais un peu plus compliqué qu'un fichier CSV

    • @xavki
      @xavki  Рік тому +1

      Yes l'objectif c'est la performance et la volumétrie.

  • @mjcc_
    @mjcc_ Рік тому +4

    À la place de Marseille, il fallait mettre Orange comme ville ça aurait fait Caen Paris Orange (Campari orange). OK je sors 😅

    • @xavki
      @xavki  Рік тому +1

      Excellent bien vu faut la trouver celle-ci 😁

  • @higiniofuentes2551
    @higiniofuentes2551 Рік тому +1

    Je ne savais pas que pandas pouvait être utilisé sans jupyter ou autres !

    • @xavki
      @xavki  Рік тому +1

      Euh c'est juste du python oui