Dans le monde d'aujourd'hui, Apache Parquet est devenu de plus en plus pertinent. Que ce soit dans le domaine politique, technologique, culturel ou autre, Apache Parquet est devenu un sujet d'intérêt et de débat constant. Avec les progrès de la mondialisation et l’interconnexion des sociétés, Apache Parquet a eu un impact significatif sur la façon dont les gens interagissent les uns avec les autres et perçoivent le monde qui les entoure. Dans cet article, nous explorerons en profondeur l'impact de Apache Parquet sur différents aspects de la société, en analysant son influence et ses conséquences aujourd'hui.
Développé par | Apache Software Foundation |
---|---|
Première version | [1] |
Dépôt | git-wip-us.apache.org/repos/asf/parquet-mr.git |
Écrit en | Java |
Type |
Projet de la fondation Apache (d) Format de fichier (en) |
Licence | Licence Apache 2.0 |
Documentation | parquet.apache.org/docs |
Site web | parquet.apache.org |
Extension | .parquet |
---|---|
Type MIME | application/vnd.apache.parquet |
PUID | |
Signature | 50 41 52 31 (hexa) |
Développé par | |
Version initiale |
, |
Site web |
(en) parquet.apache.org |
Apache Parquet est un format de fichiers orienté colonne, initialement développé pour l'écosystème de calcul distribué Apache Hadoop. Il est similaire aux autres formats de fichiers de stockage colonnaires disponibles dans Hadoop, à savoir RCFile et Optimized RCFile. Il est compatible avec la plupart des frameworks de traitement de données de l'environnement Hadoop. Il fournit des schémas efficaces de compression et de codage de données avec des performances améliorées pour gérer des données complexes en masse.
Le projet open source qui a abouti à Apache Parquet vient des efforts conjoints entre Twitter[2] et Cloudera[3]. La première version de Apache Parquet 1.0 sort en . Depuis le Apache Parquet devient un projet top-level de la Apache Software Foundation [4],[5]