Apache Parquet هو تنسيق تخزين عمودي (columnar storage format) مُحسَّن للاستخدام مع أُطر عمل معالجة البيانات الضخمة (big data processing frameworks). على عكس التنسيقات الموجهة بالصف (row-oriented formats)، يقوم Parquet بتخزين البيانات حسب الأعمدة، مما يتيح ضغطًا وتشفيرًا فعالين للبيانات. يُمكّن هذا التخزين العمودي محركات الاستعلام (query engines) من استرداد الأعمدة الضرورية فقط لاستعلام معين، مما يقلل بشكل كبير من عمليات الإدخال/الإخراج (I/O) ويحسن أداء الاستعلام. تم تصميم Parquet ليكون وصفيًا ذاتيًا (self-describing)، مما يعني أن المخطط (schema) مُضمَّن داخل ملف البيانات نفسه. وهذا يلغي الحاجة إلى مخازن بيانات وصفية خارجية (external metadata stores) ويبسط إدارة البيانات. يدعم Parquet مجموعة واسعة من أنواع البيانات والهياكل المتداخلة المعقدة. يُستخدم Parquet على نطاق واسع في مستودعات البيانات (data warehousing)، وبحيرات البيانات (data lakes)، وتطبيقات البيانات الضخمة الأخرى حيث يكون التخزين والاسترجاع الفعال للبيانات أمرًا بالغ الأهمية. إن تكامله مع الأُطر الشائعة مثل Apache Spark، وHadoop، وPresto يجعله خيارًا متعدد الاستخدامات لخطوط أنابيب معالجة البيانات. تم تصميم التنسيق لعمليات القراءة والكتابة على حد سواء، على الرغم من أنه غالبًا ما يُستخدم في السيناريوهات التي يتم فيها كتابة البيانات مرة واحدة وقراءتها عدة مرات (write-once, read-many).