Avro — это система сериализации данных, разработанная в рамках проекта Apache Hadoop. Она предоставляет богатую структуру данных, компактный, быстрый бинарный формат данных, контейнерный файл для хранения постоянных данных, удаленный вызов процедур (RPC) и простую интеграцию с динамическими языками. Avro использует JSON для определения типов данных и протоколов, а данные сериализуются в компактном бинарном формате. Его основное применение — в Hadoop, где он используется для сериализации данных и служб обмена данными. Avro особенно хорошо подходит для приложений, требующих эволюции схемы, поскольку он хранит схему вместе с данными. Это позволяет читателям обрабатывать данные, даже если схема изменилась с момента записи данных. Возможности эволюции схемы Avro в сочетании с его эффективным бинарным форматом делают его популярным выбором для хранения и обмена данными в средах больших данных (Big Data). Он поддерживает сложные типы данных и спроектирован для обеспечения высокой производительности как при чтении, так и при записи данных. Файлы Avro часто используются для распределенного хранения больших наборов данных.