ARFF (Attribute-Relation File Format – Формат файла атрибутов и отношений) — это текстовый формат файла, разработанный Группой машинного обучения (Machine Learning Group) в Университете Уаикато (University of Waikato) для описания наборов данных, используемых в машинном обучении. Он в основном используется с программным обеспечением WEKA (Waikato Environment for Knowledge Analysis — Среда Уаикато для анализа знаний), но также поддерживается многими другими инструментами машинного обучения. Файл ARFF состоит из двух основных частей: секции заголовка (header section) и секции данных (data section). Секция заголовка определяет имя отношения (relation name, имя набора данных) и объявляет атрибуты (attributes — признаки или столбцы) данных. Каждый атрибут объявляется с указанием его имени и типа данных (например, numeric — числовой, nominal — номинальный, string — строковый, date — дата). Секция данных содержит фактические экземпляры данных (data instances), причем каждый экземпляр представлен в виде списка значений атрибутов, разделенных запятыми. Пропущенные значения (missing values) обычно обозначаются знаком вопроса (?). Файлы ARFF разработаны таким образом, чтобы быть удобочитаемыми для человека и легко анализироваться (парситься) алгоритмами машинного обучения, что делает их популярным выбором для хранения и обмена наборами данных в сообществе машинного обучения. Формат поддерживает различные типы данных и позволяет представлять как числовые, так и категориальные данные, что делает его универсальным для широкого спектра задач машинного обучения.