Das ARFF (Attribute-Relation File Format) ist ein Textdateiformat, das von der Machine Learning Group an der University of Waikato zur Beschreibung von Datensätzen entwickelt wurde, die im maschinellen Lernen (Machine Learning) verwendet werden. Es wird hauptsächlich mit der Software WEKA (Waikato Environment for Knowledge Analysis) verwendet, wird aber auch von anderen Werkzeugen für maschinelles Lernen unterstützt. Eine ARFF-Datei besteht aus einem Kopfbereich (Header Section) und einem Datenbereich (Data Section). Der Kopfbereich definiert den Relationsnamen (Datensatznamen) und die Attribute (Merkmale oder Spalten) der Daten. Jedes Attribut wird mit seinem Namen und Datentyp (z. B. numerisch, nominal, String, Datum) deklariert. Der Datenbereich enthält die eigentlichen Dateninstanzen, wobei jede Instanz als kommagetrennte Liste von Attributwerten dargestellt wird. Fehlende Werte (Missing Values) werden typischerweise durch ein Fragezeichen (?) dargestellt. ARFF-Dateien sind so konzipiert, dass sie sowohl von Menschen lesbar als auch von Machine-Learning-Algorithmen leicht analysierbar (parsbar) sind, was sie zu einer beliebten Wahl für die Speicherung und den Austausch von Datensätzen in der Machine-Learning-Community macht. Das Format unterstützt verschiedene Datentypen und ermöglicht die Darstellung sowohl numerischer als auch kategorialer Daten, wodurch es vielseitig für eine breite Palette von Aufgaben des maschinellen Lernens einsetzbar ist.