Il formato ARFF (Attribute-Relation File Format) è un formato di file di testo sviluppato dal Gruppo di Machine Learning presso l'Università di Waikato per descrivere i dataset utilizzati nell'ambito dell'apprendimento automatico (machine learning). È utilizzato principalmente con il software WEKA (Waikato Environment for Knowledge Analysis), ma è supportato anche da altri strumenti di machine learning. Un file ARFF è strutturato in due sezioni principali: una sezione di intestazione (header) e una sezione dati. La sezione di intestazione definisce il nome della relazione (nome del dataset) e gli attributi (caratteristiche o colonne) dei dati. Ciascun attributo viene dichiarato con il suo nome e il tipo di dato (ad esempio, numerico, nominale, stringa, data). La sezione dati contiene le istanze di dati effettive, dove ogni istanza è rappresentata come un elenco di valori di attributo separati da virgole. I valori mancanti sono tipicamente rappresentati da un punto interrogativo (?). I file ARFF sono progettati per essere leggibili dall'uomo e facilmente elaborabili (parsed) dagli algoritmi di machine learning, rendendoli una scelta popolare per l'archiviazione e lo scambio di dataset nella comunità di machine learning. Il formato supporta vari tipi di dati e consente la rappresentazione sia di dati numerici che categorici, rendendolo versatile per un'ampia gamma di compiti di apprendimento automatico.