L'ARFF (Attribute-Relation File Format) est un format de fichier texte développé par le Groupe d'Apprentissage Automatique (Machine Learning Group) de l'Université de Waikato pour décrire les jeux de données utilisés en apprentissage automatique (machine learning). Il est principalement utilisé avec le logiciel WEKA (Waikato Environment for Knowledge Analysis), mais il est également pris en charge par d'autres outils d'apprentissage automatique. Un fichier ARFF se compose d'une section d'en-tête (header section) et d'une section de données (data section). La section d'en-tête définit le nom de la relation (nom du jeu de données) et les attributs (caractéristiques ou colonnes) des données. Chaque attribut est déclaré avec son nom et son type de données (par exemple, numérique, nominal, chaîne de caractères (string), date). La section de données contient les instances de données réelles, chaque instance étant représentée par une liste de valeurs d'attribut séparées par des virgules. Les valeurs manquantes sont généralement représentées par un point d'interrogation (?). Les fichiers ARFF sont conçus pour être lisibles par l'homme et facilement analysables par les algorithmes d'apprentissage automatique, ce qui en fait un choix populaire pour le stockage et l'échange de jeux de données au sein de la communauté du machine learning. Le format prend en charge divers types de données et permet la représentation de données à la fois numériques et catégorielles, le rendant polyvalent pour un large éventail de tâches d'apprentissage automatique.