ARFF(Attribute-Relation File Format,属性-关系文件格式)是一种由怀卡托大学(University of Waikato)机器学习小组开发的文件格式,用于描述机器学习中使用的数据集。它主要与WEKA(Waikato Environment for Knowledge Analysis,怀卡托知识分析环境)软件配合使用,但也受其他机器学习工具支持。ARFF文件由头部(header)部分和数据(data)部分组成。头部部分定义了关系名称(即数据集名称)以及数据的属性(特征或列)。每个属性都声明了其名称和数据类型(例如,numeric(数值型)、nominal(标称型)、string(字符串型)、date(日期型))。数据部分包含实际的数据实例,每个实例表示为属性值的逗号分隔列表。缺失值通常用问号(?)表示。ARFF文件被设计为人类可读且易于机器学习算法解析,使其成为机器学习社区中存储和交换数据集的流行选择。该格式支持多种数据类型,并允许表示数值数据和分类数据,使其对广泛的机器学习任务具有通用性。