Le format Flux IPC (Inter-Process Communication) d'Apache Arrow est un format de sérialisation conçu pour un transfert et un stockage de données efficaces, particulièrement au sein de l'écosystème Apache Arrow. C'est un format binaire optimisé pour les données colonnaires, ce qui signifie que les données sont organisées par colonnes plutôt que par lignes. Cette disposition colonnaire permet des opérations vectorielles et une performance améliorée lors du traitement de grands ensembles de données. Le format IPC Stream est typiquement utilisé pour le streaming de données entre processus ou systèmes qui utilisent Apache Arrow. Il est conçu pour être indépendant du langage (language-agnostic), permettant un échange de données transparent entre des applications écrites dans différents langages de programmation. Le format inclut des métadonnées décrivant le schéma des données, permettant à la partie réceptrice d'interpréter correctement les données sans connaissance préalable. Le flux se compose d'une séquence de messages, chacun contenant un schéma et un lot (batch) de données. Cela permet une gestion efficace des grands ensembles de données qui pourraient ne pas tenir entièrement en mémoire. Ce format est largement utilisé dans l'analyse de données, l'apprentissage automatique (machine learning) et d'autres applications gourmandes en données où la performance et l'interopérabilité sont critiques.