Le partitionnement des données consiste à diviser une collection de données en plus petites collections de données dans le but d'un traitement plus rapide, d'une collecte de statistiques plus facile et d'une empreinte mémoire / persistance réduite.
J'utilise Scala sur Flink avec l'API DataSet.
Je souhaite re-partitionner mes données sur les nœuds. Spark a une fonction qui permet à l'utilisateur de re-partitionner les donn ...
Je recherche un algorithme qui génère toutes les permutations de partitions de longueur fixe d'un entier. L'ordre n'a pas d'importance. Par exemple, pour N = 4 et longueur L = 3: ...