Questions et réponses pour le data-partitioning :

Le partitionnement des données consiste à diviser une collection de données en plus petites collections de données dans le but d'un traitement plus rapide, d'une collecte de statistiques plus facile et d'une empreinte mémoire / persistance réduite.

5
votes
J'utilise Scala sur Flink avec l'API DataSet. Je souhaite re-partitionner mes données sur les nœuds. Spark a une fonction qui permet à l'utilisateur de re-partitionner les donn ...

8
votes
Déclaration de problème: J'ai le problème suivant: Il y a plus d'un milliard de points dans l'espace 3D. L'objectif est de trouver le plus grand ...

7
votes
Je recherche un algorithme qui génère toutes les permutations de partitions de longueur fixe d'un entier. L'ordre n'a pas d'importance. Par exemple, pour N = 4 et longueur L = 3: ...