Quand je définis mapreduce.task.io.sort.mb = 100000. Je reçois une exception suivante. Quelle est la valeur maximale de MapReduce.Task.io.sort.mb? p> p>
4 Réponses :
"mapReduce.task.io.sort.mb" est la quantité totale de mémoire tampon à utiliser lors de la tri des fichiers, des mégaoctets. Par défaut, donne à chaque flux de fusion 1MB, qui devrait minimiser la recherche. Vous devez donc vous assurer que vous disposez de 100 000 Mo de mémoire disponible sur les nœuds de cluster. P>
J'ai beaucoup plus de mémoire disponible sur mon noeud (2 To, pour être exact. Oui me croire, c'est 2 tb). Y a-t-il un autre paramètre qui crée liaison pour Mapreduce.Task.io.sort.mb?
Je réalise que cette question est ancienne, mais pour ceux qui demandent la même question, vous pouvez consulter certains des bugs autour de cette valeur étant coiffée p>
Par défaut, il est de 100 Mo et il peut aller jusqu'à 2047 Mo. P>
hadoop-2.6.0 org.apache.hadoop.mapred.maptask.java p>
Ligne 427: Nous ne pouvons pas définir mapreduce.task.io.sort.mb dépasse 2047 p>