Questions et réponses pour le pyspark :

L'API Spark Python (PySpark) expose le modèle de programmation apache-spark à Python.

-1
votes
Lorsque je charge un fichier texte dans une RDD, il est par défaut par défaut par chaque ligne. Par exemple, envisagez le texte suivant: >>> RDD.count() 3 >>& ...

-2
votes
Je me demande s'il y a un moyen de combiner le résultat final dans un seul fichier lorsque vous utilisez Spark? Voici le code que j'ai: conf = SparkConf().setAppName("logs").setMaster( ...

-2
votes
J'ai deux dataframes. S'il vous plaît dites-moi comment je peux rejoindre les deux dataframes pour donner toutes les colonnes des deux, tandis que pour les colonnes communes, prenez les vale ...

-2
votes
Que se passe-t-il lorsque le nombre de tâches d'étincelles soit plus grand que le noyau exécuteur? Comment ce scénario est-il traité par Spark ...