Questions et réponses pour le pyspark :

L'API Spark Python (PySpark) expose le modèle de programmation apache-spark à Python.

1
votes
J'ai un script pyspark que je peux exécuter dans AWS GLUE. Mais chaque fois que je crée un travail à partir de l'interface utilisateur et que je copie mon code dans le travail ...

1
votes
J'ai un énorme ensemble de données dans le serveur SQL, je veux connecter le serveur SQL avec python, puis utiliser pyspark pour exécuter la requête. J'ai vu l ...

1
votes
J'ai le dataframe ci-dessous et j'essaie d'obtenir la valeur 3097 en tant qu'int, par exemple le stocker dans une variable python pour le manipuler, le multiplier par un autre i ...

1
votes
J'ai un RDD et je veux trouver des valeurs distinctes pour plusieurs colonnes. Exemple: Row (col1 = a, col2 = b, col3 = 1), Row ( col1 = b, col2 = 2, col3 = 10)), Row (col1 = a1 ...