Questions et réponses pour le pyspark :

L'API Spark Python (PySpark) expose le modèle de programmation apache-spark à Python.

2
votes
Cadre de données affichant _c0, _c1 à la place de mes noms de colonne d'origine dans la première ligne. je veux afficher le nom de ma colonne qui se trouve sur la pre ...

2
votes
J'ai une colonne date dans un dataframe pySpark avec des dates au format suivant: df_new = df.withColumn( 'date1', F.to_timestamp("date", "yyyy-dd-MM'T'hh:mm:ss.s") ) ...

2
votes
Je souhaite normaliser mon bloc de données dans pyspark par groupe. La solution proposée ici ...

2
votes
Je reçois une erreur lors de l'installation de Spark sur Google Colab. Il dit tar: spark-2.2.1-bin-hadoop2.7.tgz: Impossible d'ouvrir: aucun fichier ou réper ...