Questions et réponses pour le pyspark :

L'API Spark Python (PySpark) expose le modèle de programmation apache-spark à Python.

1
votes
J'ai écrit un code de prétraitement de données dans Pandas UDF dans PySpark. J'utilise la fonction lambda pour extraire une partie du texte de tous les enregistrements d'une c ...

1
votes
Je voudrais diviser une valeur de colonne avec des sauts de ligne et créer une nouvelle colonne avec les deux derniers éléments (lignes) df.withColumn('last_2', split(df. ...

1
votes
Il y a une fonction dans pyspark: +----------+----------+-----------+ | NUM1 | NUM2 | XYZ | +----------+----------+-----------+ | 10 | 20 | HELLO| ...

1
votes
Je suis nouveau dans Spark et je dois masquer les numéros de carte de crédit présents dans un Dataframe Spark où les quatre derniers chiffres ne sont affichés qu ...