Questions et réponses pour le pyspark :

L'API Spark Python (PySpark) expose le modèle de programmation apache-spark à Python.

1
votes
J'ai ces exemples de valeurs select distinct promo_name ,regexp_extract(promo_name, '(?<=p\d+\s+)P\d+') as regexp_id from stock where promo_name is not null select distinct pr ...

1
votes
Il existe de nombreuses questions similaires à celle-ci qui posent une question différente en ce qui concerne éviter les colonnes en double dans une jointure ...

1
votes
J'ai le cadre de données d'entrée au format désagréable suivant: (input_df .withColumn('splits', F.split(F.col('data'), ';')) .drop('data') ).show() # +-- ...

1
votes
J'ai un RDD avec un grand nombre d'entrées KeyVal. La même clé sera présente plusieurs fois et je suis intéressé par l'extraction des N premières en ...