Questions et réponses pour le dataframe :

A data frame is a tabular data structure. Usually, it contains data where rows are observations and columns are variables of various types. While "data frame" or "dataframe" is the term used for this concept in several languages (R, Apache Spark, deedle, Maple, the pandas library in Python and the DataFrames library in Julia), "table" is the term used in MATLAB and SQL.

3
votes
J'essaie de trier un dataframe pandas par bloc sans changer l'ordre dans les blocs. Le dataframe contient des messages de forum, des horodatages et des noms de threads. J'ai déjà ...

3
votes
J'ai un dataframe avec deux colonnes, une adresse et un nom de rue. df.withColumn("new col", col("street")\ .rlike(concat(lit('.*'),col('street_name'),col('.*))))\ .show(20,False) ...

3
votes
Je voudrais supprimer les guillemets doubles "" lorsque la valeur est vide lors de l'enregistrement de mon CSV dans S3 avec la méthode df.write.save () de Spark Version Spark: 2.4.0 ...

3
votes
Si je calcule la moyenne d'un objet groupby et que dans l'un des groupes il y a un ou des NaN, les NaN sont ignorés. Même lors de l'application de np.mean, il ne renvoie que la moyenn ...