Je veux laisser tomber la valeur en double de DataSet
ex: p> à p> mais p> Lorsque j'utilise platmap p> le résultat est p> mon code est p> pourquoi le RowenCoder.apply () ne fonctionne pas? P> P>
3 Réponses :
Vous pouvez obtenir le même résultat à l'aide de Spark SQL et org.apache.spark.sql.functions:
explode_events.select( $"e_key", $"f_timestamp_day", $"key", explode(split($"value","\\^")), $"f_country", $"f_os", $"received_date" ).show()
Essayez ceci-
Merci pour votre aide, et c'est un bon moyen de résoudre mon problème.
Utilisez la fonction Split pour scinder la valeur COL et utilisez Array_Disticnct et explosez la fonction pour obtenir le résultat.
from pyspark.sql.functions import * #create df1 df1= df.withColumn("value",explode(array_distinct((split("VALUES","\\^")))))