Je veux laisser tomber la valeur en double de DataSet
ex: p> à p> mais p> Lorsque j'utilise platmap p> le résultat est p> mon code est p> pourquoi le RowenCoder.apply () ne fonctionne pas? P> P>
3 Réponses :
Vous pouvez obtenir le même résultat à l'aide de Spark SQL et org.apache.spark.sql.functions:
explode_events.select(
$"e_key",
$"f_timestamp_day",
$"key",
explode(split($"value","\\^")),
$"f_country",
$"f_os",
$"received_date"
).show()
Essayez ceci-
Merci pour votre aide, et c'est un bon moyen de résoudre mon problème.
Utilisez la fonction Split pour scinder la valeur COL et utilisez Array_Disticnct et explosez la fonction pour obtenir le résultat.
from pyspark.sql.functions import *
#create df1
df1= df.withColumn("value",explode(array_distinct((split("VALUES","\\^")))))