Par exemple,
val columns=Array("column1", "column2", "column3") val df=sc.parallelize(Seq( (1,"example1", Seq(0,2,5)), (2,"example2", Seq(1,20,5)))).toDF(columns)
3 Réponses :
val df=sc.parallelize(Seq( (1,"example1", Seq(0,2,5)), (2,"example2", Seq(1,20,5)))).toDF("column1", "column2", "column3") toDF() takes comma-seperated strings
TODF () CODE> prend un paramètre répété em> de type
chaîne code>, vous pouvez donc utiliser le type
_ * code> Annotation pour réussir une séquence:
val df=sc.parallelize(Seq(
(1,"example1", Seq(0,2,5)),
(2,"example2", Seq(1,20,5)))).toDF(columns: _*)
Merci ..Comment spécifier le type de données avec des colonnes à l'intérieur du TODF ()?
Merci .... c'est exactement je cherche plus d'une heure , merci
et vous devez donc transformer votre matrice sur un varargs em> comme décrit également < Un href = "https://stackoverflow.com/questions/4176440/syntax-sugar-for-troting-steq-as-method-paramètres"> ici . Cela signifie que vous devez effectuer ce qui suit: p> (ajout: _ * à TODF () code> est défini dans Documentation Spark comme:
colonnes code> dans
TODF code>) p> p>