Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

0
votes

Comment changer le niveau de journal dans Spark?

J'ai essayé toutes ces méthodes et rien ne fonctionne: dans le fichier log4j - xxx in code: xxx < P> Et ou ...

apache-spark logging scala log4j

0 commentaire(s)

0
votes

Filtrer une étincelle Dataframe avec un plus grand que et moins que la liste des dates

J'ai un dataframe code> avec les champs de_date code> et to_date code>: xxx pré> et une liste de DATES P> spark.sql("select * fro ...

apache-spark dataframe scala apache-spark-sql

2 commentaire(s)

0
votes

SCALA SHORPHAND $ pour la conversion de chaîne en colonne ne reconnaît pas la variable de chaîne

Je veux utiliser le sténographique $ avec des applications d'étincelles écrites à Scala. Mais j'ai un grand nombre de colonnes que je voudrais faire référ ...

apache-spark dataframe scala apache-spark-sql

6 commentaire(s)

0
votes

Transformation et action scala

J'ai une liste RDD [(chaîne, liste [int])] comme liste (("a", liste (1,2,3,4)), ("B", liste (5,6,7 ))))) Comment les transformer en liste (("A", 1), ("A", 2), ("A", 3), ("A", 4), ...

apache-spark scala rdd

1 commentaire(s)

<< < 25 26 27 28 29 > >>