Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

2
votes

Échec de l'exécution de la fonction définie par l'utilisateur sur une trame de données dans Spark (Scala)

J'ai un dataframe df comme le suivant val te = df.select("path").as[String].collect() te.foreach(executeRowCount) Une remarque: le / file / dir diffère. Tous les fichiers ne ...

apache-spark scala user-defined-functions

0 commentaire(s)

2
votes

spark submit lève une erreur java.lang.ClassNotFoundException: scala.runtime.java8.JFunction2 $ mcIII $ sp

J'ai écrit un code pour le nombre de mots, mais lorsque j'ai essayé de l'exécuter à partir de CMD dans Windows en utilisant la commande ci-dessous, cela lève une ...

java apache-spark hadoop scala

11 commentaire(s)

2
votes

SQL DDL pour analyser le fichier de schéma JSON

Une instruction SQL DDL peut-elle être analysée en un simple fichier de schéma JSON comme indiqué ci-dessous sans utiliser d'outils, uniquement des scripts Scala / Pytho ...

python-3.x apache-spark scala shell

0 commentaire(s)

2
votes

Erreur lors de l'installation de Spark sur Google Colab

Je reçois une erreur lors de l'installation de Spark sur Google Colab. Il dit tar: spark-2.2.1-bin-hadoop2.7.tgz: Impossible d'ouvrir: aucun fichier ou réper ...

apache-spark hadoop google-colaboratory pyspark

0 commentaire(s)

<< < 7 8 9 10 11 > >>