Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

1
votes
J'ai récemment travaillé sur des ensembles de données Spark, j'ai un scénario dans lequel Je dois générer un numéro de ligne pour chaque l ...

1
votes
J'ai un dataframe et j'ai besoin de voir s'il contient des valeurs nulles. Il existe de nombreux articles sur le même sujet, mais presque tous utilisent l'action count ou la m ...

1
votes
J'essaie d'exécuter une action avec Spark avec se bloque. L'exécuteur correspondant lève l'exception suivante: spark.read.jdbc(jdbcString, "table", props).show() ...

1
votes
J'ai un petit cluster autonome Spark avec une allocation de ressources dynamique qui utilise aws s3 comme stockage, puis je démarre un Spark SQL, crée une table externe Hive chargean ...