Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

-2
votes
J'ai un fichier de données comme indiqué ci-dessous df.show () : xxx puis-je transformer la structure de données ci-dessus vers ...

-2
votes
Que se passe-t-il lorsque le nombre de tâches d'étincelles soit plus grand que le noyau exécuteur? Comment ce scénario est-il traité par Spark ...

-2
votes
J'ai des données de suivi dans ce que nous stockons le numéro de tracker et l'arrivée_timestamp. +---------+-------------------+ |trackerno| adate| +-------- ...

-5
votes
Dataframe d'entrée :: Numéro | Nom 1 | 1 ABC Vous êtes génial 2 | ABC 2 Vous êtes génial 58 | xyz tu es g&eacu ...