Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

0
votes
J'ai un dataframe PySpark où 1 colonne se compose de listes de chaînes. Je voudrais compter le nombre d'instances de chaque élément dans chaque liste de chaînes su ...

0
votes
Im essayant de lire les données depuis avro, repartitionner les données par un champ et les enregistrer au format avro. ci-dessous est mon exemple de code. pendant le processus de d& ...

0
votes
Nous avons deux tables d'abord contenant un code pour chaque tâche à chaque exécution. La 2e table contient des codes de toutes les tâches à chaque exécutio ...

0
votes
entrée: xxx sortie: xxx Nous devons calculer l'AVG pour les deux mois précédents ... mais là-bas e ...