Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

-1
votes

Est-il prudent de définir des transformations d'étincelles dans une fonction et de retourner un nouveau Dataframe à Bigdata?

J'ai un dataframe df1 . Je prévois de la diviser en deux dataframes - df2 et df3 . Le flux de code existant a presque la même séqu ...

apache-spark scala

2 commentaire(s)

-1
votes

Pyspark - Obtenez des noms d'attributs du fichier JSON

Je suis nouveau à Pyspark. Mon exigence est d'obtenir / extraire les noms d'attribut à partir d'un fichier JSON imbriqué. J'ai essayé d'utiliser Json_Normalize import&e ...

python apache-spark pyspark

0 commentaire(s)

-1
votes

La fonction Lambda ne met pas à jour la matrice de la portée extérieure

Comme vous le savez, "la variable locale définie dans une portée entorcière doit être définitive ou efficace". J'ai donc le code suivant xxx ...

java apache-spark lambda

3 commentaire(s)

-1
votes

Suppression de la ligne vide du fichier texte à l'aide d'une étincelle

J'ai un fichier de données avec format ci-dessous: le fichier a 10 colonnes. Entre toutes les lignes, il y a un espace.Je devons charger ces données sur la trame de données ap ...

apache-spark dataframe scala

0 commentaire(s)

<< < 27 28 29 30 31 > >>