Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

-1
votes

Algorithme de chevauchement d'une étincelle à l'aide de DataFrames

donné une source de données avec champs: produit_id - produit - start_time - end_time i J'essaie de construire la ...

python apache-spark pyspark apache-spark-sql

0 commentaire(s)

-1
votes

Quel est l'avantage d'utiliser $ "col" sur "col" dans des cadres de données Spark

Disons que j'ai un df créé comme suit xxx quel est l'avantage de la convertir en une colonne à l'aide de post.s.select ("id") ...

apache-spark scala

0 commentaire(s)

-1
votes

Q: DataSet Flatmap pour vider Java Spark Java

Je veux laisser tomber la valeur en double de DataSet ex: xxx à xxx mais Lorsque j'utilise platmap ...

apache-spark apache-spark-sql flatmap

0 commentaire(s)

-1
votes

Pyspark: Comment saisir un fichier texte tel qu'il soit divisé par FullStop

Lorsque je charge un fichier texte dans une RDD, il est par défaut par défaut par chaque ligne. Par exemple, envisagez le texte suivant: >>> RDD.count() 3 >>& ...

apache-spark pyspark

2 commentaire(s)

<< < 28 29 30 31 32 > >>