Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

1
votes

Conversion d'horodatage en époque dans Spark (Java)

J'ai une colonne de type Horodatage au format aaaa-MM-jj HH: mm: ss dans un dataframe. La colonne est triée par heure où la date antérieure e ...

java apache-spark apache-spark-sql

2 commentaire(s)

1
votes

Comment résoudre java.lang.NoSuchMethodError: org.apache.hadoop.conf.Configuration.getPassword?

J'essaie d'exécuter un processus Spark à partir de mon application Web Spring et je reçois cette erreur: java.lang.NoSuchMethodError: org.apache.hadoop.conf.Configuration ...

java apache-spark spring

2 commentaire(s)

1
votes

Équivalent PySpark pour la fonction lambda dans Pandas UDF

J'ai écrit un code de prétraitement de données dans Pandas UDF dans PySpark. J'utilise la fonction lambda pour extraire une partie du texte de tous les enregistrements d'une c ...

python apache-spark pyspark

1 commentaire(s)

1
votes

R: Group in sparklyr ("sum", "count distinct", "mean")

nous avons les données suivantes hébergées dans le répertoire de travail: category SumDD MeanCC CountDistinctFF e 78.2 2 1 EE 33. ...

apache-spark r sparklyr

0 commentaire(s)

<< < 12 13 14 15 16 > >>