Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

1
votes

Comment convertir une trame de données en JSON et écrire dans un sujet kafka avec une clé

J'essaie d'écrire un dataframe dans kafka au format JSON et d'ajouter une clé au data frame dans Scala, je travaille actuellement avec cet exemple de kafka-spark: df.selectExpr( ...

apache-spark dataframe scala apache-spark-sql spark-streaming-kafka

0 commentaire(s)

1
votes

Comment créer un Spark SQL Dataframe avec une liste d'objets Map

J'ai plusieurs Map [String, String] dans une List (Scala). Par exemple: EMP_NAME DOB CITY Ahmad 01-10-1991 Dubai Rahul 06-12-1991 ...

apache-spark dataframe scala apache-spark-sql bigdata

0 commentaire(s)

1
votes

Appeler une fonction pour chaque ligne d'une dataframe dans pyspark [non pandas]

Il y a une fonction dans pyspark: +----------+----------+-----------+ | NUM1 | NUM2 | XYZ | +----------+----------+-----------+ | 10 | 20 | HELLO| ...

apache-spark pyspark pyspark-sql pyspark-dataframes

0 commentaire(s)

1
votes

Masquage du numéro de carte de crédit avec PySpark

Je suis nouveau dans Spark et je dois masquer les numéros de carte de crédit présents dans un Dataframe Spark où les quatre derniers chiffres ne sont affichés qu ...

apache-spark hadoop pyspark apache-spark-sql

0 commentaire(s)

<< < 13 14 15 16 17 > >>