Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

0
votes
Je cherche à extraire une chaîne d'une colonne de données XML (chaîne) dans My Pyspark Dataframe. Je cherche à extraire la valeur du nom du produit pour chaque cli ...

0
votes

0
votes
J'essaie de lire à partir d'une table en utilisant com.microsoft.Azure. Ci-dessous est l'extrait de code xxx Cependant, je reçois ci-dessous l'erreur ...

0
votes
Disons que j'ai un tel Dataframe. +-----------+ |amount | +-----------+ |73 | +-----------+ ...