Questions et réponses pour le apache-spark-sql :

Apache Spark SQL est un outil de «traitement SQL et de données structurées» sur Spark, un système de calcul en cluster rapide et polyvalent. Il peut être utilisé pour récupérer des données de Hive, Parquet, etc. et exécuter des requêtes SQL sur les RDD et les ensembles de données existants.

-2
votes
J'ai des noms de colonne par défaut enregistrés dans une table et je souhaite correspondre au nom de la colonne enregistré dans une table avec les noms de colonne que je recev ...

-2
votes
J'ai un fichier de données comme indiqué ci-dessous df.show () : xxx puis-je transformer la structure de données ci-dessus vers ...

-2
votes
from pyspark.sql.functions import * ghj=finalDF.withColumn("temp", explode(split(regexp_replace(to_json(struct(col("sum(P0)"), col("sum(P1)"), col("sum(P2)"), col("sum(P3)"), col("sum(P4)"), co ...

-2
votes
J'ai des données de suivi dans ce que nous stockons le numéro de tracker et l'arrivée_timestamp. +---------+-------------------+ |trackerno| adate| +-------- ...