Questions et réponses pour le apache-spark-sql :

Apache Spark SQL est un outil de «traitement SQL et de données structurées» sur Spark, un système de calcul en cluster rapide et polyvalent. Il peut être utilisé pour récupérer des données de Hive, Parquet, etc. et exécuter des requêtes SQL sur les RDD et les ensembles de données existants.

-2
votes

Comment faire correspondre le schéma de deux cadres de données

J'ai des noms de colonne par défaut enregistrés dans une table et je souhaite correspondre au nom de la colonne enregistré dans une table avec les noms de colonne que je recev ...

apache-spark scala apache-spark-sql

0 commentaire(s)

-2
votes

Spark DataFrame Colonne Contenu Modification

J'ai un fichier de données comme indiqué ci-dessous df.show () : xxx puis-je transformer la structure de données ci-dessus vers ...

apache-spark scala apache-spark-sql

0 commentaire(s)

-2
votes

IndendationError: indent inattendu dans les cours de données et Pyspark

from pyspark.sql.functions import * ghj=finalDF.withColumn("temp", explode(split(regexp_replace(to_json(struct(col("sum(P0)"), col("sum(P1)"), col("sum(P2)"), col("sum(P3)"), col("sum(P4)"), co ...

python apache-spark-sql

2 commentaire(s)

-2
votes

Comment créer des délais spécifiques dans Spark

J'ai des données de suivi dans ce que nous stockons le numéro de tracker et l'arrivée_timestamp. +---------+-------------------+ |trackerno| adate| +-------- ...

apache-spark apache-spark-sql

4 commentaire(s)

<< < 9 10 11 12 13 > >>