Questions et réponses pour le apache-spark-sql :

Apache Spark SQL est un outil de «traitement SQL et de données structurées» sur Spark, un système de calcul en cluster rapide et polyvalent. Il peut être utilisé pour récupérer des données de Hive, Parquet, etc. et exécuter des requêtes SQL sur les RDD et les ensembles de données existants.

1
votes
Il existe de nombreuses questions similaires à celle-ci qui posent une question différente en ce qui concerne éviter les colonnes en double dans une jointure ...

0
votes
Input:{ "name":"EAN","value":"5057723043", "EPID": "1299", "id1": "xxx", "id2": "yyy" } Je veux: pi_df.groupBy(col("id1"), col("id2")) //.agg(collect_list(to_json(struct(c ...

0
votes
J'ai 2 tables. Les enregistrements de la Table 'Lab_obs' résultent lorsqu'un patient a été testé pour Covid. La table 'Médicaments' contient des enregistrements ...

0
votes
Nous avons deux tables d'abord contenant un code pour chaque tâche à chaque exécution. La 2e table contient des codes de toutes les tâches à chaque exécutio ...