Questions et réponses pour le apache-spark-sql :

Apache Spark SQL est un outil de «traitement SQL et de données structurées» sur Spark, un système de calcul en cluster rapide et polyvalent. Il peut être utilisé pour récupérer des données de Hive, Parquet, etc. et exécuter des requêtes SQL sur les RDD et les ensembles de données existants.

1
votes

Comment supprimer une colonne ambiguë dans pyspark?

Il existe de nombreuses questions similaires à celle-ci qui posent une question différente en ce qui concerne éviter les colonnes en double dans une jointure ...

apache-spark pyspark apache-spark-sql

0 commentaire(s)

0
votes

spark: comment fusionner des lignes dans un tableau de jsons

Input:{ "name":"EAN","value":"5057723043", "EPID": "1299", "id1": "xxx", "id2": "yyy" } Je veux: pi_df.groupBy(col("id1"), col("id2")) //.agg(collect_list(to_json(struct(c ...

apache-spark scala apache-spark-sql

4 commentaire(s)

0
votes

SQL Sélectionnez des médicaments uniquement pendant l'infection Covid

J'ai 2 tables. Les enregistrements de la Table 'Lab_obs' résultent lorsqu'un patient a été testé pour Covid. La table 'Médicaments' contient des enregistrements ...

sql apache-spark-sql

8 commentaire(s)

0
votes

Split String à l'aide du délimiteur et utilisez-le dans une déclaration

Nous avons deux tables d'abord contenant un code pour chaque tâche à chaque exécution. La 2e table contient des codes de toutes les tâches à chaque exécutio ...

apache-spark apache-spark-sql

0 commentaire(s)

<< < 6 7 8 9 10 > >>