Questions et réponses pour le apache-spark-sql :

Apache Spark SQL est un outil de «traitement SQL et de données structurées» sur Spark, un système de calcul en cluster rapide et polyvalent. Il peut être utilisé pour récupérer des données de Hive, Parquet, etc. et exécuter des requêtes SQL sur les RDD et les ensembles de données existants.

1
votes
Comment puis-je ajouter un élément à un tableau dans dataframe (spark 2.3)? Voici un exemple avec des entiers, mais le cas réel est avec struct. Entré ...

1
votes
J'ai un petit cluster autonome Spark avec une allocation de ressources dynamique qui utilise aws s3 comme stockage, puis je démarre un Spark SQL, crée une table externe Hive chargean ...

1
votes
J'ai une colonne de type Horodatage au format aaaa-MM-jj HH: mm: ss dans un dataframe. La colonne est triée par heure où la date antérieure e ...

1
votes
J'essaie d'écrire un dataframe dans kafka au format JSON et d'ajouter une clé au data frame dans Scala, je travaille actuellement avec cet exemple de kafka-spark: df.selectExpr( ...