Questions et réponses pour le apache-spark-sql :

Apache Spark SQL est un outil de «traitement SQL et de données structurées» sur Spark, un système de calcul en cluster rapide et polyvalent. Il peut être utilisé pour récupérer des données de Hive, Parquet, etc. et exécuter des requêtes SQL sur les RDD et les ensembles de données existants.

1
votes

Comment ajouter un élément au tableau dans Spark 2.3

Comment puis-je ajouter un élément à un tableau dans dataframe (spark 2.3)? Voici un exemple avec des entiers, mais le cas réel est avec struct. Entré ...

apache-spark-sql

2 commentaire(s)

1
votes

Pourquoi y a-t-il une masse de tâches pour charger un fichier CSV dans le compartiment S3?

J'ai un petit cluster autonome Spark avec une allocation de ressources dynamique qui utilise aws s3 comme stockage, puis je démarre un Spark SQL, crée une table externe Hive chargean ...

apache-spark amazon-s3 apache-spark-sql

0 commentaire(s)

1
votes

Conversion d'horodatage en époque dans Spark (Java)

J'ai une colonne de type Horodatage au format aaaa-MM-jj HH: mm: ss dans un dataframe. La colonne est triée par heure où la date antérieure e ...

java apache-spark apache-spark-sql

2 commentaire(s)

1
votes

Comment convertir une trame de données en JSON et écrire dans un sujet kafka avec une clé

J'essaie d'écrire un dataframe dans kafka au format JSON et d'ajouter une clé au data frame dans Scala, je travaille actuellement avec cet exemple de kafka-spark: df.selectExpr( ...

apache-spark dataframe scala apache-spark-sql spark-streaming-kafka

0 commentaire(s)

<< < 3 4 5 6 7 > >>