Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

7
votes

Écrire sur la base de données Oracle à l'aide d'Apache Spark 1.4.0

J'essaie d'écrire des données sur notre base de données Oracle à l'aide de Spark 1.4.0 dataframe.write.jdbc () forte> fonction. Le symétrique ...

apache-spark scala oracle jdbc

0 commentaire(s)

7
votes

Lire plusieurs fichiers JSON de Spark

J'ai une liste de fichiers JSON que je voudrais charger en parallèle. Je ne peux pas utiliser lis.json ("*") Cause Les fichiers ne sont pas dans le même dos ...

apache-spark

0 commentaire(s)

7
votes

Comment calculer l'inverse d'une rowmatrix dans Apache Spark?

J'ai une matrice X, distribuée, dans la forme RowMatrix. J'utilise Spark 1.3.0. Je dois être capable de calculer x inverse. ...

apache-spark scala distributed-computing linear-algebra

1 commentaire(s)

7
votes

Spark-Comment puis-je récupérer une paire d'éléments après avoir calculé la similarité à l'aide de RowMatrix

J'ai rencontré le problème de «simulité de tous les paires» dans mon système de recommandation. Merci à ...

apache-spark apache-spark-mllib

0 commentaire(s)

<< < 33 34 35 36 37 > >>