Questions et réponses pour le apache-spark :

Apache Spark est un moteur de traitement de données distribué open source écrit en Scala fournissant une API unifiée et des ensembles de données distribués aux utilisateurs pour le traitement par lots et en continu. Les cas d'utilisation d'Apache Spark sont souvent liés à l'apprentissage automatique / profond, au traitement des graphiques.

7
votes
J'ai lu quelque part que les vecteurs / matrices locales de MLLIB sont actuellement enroulement de la mise en œuvre de la brise, mais les méthodes convertissant Mllib en vecteurs / ma ...

7
votes
Je vais archiver un réseau social, incorporant diverses fonctionnalités, de nombreuses charge de travail intensives de grandes données (telles que l'apprentissage automatique) ...

7
votes
J'ai un jeu de données contenant des données telles que celles suivantes: xxx pré> ... p> MAINTENANT, je veux obtenir les données regroup&eacut ...

6
votes
Je veux effectuer des recherches GeoIP de mes données dans Spark. Pour ce faire, j'utilise la base de données GeoIP de Maxmind. Ce que je veux faire, c'est d'initialiser un objet ...