0
votes

PYSPARK: Comment puis-je importer une bibliothèque GITUB en Tradicks?

J'aimerais utiliser cette bibliothèque pour la détection d'anomalie dans la base de données: iforest . Cette bibliothèque ne peut pas être installé via PYPI.

Comment puis-je installer des bibliothèques de GitHUB dans Databicks? J'ai lu sur l'utilisation de quelque chose appelé "oeuf" mais je ne comprends pas bien comment il devrait être utilisé.


0 commentaires

3 Réponses :


3
votes

Vous pouvez cloner le repo et créer un package Python comme expliqué ici: https://github.com / Titicaca / Spark-iforest :

Étape 2. Paquet Pyspark-iforest et installez-le via PIP, sautez ceci étape si vous n'avez pas besoin du pyron pkg p>

CD Spark-iforest / Python Code> P>

python setup.py sdist code> p>

PIP INSTALL DIST / PYSPARK-IFOREST- .TAR.GZ CODE> P> blockQuote>

Vous n'avez besoin que des 2 premières commandes pour générer l'emballage, mais vous devez modifier le second pour générer un package d'œufs au lieu du package de distribution source: P>

pyspark_iforest-2.4.0-py3.7.egg


0 commentaires

0
votes

Vous pouvez également utiliser% pip pour installer des bibliothèques scopées par ordinateur portable (voir Documentation ) de Github.


1 commentaires

Bonjour et bienvenue à tellement! Veuillez lire le Tour et Comment faire J'écris une bonne réponse? Essayez d'élaborer comment cela peut résoudre la question.



0
votes

Si vous avez un emplacement monté sur des mots-formes, vous pouvez également copier le pyspark-iforest- .tar.gz fichier là et PIP Installez à partir de là. Ou utilisez la fonctionnalité de téléchargement s'il est activé, voir ici .


1 commentaires

Au lieu de simplement fournir un lien, pouvez-vous expliquer ce qui devrait être fait dans vos mots? À l'avenir, ces liens peuvent être brisés ou se déplacer vers un autre endroit