J'aimerais utiliser cette bibliothèque pour la détection d'anomalie dans la base de données: iforest . Cette bibliothèque ne peut pas être installé via PYPI. P>
Comment puis-je installer des bibliothèques de GitHUB dans Databicks? J'ai lu sur l'utilisation de quelque chose appelé "oeuf" mais je ne comprends pas bien comment il devrait être utilisé. P>
3 Réponses :
Vous pouvez cloner le repo et créer un package Python comme expliqué ici: https://github.com / Titicaca / Spark-iforest :
Étape 2. Paquet Pyspark-iforest et installez-le via PIP, sautez ceci étape si vous n'avez pas besoin du pyron pkg p>
CD Spark-iforest / Python Code> P>
python setup.py sdist code> p>
PIP INSTALL DIST / PYSPARK-IFOREST-
.TAR.GZ CODE> P> blockQuote> Vous n'avez besoin que des 2 premières commandes pour générer l'emballage, mais vous devez modifier le second pour générer un package d'œufs au lieu du package de distribution source: P>
pyspark_iforest-2.4.0-py3.7.egg
Vous pouvez également utiliser% pip pour installer des bibliothèques scopées par ordinateur portable (voir Documentation ) de Github. P>
Bonjour et bienvenue à tellement! Veuillez lire le Tour et Comment faire J'écris une bonne réponse? Essayez d'élaborer comment cela peut résoudre la question.
Si vous avez un emplacement monté sur des mots-formes, vous pouvez également copier le pyspark-iforest-
PIP Installez code> à partir de là. Ou utilisez la fonctionnalité de téléchargement s'il est activé, voir
Au lieu de simplement fournir un lien, pouvez-vous expliquer ce qui devrait être fait dans vos mots? À l'avenir, ces liens peuvent être brisés ou se déplacer vers un autre endroit