12
votes

Impossible de charger le modèle Spacy 'en_core_web_lg' sur Google colab

J'utilise spacy dans google colab pour créer un modèle NER pour lequel j'ai téléchargé le modèle spaCy 'en_core_web_lg' en utilisant

OSError: [E050] Can't find model 'en_core_web_lg'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory.

et je reçois un message disant

nlp = spacy.load('en_core_web_lg')

Cependant, quand j'essaye de charger le modèle

✔ Download and installation successful
You can now load the model via spacy.load('en_core_web_lg')

l'erreur suivante est imprimée:

import spacy.cli
spacy.cli.download("en_core_web_lg")

Quelqu'un pourrait-il m'aider avec ce problème?


0 commentaires

4 Réponses :


29
votes

Sur colab utilisant un noyau Python 3, vous devriez être prêt à fonctionner dans une cellule (cela prend un certain temps, mais vous donne un retour visuel sur la progression, différemment de spacy.cli )

import spacy
nlp = spacy.load('en_core_web_lg')

Ensuite, *** redémarrez le runtime colab ***!

(pour ce faire dans le menu colab, allez dans Runtime> Restart runtime ...).

Après cela, exécuter

!python -m spacy download en_core_web_lg

devrait fonctionner parfaitement (cela fonctionne toujours pour moi fin 2020).


1 commentaires

REDÉMARREZ LE RUNTIME OUI!



1
votes

J'ai rencontré un problème similaire sur google colab avec:

spacy download en_core_web_sm
nlp = spacy.load('en_core_web_sm')

Je soupçonne que cela peut avoir quelque chose à voir avec la taille du modèle. Cela a fonctionné pour moi en utilisant le petit modèle Spacy.

nlp = spacy.load('en_core_web_md') 


0 commentaires

11
votes

Dans Google Colab Notebooks, vous devez importer le modèle en tant que package .

Cependant, vous téléchargez et installez le modèle:

doc = nlp("This is a sentence. Soon, it will be knowledge.")

vous n'avez pas l'autorisation dans Colab de charger le modèle avec une utilisation spacy normale:

import en_core_web_lg
nlp = en_core_web_lg.load()

À la place, importez le modèle et chargez-le directement:

nlp = spacy.load("en_core_web_lg") # not via packages
nlp = spacy.load("/path/to/en_core_web_lg") #not via paths
nlp = spacy.load("en") # nor via shortcut links
spacy.load()

Ensuite, utilisez comme indiqué:

!pip install <model_s3_url> # tar.gz file e.g. from release notes like https://github.com/explosion/spacy-models/releases//tag/en_core_web_lg-2.3.1
!pip install en_core_web_lg
import spacy


1 commentaires

C'est la bonne réponse maintenant, la réponse acceptée ne fonctionne plus.



3
votes

Il semble que la meilleure réponse soit sur ce fil: Comment installer des modèles / télécharger des packages sur Google Colab?

import spacy.cli
spacy.cli.download("en_core_web_lg")
import en_core_web_lg
nlp = en_core_web_lg.load()


0 commentaires