0
votes

Fichier CSV de sortie SCRAPY avec la première colonne comme ID

Je suis assez débutant avec une bibliothèque Scrapy. J'essaie de produire un fichier CSV simple de Scrapy en utilisant:

Scrapy crawl grattoir -O file.csv

où la première colonne va être fondamentalement indice le nombre de rangées de la même manière que possible avec la bibliothèque de pandas utilisant:

pandas.to_csv (chemin_or_buf = nom, index_label = 'id')

Merci pour une aide.


1 commentaires

Je ne suis pas clair quelles sont les données dans le CSV. Est-ce que des données sont extraites d'une seule page Web ou d'une analyse de plusieurs pages? D'où vient les données: une table sur la page ou les pages? Une ligne par page? Ou autre chose? Avez-vous écrit une classe d'araignée? Pouvez-vous nous montrer le code?


3 Réponses :



0
votes

Vous pouvez créer une variable de classe et l'incrémenter pour chaque identifiant: xxx


1 commentaires

Cette solution a fonctionné exactement comment je m'attendais. Merci.



0
votes
  1. Créez votre propre sous-classe de CSVITEMEXPORTERTERTER qui fait ce que vous voulez
  2. Définissez le feed_exporters réglage de sorte que votre sous-classe soit utilisée pour les fichiers CSV. Par exemple: xxx

0 commentaires