Je suis novice en python et je dois extraire des références de la littérature scientifique. Voici le code que j'utilise
from refextract import extract_references_from_url references = extract_references_from_url('https://arxiv.org/pdf/1503.07589.pdf') print(references)
3 Réponses :
Vous pouvez utiliser la bibliothèque Pandas pour écrire les références dans Excel.
from refextract import extract_references_from_url import pandas as pd references = extract_references_from_url('https://arxiv.org/pdf/1503.07589.pdf') print(references) # convert to pandas dataframe dfref = pd.DataFrame(references) # write dataframe into excel dfref.to_excel('./refs.xlsx')
L'installation de XLRD est requise plus que l'installation de Pandas.
Vous devez consulter XLSXWriter, un module de création de fichiers Excel.
Votre code pourrait alors ressembler à ceci: (modifié basé sur HTTPS : //xlsxwriter.readthedocs.io/tatudial01.html ) p> p>
Essayé, mais cela m'a donné cette erreur: TypeError: int () argument doit être une chaîne, un objet d'octets ou un numéro, pas, pas 'Liste'
Après avoir traversé la documentation de reflettract ici , j'ai trouvé que votre variable références code> est un dictionnaire. Pour convertir un tel dictionnaire à Python, vous pouvez utiliser des pandas comme suit-