2
votes

Le fichier b'content / train.csv 'n'existe pas Google Colab

Première utilisation de Google Colab. J'ai utilisé une API Kaggle et les données sont chargées dans Google Colab, mais je n'arrive pas à l'ouvrir via des pandas. J'ai cliqué avec le bouton droit sur le fichier et copié le chemin. J'ai ensuite exécuté le code suivant:

!pip install kaggle
from google.colab import files
files.upload() #Uploaded my kaggle.json file

!pip install -q kaggle
!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/

!kaggle competitions download -c microsoft-malware-prediction

#Unzip the files:
!7z x train.csv.zip
!7z x sample_submission.csv.zip
!7z x test.csv.zip

#remove the zipped data
!rm train.csv.zip
!rm sample_submission.csv.zip
!rm test.csv.zip

import pandas as pd
train = pd.read_csv("content/train.csv") 
test = pd.read_csv('content/test.csv') 
print('read')

Le code d'erreur que j'obtiens:

FileNotFoundError: File b'content/train.csv' does not exist

Voici le code pour tout ce que j'ai fait menant à cette erreur:

import pandas as pd
train = pd.read_csv("content/train.csv") 
test = pd.read_csv('content/test.csv')

Toute aide serait formidable!


2 commentaires

Il vous manque un / de début dans votre chemin? c'est-à-dire / content / ... plutôt que content / ... .


Bonjour. Oui, je l'ai inclus. Je soupçonne maintenant qu'il s'agit d'un problème d'autorisation avec la source dans laquelle j'obtiens les données. Merci pour votre aide.


4 Réponses :


3
votes

Cela m'est arrivé aussi mais j'ai pu résoudre en lisant le fichier .csv avec une nouvelle syntaxe:

  • Saisissez-le dans un bloc de code ci-dessus (1er ou deuxième)

! pip install -U -q PyDrive

de pydrive.auth importer GoogleAuth

depuis pydrive.drive importer GoogleDrive

de l'authentification d'importation de google.colab de oauth2client.client importer GoogleCredentials

#Authentifier et créer le client PyDrive

auth.authenticate_user()

gauth = GoogleAuth ()

gauth.credentials = GoogleCredentials.get_application_default ()

drive = GoogleDrive (gauth)

Ensuite, procédez comme suit:

link = 'link_to_file_in drive'

peluches, id = link.split ('=')

téléchargé = lecteur.CreateFile ({'id': id})

téléchargé.GetContentFile ('name_of_file.csv')

df = pd.read_csv ("nom_du_fichier.csv")


0 commentaires

0
votes

J'ai rencontré le même problème, ce qui l'a résolu pour moi était:

!pip install -U -q PyDrive

from pydrive.auth import GoogleAuth
from pydrive.drive import GoogleDrive
from google.colab import auth
from oauth2client.client import GoogleCredentials

# 1. Authenticate and create the PyDrive client.
auth.authenticate_user()
gauth = GoogleAuth()
gauth.credentials = GoogleCredentials.get_application_default()
drive = GoogleDrive(gauth)

# PyDrive reference:
# https://gsuitedevs.github.io/PyDrive/docs/build/html/index.html

# 2. Create & upload a file text file.
uploaded = drive.CreateFile({'title': 'Sample upload.txt'})
uploaded.SetContentString('Sample upload file content')
uploaded.Upload()
print('Uploaded file with ID {}'.format(uploaded.get('id')))

# 3. Load a file by ID and print its contents.
downloaded = drive.CreateFile({'id': uploaded.get('id')})

print('Downloaded content "{}"'.format(downloaded.GetContentString()))
    from google.colab import drive
    drive.mount('/content/gdrive', force_remount=True)
    root_dir = "/content/gdrive/My Drive/"
    base_dir = root_dir + 'app/'
    and then each file is refreed as base_dir +file_name

de https://colab.research.google.com/notebooks/io.ipynb#scrollTo=zU5b6dlRwUQk


0 commentaires

0
votes

Indiquez le chemin complet du fichier, quel que soit l'endroit où vous vous trouvez.

Essayez la solution ci-dessous, j'espère que cela fonctionnera si vous récupérez des données depuis Google Drive

data = pd.read_csv("/content/drive/My Drive/data/"name_of_the_csv_file")


0 commentaires

0
votes

Pour ouvrir un fichier dans Google Drive:

df = pd.read_csv ("copiez et collez le chemin complet de ce fichier")


0 commentaires