0
votes

Déposer plusieurs colonnes de DataFrame

J'ai le code suivant Snippet

{Dataset: https: //www.Internationalgenome .org / portail de données / échantillon } xxx

Ceci goutte la colonne Geuvadis, est-ce que je peux inclure plus d'une colonne?


0 commentaires

3 Réponses :


1
votes

Est-il ok pour vous de ne pas les lire en premier lieu?

https://pandas.pydata.org /pandas-docs/stable/reference/api/pandas.read_csv.html

L'option «USECOLS» dans Read_CSV vous permet de spécifier les colonnes de données que vous souhaitez inclure dans le DataFrame.

Venkatesh-Prasadranganath est la bonne réponse à la façon de supprimer plusieurs colonnes.

Mais si vous voulez éviter de lire des données dans la mémoire que vous n'allez pas utiliser, GENOME_DATA = PD.READAD_CSV ('. / GENOME', USECOLS = ["Seulement", "Obligatoire", "Colonnes"] est la syntaxe à utiliser.


0 commentaires

0
votes

Je pense que la réponse de Venkaatesh-Prasadranganath est meilleure, mais adopte une approche similaire à votre tentative, c'est comme ça que je le ferais.:

  1. Identifiez toutes les colonnes avec Colonnes.To_List () '
  2. créer une liste de colonnes à exclure
  3. Soustrayez les colonnes à exclure de la liste complète avec la liste (SET () - SET ())
  4. Sélectionnez les colonnes restantes. XXX


0 commentaires