J'ai le code suivant Snippet
{Dataset: https: //www.Internationalgenome .org / portail de données / échantillon } p> Ceci goutte la colonne Geuvadis, est-ce que je peux inclure plus d'une colonne? P> p>
3 Réponses :
Est-il ok pour vous de ne pas les lire en premier lieu? p>
https://pandas.pydata.org /pandas-docs/stable/reference/api/pandas.read_csv.html p>
L'option «USECOLS» dans Read_CSV vous permet de spécifier les colonnes de données que vous souhaitez inclure dans le DataFrame. P>
Venkatesh-Prasadranganath est la bonne réponse à la façon de supprimer plusieurs colonnes. p>
Mais si vous voulez éviter de lire des données dans la mémoire que vous n'allez pas utiliser, GENOME_DATA = PD.READAD_CSV ('. / GENOME', USECOLS = ["Seulement", "Obligatoire", "Colonnes"] est la syntaxe à utiliser. P>
Je pense que la réponse de Venkaatesh-Prasadranganath est meilleure, mais adopte une approche similaire à votre tentative, c'est comme ça que je le ferais.:
Colonnes.To_List () CODE> ' LI>
- créer une liste de colonnes à exclure li>
- Soustrayez les colonnes à exclure de la liste complète avec la liste
(SET () - SET ()) CODE> LI>
-
Sélectionnez les colonnes restantes. P>
XXX PRE> LI>
ol> p>
Vous pouvez utiliser Dataframe.drop < / a> Comme génome_data.drop (['Geuvadis', 'c2', ...], axe = 1) code>. p>.