FASTA est un progiciel pour l'alignement de séquences de protéines et d'acides nucléiques. FASTA est également le nom du format de fichier utilisé par ces programmes pour représenter des séquences de peptides ou de nucléotides. Le format est un standard de facto en bioinformatique.
J'ai des milliers de fichiers, qui sont une liste de noms de séquences suivis de leur séquence, un individu par ligne, quelque chose comme ceci: >L.abdalai.LJAMM.14363.SanMar ...
J'ai essayé ls * .uffasta | parallèle --gnu "awk '{imprimé $ 1}'> {/.}. sortiefile.txt"
Et cela ne produit pas le résultat dont j'ai besoin. J'ai 48 fic ...
J'ai 2 fichiers: one est un fichier texte contenant une série d'identifiants et l'autre est un fichier Multifasta contenant des séquences FASTA correspondant aux identifiants dans le ...