Skip to Content

DSEABlast - Database Sequences Extraction And Blast

Version imprimable

Fonction

Pipeline d'analyse pour la comparaison banques à banques.

Description

Le pipeline DSEABlast est composé de plusieurs programmes qui permettent des comparaisons banques à banques via l'application BLAST.L'exécution dune analyse suit les étapes suivantes.

  1. Préparation de l'environnement de travail
  2. Préparation des bases query et cible
  3. Exécution des blasts
  4. Parsing des résultats blast
  5. Extraction de séquences d'intérêt
  6. Conversion des résultats en HTML : dseablast.pl --config-file ./.dseablastrc

Usage

Le logiciel dseablast est utilisable en ligne de commande sur la plateforme. Pour l'utiliser la commande il faut disposer d'une arborescence type. La procédure détaillée est expliquée dans la documentation.

$ dseablast.pl --config-file /projet/mig/caron/hugut16s/.dseablastrc  /
--root-directory /projet/mig/caron/hugut16s /
--mfasta-directory /projet/mig/caron/hugut16s/mfasta --database-target gb_bacteria /
--blast-type blastp

Input file format

Toute banque nucléique ou protéique au format FASTA (avec une ou plusieurs entrées).

>NAH19
GMMIGPSMFGGIRNFNYYLFPPIANYICANIGLMGFFYFLFLTAAKTDVGAIGKAPRKHK
YIAAIGVIVPIICVGSVGMAMRDQMDENLQKPSSIGGVVFALSFTSFPVIYTVLRDMNLL
NSEVGKFAMSVALLGDMAGVYVIVIFEAMTHADVGGAYSVFWFLVSVVIFAAFMLLVVRR
AFDWIVSQTPEGTLVNQNYIVMILMGVLASCFLTDMFGLSIAVGPIWLGLLVPHGPPLGS
TLAVRSETFIYEFLMPFTYALVGQGTNIHFLRDETWRNQLSPLFYMTVV
>NAH77
AALFFKVPARESITLGLMMNLRGQMDLLVYLHWIDKRIVGFPGYTVMVLHTVVVTAVTTP
LINFFYDPTRPYRSSKHRTIQHTPQNTEMGLVLAVSDHETLSGLITFLDFAYPTKSSPLS
IFAVQLVELAGRATPLFIDHEQRKEEEEEEYEEEEEEPERKQSGRIDQVQSAFKLYEEKR
NECVTLRSYTAHAPKRLMYQDICELALGKKTAFILLPYQKERLEDAAPTELRDSGMLSVN
ADVLEHTPCSVCIYFDKGRLKNAVVRLSMDLQHSTNSIRMRQETYRFVVLFLGGADNREA
LHLADRMSTNPDVTLTVIRFLSYNHEGEDEREKKLDDGVVTWFWVKNESNERVSYKEVVV
KNGAETLAAIQAMNVNDYDLWITGRREGINPKILEGLSTWSEDHQLGVIGDTVAASVFAS
EGSVLVV

Output file format

Les résultats obtenus après une analyse sont de différents types. On dispose

  • d'un tableau au format CSV importable sous tout type de tabler (Excel...)
  • des résultats bruts des blast
  • des séquences provenant des meilleurs HITS

dseablast-excel.jpg

Documentation et liens

  • La documentation en ligne sur le site de la plateforme :

Références

  • Christophe CARON Unité Mathématique, Informatique et Génome, INRA, 78352 Jouy-en-Josas, France.
  • Clément Gauthey Unité Mathématique, Informatique et Génome, INRA, 78352 Jouy-en-Josas, France.
  • Luc Jouneau Unités VIM-BDR, INRA, 78352 Jouy-en-Josas, France.