Outils en ligne
Les outils présentés ici sont parmi les plus couramment utilisés en bioinformatique génomique et protéomique
Des logiciels publiques sont à la disposition des projets de
recherche et des utilisateurs. Ils sont tous accessibles en ligne de
commande depuis le serveur topaze. Dans cette configuration il est nécessaire de disposer d'un compte linux. Certains outils sont accessibles à travers une interface web.
Les outils sont référencés dans un annuaire afin de de disposer d'une vue d'ensemble et de liens vers les documentations respectives. La suite logicielle EMBOSS regroupe, à elle seule près de 300 applications différentes. Les outils les plus classiques sont bien sûr en ligne (BLAST, FASTA, CLUSTAL..). En complément, la plateforme héberge les outils développés
par l'unité MIG dans le cadre de projet comme la chaîne d'annotation des génomes microbiens AGMIAL, le détecteur de gènes SHOW ou FROST un outil de reconnaissance de repliements.
Le référentiel "outils" est également interrogeable :
Un référentiel de l'ensemble des outils est interrogeable par ordre alphabétique ou par type d'utilisation. Vous pouvez aussi y trouver les outils développés à l'INRA et une version synthétique des logiciels développés par l'unité MIG. Enfin tous les outils ne rentrant pas dans les 2 catégories pécédentes : externes.Les logiciels développés par MIG et utilisable sur la plateforme :
- AnovArray
est un ensemble de macros SAS pour l'analyse de données expressionnelles
de type microarray et macroarray. Il permet la quantification des
variations biologiques et technologiques et la détection de gènes
différentiels entre plusieurs conditions. Les méthodes statistiques
utilisées sont l'analyse de variance (ANOVA) et la méthode FDR (False
Discovery Rate) pour le calcul de probabilités ajustées dans le cadre
de test d'hypothèses multiples. Le package et le guide
d'utilisation sont disponibles ici.
- FROST
(Fold Recognition Oriented Search Tool) est un outil
de reconnaissance de repliements.
-
ISLAND
est un programme qui permet de simuler le progrès d'un projet de
cartographie physique de génomes par
la méthode d'ancrage. Il
fournit en particulier le nombre moyen de contigs obtenus, leur
longueur moyenne et la proportion moyenne de génome recouverte par
les contigs, en fonction de la longueur du génome, des nombres de
clones et ancres utilisés et des longueurs de clones. Il est disponible
(code source et documentation)
ici.
-
KAKSI
est un programme
d'assignation de la structure secondaire
des protéines. L'assignation
des structures secondaires : l'hélice alpha (H), les brins bêta (b),
les tournants (T)
et les structures apériodiques (C) est effectuée sur la base des
distances entre les carbones alpha et des angles phi et psi de la
chaîne principale. Le programme calcule
aussi la courbure de la chaîne principale. KAKSI est disponible ici
-
LP2Asium est un logiciel développé dans le cadre des
projets Caderige et ExtraPloDocs. C'est une suite intégrée de composants
indépendants qui prend en entrée un document textuel, en fait
l'analyse syntaxique grâce à Link Parser (développé au CMU), en
extrait toutes les dépendances syntaxiques, les classe par type et les
met au format d'entrée Asium. La grammaire et le lexique de LP sont
modifiables et la liste des dépendances indépendante de l'analyseur.
La suite est en Perl et Java. LP2Asium est libre. Il est fourni avec
un lexique spécialisé pour la génomique.
-
MuGeN(Multi-Genome Navigator)
est un outil interactif
permettant une exploration dans plusieurs
génomes annotés complétés
par des résultats d'analyse in silico. Il dispose également
d'un mode d'exécution en mode batch lui permettant de servir
de générateur d'images à divers formats. Ce mode de fonctionnement le
prédispose à être intégré à des sites Web pour l'affichage de cartes
physiques annotées. MuGeN est disponible
ici et est référencé sur
sur les portails FreshMeat et Bioinformatics.Org.
-
OSS-HMM
(Optimal Secondary Structure prediction Hidden Markov Model) est un
programme de prédiction de la structure secondaire des protéines selon 3
états : hélice alpha (H), brin bêta (b), et structure apériodique (C) qui
utilise le formalisme des modèles de Markov cachés. Quand il est utilisé
avec une seule séquence il fournit un Q3 de 68.8%. Avec un alignement
multiple il fournit un Q3 de 75.5%.
Cet outil peut aussi être utilisé pour générer des séquences de protéines
ayant une suite de structures secondaires particulières.
OSS-HMM est disponible ici
-
R'HOM
(Recherche de régions HOMogènes dans les séquences d'ADN)
est un logiciel dédié à l'utilisation de modèles de chaînes de Markov
cachées pour la segmentation
de séquences d'ADN en régions
homogènes. R'HOM permet d'estimer un modèle de la composition des
séquences d'ADN plus réaliste qu'un modèle de chaîne de Markov
homogène et ensuite de segmenter les séquences sous ce modèle. Il a
été utilisé notamment pour la recherche de transferts horizontaux chez
B. subtilis et pour l'estimation de modèles destinés au calcul
de la significativité de comptages de mots. R'HOM a été développé en
coopération avec le Laboratoire Statistique et Génome d'Evry. Il est
distribué librement à l'adresse
ici.
-
R'MES
(Recherche de Mots Exceptionnels dans les Séquences d'ADN)
est un ensemble de programmes C++ dédié à la recherche de mots (ou
familles de mots) ayant une fréquence exceptionnelle dans une séquence
donnée (ADN, protéine ou autre). Il est distribué librement sur Internet à
partir de la
plateforme de développement collaboratif mulcyber de l'Unité de
recherche BIA de l'INRA-Toulouse
ainsi qu'un
guide de l'utilisateur et une aide en ligne.
Une visualisation des résultats générés par R'MES peut être obtenue grâce à
l'interface graphique
RMESPlot disponible sur http://mulcyber.toulouse.inra.fr/projects/rmesplot.
-
SHOW
(Structured HOmogeneities Watcher) est un "R'HOM" amélioré qui
permet de définir souplement un modèle de chaîne de Markov cachée
complexe puis d'utiliser ce modèle de diverses manières grâce à
l'implémentation d'algorithmes de segmentation (forward-backward,
Viterbi), d'estimation (EM) et de simulation. Jusqu'à aujourd'hui SHOW
a essentiellement servi pour prédire les gènes bactériens mais il a
aussi été utilisé avec d'autres objectifs comme la détection des sites
d'épissage chez l'Homme. A l'avenir il devrait faciliter la mise au
point de modèles destinés à l'étude de nombreux problèmes
biologiques. SHOW a été développé en collaboration avec le Laboratoire
Statistique et Génome d'Evry, il peut être téléchargé librement
ici.
-
SIMPA
est un programme de prédiction de la structure
secondaire des protéines. 3 états
sont pris en considération : l'hélice alpha (H), les brins bêta (b) et les
structures
apériodiques (C). Ce programme est basé sur la notion de "nearest neighbor".
Il fournit un résultat Q3 de 67%.
-
STFilter (Sentence Filter) prend en entrée un ensemble de
résumés au format MedLine et en
extrait les phrases "pertinentes".
La notion de pertinence est apprise automatiquement à partir
d'exemples de phrases classées comme pertinentes et non pertinentes.
Les classifieurs appris et disponibles dans SFilter sont des
classifieurs sur les interactions géniques chez Bacillus
subtilis, chez la drosophile et chez le poulet. Le logiciel est libre
et est écrit en Java.
Autres logiciels en ligne :
- PARIS (Proteomic Analysis and Resources Indexation System)
- Gisil ou comment gérer ses collections de souches bactériennes
- FindTarget permet des recherches multi genomes
Si vous ne trouvez pas un outil mais que vous souhaitez pouvoir
l'utiliser, vous pouvez contactez les responsables de la plateforme en
utilisant le lien suivant.



