MIGADI (MIcrobial Genome Annotation using Data Integration)
Ce projet (2007-2011) vise à développer un environnement bioinformatique innovant dédiée à l’annotation des génomes et des protéomes microbiens.
Il s’appuie sur les ressources existantes de la plateforme de bioinformatique MIGALE et sur différents programmes de recherche des unités MIG (MOSAIC) et MIA-J (PARIS). Le processus d'intégration reposera sur le déploiement de technologies Web Services.
Ce projet est financé par l'ANR PTFV 2007
Une courte communication a été présentée à JOBIM 2010 : Web Services for MIcrobial Genome Annotation using Data Integration
Présentation du projet
Le projet MIGADI vise à développer un environnement bioinformatique innovant dédié à l’annotation des génomes et des protéomes microbiens. Il s’appuie d’une part sur les ressources existantes de la plateforme de bioinformatique MIGALE labellisée plateforme opérationnelle RIO (Réunion Inter-Organismes), et d’autre part sur les méthodes et outils développées dans différents programmes de recherche récents mis en œuvre dans l’unité MIG en collaboration avec des microbiologistes de l’INRA. Cette complémentarité entre un environnement de recherche et une structure où la valorisation des travaux est une des activités de la plateforme est une opportunité pour déployer ce type d'approche. Les principales applications sur lesquelles seront basées le projet sont : le projet MOSAIC pour la génomique comparée et le projet PARIS pour la gestion et l’analyse des données expérimentales protéomiques.
Deux grands axes seront particulièrement exploités pour améliorer les étapes classiques d’annotation structurale et fonctionnelle d’un génome microbien : la génomique comparée et la protéomique.
Le projet se décompose ainsi en deux phases : une première phase visant à améliorer les outils existants développés dans l’unité et à en enrichir certaines fonctionnalités, et une deuxième phase consistant à proposer une intégration de l’ensemble des outils à travers une architecture de type Web Services. La première phase peut-être aussi considérée comme un pré-requis à l’intégration. En effet, un des préalables au déploiement d'une architecture totalement unifiée est de disposer de composants disposant de toutes les qualités en terme de génie logiciel (fiabilité, structuration du code, gestion des exceptions….). Ces caractéristiques nécessitent donc que l’on apporte un soin particulier à l’amélioration de certaines fonctions des composants, essentielles au futur système. Cette démarche sera conduite en parallèle à une certification ISO9001 des activités de la plateforme. Nous en profiterons donc pour mettre à profit cette dernière dans le cadre de ce projet afin d'assurer une certaine pérennité au système développé. Nous déploierons également durant cette phase des Web Services autour du logiciel R et implémentant des méthodes originales issues de projet de recherche. Ces services seront utilisés par la suite lors de la seconde phase, mais seront également accessibles par tout type de client conforme aux standards des Web Services.
Dans un second temps nous passerons, à l’étape d’intégration à proprement parlé. Ce système unifié fédérera plusieurs applications. Ce système sera à la fois un moyen de croiser les données, mais aussi d’offrir une source d’informations sans avoir à les répliquer. Les services web émergent depuis quelques années comme des technologies prometteuses pour le déploiement et l'intégration d'applications dans un environnement hétérogène. Plusieurs standards basés sur XML (WSDL, UDDI, SOAP) fournissent une infrastructure pour décrire, découvrir et invoquer des services. L’adoption de cette technologie permet d’implanter de nouvelles applications avec valeur ajoutée autour de composant existants. Les services web ont également pour avantage de pouvoir s’implémenter à posteriori autour d’une application. Ils offrent donc tous les atouts nécessaires à cette intégration. Par ailleurs, nous disposons déjà d'un composant, la chaîne d'annotation AGMIAL, dont certaines opérations utilisent des Web Services. Ce composant sera l'élément intégrateur de la nouvelle architecture. Il pourra à la fois jouer un rôle de relais, mais aussi d’intégrateur des nouvelles sources données comme les données issues des expériences en protéomique.
Nous souhaitons donc déployer une architecture qui permette de créer des liens entre les différents composants, sans pour autant augmenter la dépendance entre ces composants. Ce mode collaboratif entre les différentes applications dans un même cadre fournira un support pour les futurs développements.
Partenaires
Plateforme ABiMS Analysis and Bioinformatics for Marine Science
Ludovic Legrand (01/07/2009-31/07/2010)
Célia Michotey (01/12/2009-31/10/2010)
MIG (Mathématique, Informatique et Génome) et Platefiorme bioinformatique MIGALE
Hélène Chiapello
Annie Gendrault
Jean-François Gibrat
Valentin Loux
Véronique Martin
MIAJ Mathématiques et Informatique Appliquées
Outils
AGMIAL Annotation de Génomes Microbiens d' Intérêt Agro aLimentaire
MOSAIC : Comparison of closey related bacterial genomes
PARIS Proteomic Analysis and Resources Indexation System
Collaborations
STLO Science et Technologie du lait et de l'Oeuf
PAPPSO Plateforme d'Analyse Protéomique de Paris Sud-Ouest