Projet Entrepôt de données pour l'IMSV

Dans le cadre d'un projet de l’Institut de Modélisation des Systèmes Vivants au sein de l’Université Paris-Saclay, nous cherchons à mettre en place une plateforme d’intégration de données hétérogènes. La nouveauté de cette plate-forme s'appuierait sur une représentation systémique de la cellule comprenant une description statique du génome, des composantes biologiques, des processus biologiques (promoteur, région d’initiation de la traduction, CDS, terminateur, la fonction des gènes, etc.) et des caractéristiques dynamiques associées aux modèles mathématiques de la cellule, et nourries par des données omiques biologiques. Les informations seront compilées à partir de précédents projets européens BaSysBio et BaSynthec, de l'annotation des génomes, de banques de données expertisées comme Uniprot, SubtiWiki. Cette plateforme sera mise en place autour de données concernant les bactéries, puis elle sera étendue aux cellules des eucaryotes.

Sur ce projet, un ingénieur a été recruté et est spécifiquement en charge de la conception, du développement et de l’alimentation de l’entrepôt de données. Pour cela, l’ingénieur s’appuie sur (a) une ontologie développée dans le cadre de l’IMSV décrivant précisément les objets de la cellule (éléments génétiques, voies métaboliques, localisations et voies de régulation) ainsi que leurs relations (b) des bases de données et Wiki existantes contenant de l’information à extraire et (c) des données omiques produites dans le cadre des projets européens passés. L’ingénieur travaille ainsi en étroite collaboration avec les autres ingénieurs de l’IMSV, en particulier l’ingénieur en charge du développement de l’ontologie. A terme l’entrepôt constituera la colonne vertébrale sur laquelle viendront se greffer les différents outils d’exploration, visualisation et modélisation mis en place dans le cadre de l’IMSV.

Menu principal

Page | by Dr. Radut