Recherche de motifs


VersionMAJ

bioprospector

20042014-01-01DownloadDoc
Programme de recherche de motifs d'une ou deux boîtes exceptionnels (Gibbs Sampler) dans des séquences d'ADN. Des séquences de bruit de fond peuvent être fournies. Séquences en entrée de moins de 32765 nt, format fasta avec séquence sur une ligne (et en-tête de la forme >sequence1 nomdegene ). Peut rechercher spécifiquement des palyndromes.

Remarque
Run Unix # BioProspectorRun Web #

VersionMAJ

censor

4.2.102008-07-02DownloadDoc
CENSOR is a software tool which screens query sequences against a reference collection of repeats and "censors" (masks) homologous portions with masking symbols, as well as generating a report classifying all found repeats.

Remarque
Run Unix # censorRun Web #

VersionMAJ

ELPH

1.0.12012-10-01DownloadDoc
ELPH is a general-purpose Gibbs sampler for finding motifs in a set of DNA or protein sequences. The program takes as input a set containing anywhere from a few dozen to thousands of sequences, and searches through them for the most common motif, assuming that each sequence contains one copy of the motif. We have used ELPH to find patterns such as ribosome binding sites (RBSs) and exon splicing enhancers (ESEs).

Remarque
Run Unix # elph [options] OR elph [-t ] Run Web #

VersionMAJ

GALF_P

-2010-03-18DownloadDoc
GALF-P is a novel framework for TFBS identification (motif discovery) in DNA sequences. It consists of Genetic Algorithm with Local Filtering (GALF) and the post-processing procedure based on adaptive adding and removing. GALF-P achieves both effectiveness and efficiency, and provides reliable performance over the other state-of-art GA based approaches. The post-processing procedure is designed for zero or more TFBSs in each sequence.

Remarque
Run Unix # GALF_P.oRun Web #

VersionMAJ

gimsan

201008302011-01-10DownloadDoc
GIMSAN (GIbbsMarkov with Significance ANalysis): a novel tool for de novo motif finding. GIMSAN combines GibbsMarkov, our variant of the Gibbs Sampler, described here for the first time, with our recently introduced significance analysis.

Remarque please cite: Patrick Ng, Uri Keich. GIMSAN: A Gibbs motif finder with significance analysis. Bioinformatics, 24 (19): 2256-2257, 2008.
Run Unix # gimsan_submit_job.pl Run Web #

VersionMAJ

grepseq

1.2.22004-01-21DownloadDoc
The `grepseq' program takes a keyword which can contain ambiguous characters and character classes (also called a fixed-width motif) and then searches files and databases for exact or approximate matches to that keyword. The program produces one of two kinds of output, either a list of the matching sequences with the places where the keyword matched, or the complete entries of sequences containing matches, where each entry is annotated with the places where the matches occur.

Remarque Fait partie de seqio
Run Unix # grepseqRun Web #

VersionMAJ

hmmer

3.12013-08-23DownloadDoc
HMMER: profile HMMs for protein sequence analysis Profile hidden Markov models (profile HMMs) can be used to do sensitive database searching using statistical descriptions of a sequence family's consensus.

Remarque
Run Unix # Run Web #

VersionMAJ

ncoils

DownloadDoc

Remarque
Run Unix # ncoilsRun Web #

VersionMAJ

PatScan

2007-12-12DownloadDoc
PatScan is a pattern matcher which searches protein or nucleotide (DNA, RNA, tRNA etc.) sequence archives for instances of a pattern which you input.

Remarque patscan pat_file < input_file
Run Unix # patscanRun Web #

VersionMAJ

pfam_scan.pl

2012-11-29DownloadDoc
pfam_scan.pl - search protein fasta sequences against the Pfam library of HMMs.

Remarque
Run Unix # pfam_scan.pl -fasta -dir /usr/local/genome/PfamScan/databases Run Web #

VersionMAJ

pftools

2.3.42004-04-10DownloadDoc
Le paquetage pftools est une collection de programmes expérimentaux qui permet de manipuler le format généralisé de profils et implémente les méthodes de recherche de PROSITE. Les commandes accessibles sont les suivantes : gtop, pfsearch, pfscan, psa2msa, pfmake, pfw, ptoh, htop, pfscale, pftof.

Remarque
Run Unix # pfsearchRun Web # pfsearch

VersionMAJ

ReAS

2.022011-06-30DownloadDoc
ReAS: Recovery of Ancestral Sequences for Transposable Elements from the Unassembled Reads of a Whole Genome Shotgun

Remarque http://www.ploscompbiol.org/article/info:doi%2F10.1371%2Fjournal.pcbi.0010043
Run Unix # Run Web #

VersionMAJ

RepeatMasker

3.3.02011-07-04DownloadDoc

Remarque Pour rechercher une espèce par exemple bos_taurus : /usr/local/genome/RepeatMasker/util/queryTaxonomyDatabase.pl -species "bos taurus"
Run Unix # RepeatMaskerRun Web #

VersionMAJ

RepeatScout

1.052011-06-30DownloadDoc
RepeatScout is a tool to discover repetitive substrings in DNA.

Remarque If you use RepeatScout, please cite the following paper: Price A.L., Jones N.C. and Pevzner P.A. 2005. De novo identification of repeat families in large genomes. To appear in Proceedings of the 13 Annual International conference on Intelligent Systems for Molecular Biology (ISMB-05). Detroit, Michigan.
Run Unix # *1/ build_lmer_table -l -sequence -freq [opts] **2/ RepeatScout -sequence -output -freq -l [opts]Run Web #

VersionMAJ

RHOM

31.5DownloadDoc
R'HOM (Recherche de régions HOMogènes) est un programme pour la segmentation de séquences d'ADN en régions de composition homogènes par chaînes de Markov cachées. L'utilisateur choisi le nombre de type de composition différentes et la longueur des mots à prendre en compte. Les paramètres sont ensuite estimés par maximum de vraisemblance (algorithme EM) et la séquence est finalement segmentée avec l'algorithme forward backward. R'HOM a été initialement développé pendant la thèse de doctorat de Florence Muri et a été ensuite en grande partie ré-implémenté.

Remarque
Run Unix # rhom.emRun Web #

VersionMAJ

rmes

3.1.02014-08-20DownloadDoc
Programme pour détecter des mots ou motifs ayant une fréquence statistiquement exceptionnelle dans une séquence biologique. (R'MES pour Recherche de Mots Exceptionnels dans les Séquences)

Remarque Voici ce qu'il y a de nouveau par rapport à la version 3.01 : Changements majeurs : - amélioration significative du temps de calcul dans le cas des approximations Gaussiennes, quelque soit l'ordre du modèle, - levée de la contrainte sur la taille des noms des familles de mots. Changements mineurs : - renommage des options de sélection de seuil dans l'outil de mise en forme des résultats (--minthresh et --maxthresh deviennent --tmin et --tmax), - modification de l'ordre de présentation pour les résultats de calcul de biais (triés selon le score, et non plus alphabétiquement). Pour toutes questions, contactez Sophie.Schbath@jouy.inra.fr
Run Unix # rmes [options] -s -o rmes --helpRun Web #

VersionMAJ

rmesplot

0.922007-10-31DownloadDoc

Remarque
Run Unix # rmesplotRun Web #

VersionMAJ

rna2map

0.5.02009-09-10DownloadDoc
The SOLiD System Small RNA Analysis Pipeline Tool (RNA2MAP) can be used to perform whole genome analysis of color space RNA library reads. It consists of three major procedures: filtering, matching against miRBase sequences (Sanger), and matching against a reference genome.

Remarque
Run Unix # Run Web #

VersionMAJ

rnammer

1.22014-04-30DownloadDoc
RNAmmer 1.2 predicts 5s/8s, 16s/18s, and 23s/28s ribosomal RNA in full genome sequences

Remarque
Run Unix # rnammer [options] (man rnammer)Run Web #

VersionMAJ

SPatt

2.0-pre1 & 1.2.22007-10-02DownloadDoc
SPatt (Statistic for Patterns) is a suite of C++ programs designed for the computation of pattern occurrences p-value on text. Assuming the text is generated according to Markov model, the p-value of a given observation is its probability to occur. The lower is the p-value, the more unlikely is the observation. For example, this tools can be used to find patterns with unusual behaviour in DNA sequences.

Remarque
Run Unix # spatt (aspatt cpspatt gspatt ldspatt oldxspatt sspatt xspatt)Run Web #

VersionMAJ

STAMP

1.12014-09-29DownloadDoc
Similarity, Tree-building, & Alignment of Motifs and Profiles

Remarque
Run Unix # STAMPRun Web #

VersionMAJ

Tandem Repeats Finder

4.07b 2013-08-20DownloadDoc
A tandem repeat in DNA is two or more adjacent, approximate copies of a pattern of nucleotides. Tandem Repeats Finder is a program to locate and display tandem repeats in DNA sequences.

Remarque
Run Unix # trfRun Web #

VersionMAJ

vmatch

2.02007-10-29DownloadDoc
Vmatch replaces Reputer. It looks for all possible repeats in genomes, withsa possibility to specify the kind of repeats to look for, like its identityspercentage, minimal length, etc...Can also be used to mask repeats inssequences, to analyze repeat families, etc...

Remarque
Run Unix # Run Web #

VersionMAJ

weeder

1.4.22009-12-07DownloadDoc
Recherche nouveaux TFBSs dans un jeu de sequences fasta, recherche de plusieurs tailles et limite de mutations autorisees. Ne sort que les motifs ayant passe le tri stat, contrairement a MEME qui donne autant de motifs que specifie dans les parametres. Par defaut les stat de genome sont basees sur un promoteur de 1000 pb, mais possibilite d'utiliser des stats basees sur toute la sequence intergenique.

Remarque Pavesi G, Mereghetti P, Mauri G, Pesole G. Weeder Web: discovery of transcription factor binding sites in a set of sequences from co-regulated genes. Nucleic Acids Res. 2004 32:W199-W203
Run Unix # weederlauncher.out inputfilename speciescode analysistype Run Web #

VersionMAJ

weederH

1.4.22009-12-07DownloadDoc
Recherche de TFBS et ECR dans des sequences homologues. Pas d'alignement necessaire en input, pas de prerequis de PWM. Mesure de la conservation relative entre les sequences par recherche d'oligo conserves et scoring de similarite globale entre deux sequences homologues. Permet de chercher aussi les enhancers distaux. Fonctionnerait sur des promoteurs non annotes (pas de TSS connu).

Remarque Pavesi, G., Zambelli, F., Pesole, G. WeederH: an algorithm for finding conserved regulatory motifs and regions in homologous sequences. BMC Bioinformatics 2007, 8:46
Run Unix # weederH.out -f inputfilename -O speciescode Run Web #

VersionMAJ

xgrail

1.3c2002-09-20DownloadDoc
GRAIL is a suite of tools designed to provide analysis and putative annotation of DNA sequences both interactively and through the use of automated computation.

Remarque
Run Unix # xgrailRun Web # http://genome.jouy.inra.fr/

Menu principal

Page | by Dr. Radut