Depuis la mi-septembre un nouveau site est opérationnel pour présenter et surtout pouvoir effectuer des recherches à l'intérieur de la base de données résultant des calculs sur SIMAP.

http://mips.gsf.de/simap

Le nouveau portail fournit des outils plus efficaces, l'intégration d'annotations fonctionnelles à l'aide de PEDANT (Protein Extraction, Description, and ANalysis Tool - annotation exhaustive et automatique d'une séquence protéique ou d'un protéome complet), le regroupement de séquences, et le nouveau "DomainBLAST" permettant de rechercher les homologues en partant de la structure.

Les possibilités de recherches :

Cette page vous permettra de trouver les séquences et les protéines d'intérêt par une recherche en texte intégral en utilisant un index avec les identités, les numéros d'ordre, les descriptions des protéines ainsi que le Biothesaurus.
À partir de votre propre séquence, vous trouverez les séquences les plus proches dans SIMAP. Cette recherche fonctionnera beaucoup plus rapidement qu'avec BLAST, lorsque que vous recherchez certaines parties de votre demande dans l'arbre des suffixes de l'ensemble des séquences contenues dans SIMAP (produits par VMATCH).

 


Au bas de la page, vous pouvez choisir les unités taxonomiques qui doivent être incluses ou excluses de votre recherche de séquences où de votre recherche en texte intégral.

 

En raison de l'utilisation d'identificateurs multiples pour la même protéine dans les différentes bases de données, un important travail bioinformatique qui demande beaucoup de temps consiste à transformer un groupe de protéines en un autre domaine d'identification. Ce travail est également nécessaire pour les bases de données propriétaires qui utilisent des identifiants particuliers et pour lesquels une échelle de correspondance devrait être établit dans les bases de données publiques. Une situation semblable se produit pour des données issues des expérimentations de protéomique.

SIMAP établit une cartographie très rapide entre les groupes de protéines, cette cartographie se base sur l'identité des séquences de la protéine en comparant leur hachage MD5. Lorsqu'on ne peut pas tenir compte de la cartographie des identités des séquences, par exemple si des séquences sont fragmentées ou altérées par des résidus non identifiés, une cartographie demandant plus de temps peut être effectuée avec PROMPT qui utilise la fonction SIMAP "SeqFinder" et établit une cartographie par des recherches de similitudes individuelles.

 

Voici les dernières statistiques de la Base de donnée :

Statistiques Actuelles
Date de mise à jour
22-09-2007 à 03:31:26
Bases de données
548
Protéines
17 558 766
Séquences
6 275 189
Résidus
2 092 498 491
Séquences traitées
6 189 008
Résultats positifs (hits)
90 748 726 442