On devrait donc rapidement enchainer sur la deuxième et sans doute dernière phase du projet. Elle consiste en une mise à jours des données génomiques nouvellement publiés, 393 999 nouvelles séquences protéiques
seront vérifiées et annotées pour éviter de répéter les séquences (des fois que les deux banques en aient en commun). En complément, les reférences d'une base de donnée thérapeuthique ont été ajoutées
(SwissProt - 254 609 séquences), elles contriburons à recouper les données. Pour finir,
une série de données expérimentales, d'environ 3 millions de séquences
de protéines potentielles, dûes au décalage du cadre de lecture ouvert (ORF :
Open Reading Frames , qui permet a une meme séquence d'ADN de donner plusieurs proteines différentes) ont été ajouté, afin d'essayer de découvrir des séquences de protéine où des modèles de codage additionnels.
Cette deuxième phase devrait durer 4 mois supplémentaires
Cet article a été publié le 21-03-2007 23:29. Vous pouvez suivre les commentaires suscités par cet article grâce au fil RSS 2.0. Vous pouvez laisser un commentaire.
Dernière mise à jour 24-05-2007 14:00
Vos commentaires (0)
Seul les utilisateurs enregistrés peuvent commenter un article.