Analyse d'une foule de données sur le monde naturel

Détails: Catégorie parente: Actualités; Publication : 15 octobre 2015

logo UGM

traduction: Maugou source: article UGM

Par: Wim Degrave, Ph.D.
Laboratorio de Genòmica Funcional e Bioinformática Instituto Oswaldo Cruz - Fiocruz
14 octobre 2015

Récapitulatif

Le projet "Découvrir les mystères du génome" (UGM) a déjà amassé des données sur plus de 200 millions de protéines, dans le but de comprendre les caractéristiques communes à la vie partout sur Terre. Il y a des dizaines de millions de calculs restant à effectuer, mais l'équipe se prépare également pour l'analyse et la publication éventuelle des données.

images UGM

Depuis près d'un an maintenant, UGM a comparé les séquences de protéines dérivées des génomes de presque tous les organismes vivants analysés à ce jour. Merci à tous les bénévoles qui contribuent avec du temps d'ordinateur pour la World Community Grid, plus de 34 millions de résultats ont été retournés avec des données sur l'identification fonctionnelle et les similitudes des protéines. Avec nos collaborateurs en Australie, nous avons porté une attention particulière aux micro-organismes de différents écosystèmes, avec un accent particulier sur les organismes marins. Plus de 200 millions de protéines ont été comparées à ce jour, au cours de l'équivalent de 15000 années de calcul. Les données obtenues sont envoyées à nos serveurs informatiques à la Fondation Fiocruz de Rio de Janeiro, au Brésil, et maintenant également à l'Université de Nouvelle-Galles du Sud (Sydney, Australie). Un dernier ensemble d'environ 20 millions de séquences de protéines, déterminé sur la dernière année, est maintenant ajouté à l'ensemble de données et sera traité sur la World Community Grid dans les prochains mois.

Cependant, la tâche de cartographie fonctionnelle et la comparaison entre les protéines de tous ces organismes ne se termine pas là. Notre équipe de scientifiques, dans l'intervalle, investit plus d'efforts pour optimiser les algorithmes pour une analyse plus approfondie et la représentation des données générées par des bénévoles de la World Community Grid, et de préparer les systèmes de bases de données qui mettront les résultats à la disposition de la communauté scientifique. Une fois nos données publiques, nous nous attendons à ce que la compréhension de la communauté scientifique, du réseau complexe de la vie, acquière une perspective complètement nouvelle, et que les résultats contribueront également au développement de nombreuses nouvelles applications dans la santé, l'agriculture et les sciences de la vie en général.

Ce projet est une collaboration entre le World Community Grid, le laboratoire du Dr Torsten Thomas et son équipe de l'École de la biotechnologie et des sciences biomoléculaires et Centre de bio-innovation marine à l'Université de Nouvelle-Galles du Sud (Sydney, Australie), et notre équipe au Laboratoire de génomique fonctionnelle et bio-informatique, à la Fondation Oswaldo Cruz (Fiocruz), au Brésil.

Création : 15 octobre 2015

Mis à jour : 15 octobre 2015