Nokia : Combattre la COVID-19 en utilisant la capacité de calcul de la R&D 5G
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Trouver des traitements contre la COVID-19 est un travail difficile et complexe qui prendrait normalement des années. Alors que les infections continuent de monter en flèche dans le monde, la course à la recherche devient de plus en plus urgente. Le temps n'est pas du côté des scientifiques.
Une façon d'accélérer la recherche consiste à exécuter des simulations informatiques d'expériences pour prédire dans quelle mesure les composés chimiques inhibent la COVID-19. Plus les scientifiques disposent de puissance de calcul, plus les simulations peuvent être exécutées, ce qui augmente les chances de trouver rapidement un traitement.
Une initiative mettant à la disposition des chercheurs une vaste capacité de calcul est le World Community Grid . Des volontaires du monde entier rejoignent le Grid pour donner de la capacité de réserve sur leurs appareils afin d'exécuter des calculs de recherche. Après avoir installé un logiciel sécurisé, l'utilisateur continue simplement comme d'habitude, à taper des courriels et des documents ou à naviguer sur Internet. Lorsque l'ordinateur n'est pas à pleine capacité ou est inactif, il exécute automatiquement une simulation en arrière-plan. Une fois terminé, l'ordinateur renvoie les résultats et demande la simulation suivante. Tout se passe discrètement sans interrompre les utilisateurs.
Le Grid combine les résultats de millions d'appareils et les envoie aux équipes de recherche pour analyse. Les scientifiques obtiennent des résultats en quelques mois au lieu de décennies en identifiant les domaines les plus importants à étudier en laboratoire.
NESC - l'un des plus grands clouds OpenStack au monde, se joint à l'effort
Le World Community Grid est un moyen simple et efficace d'aider les chercheurs en santé et un moyen que Nokia Enterprise and Services Cloud (NESC) soutient en apportant sa puissance de calcul supplémentaire. Les machines virtuelles utilisées pour le développement de logiciels 5G sont désormais également utilisées dans la lutte contre la COVID-19.
NESC est l'un des plus grands clouds basés sur OpenStack au monde avec 484 000 cœurs de capacité de calcul et 40 Po (pétaoctets) de stockage. Il est distribué dans le monde entier sur trois continents dans six centres de données de niveau 3 et est utilisé par Nokia pour héberger des charges de travail de recherche et développement critiques, et commencera bientôt à alimenter le parcours de transformation numérique des entreprises. Certifié ISO 27001, le NESC a déjà consacré environ 100 ans de temps de calcul à la recherche sur le COVID-19, le plaçant parmi les principaux contributeurs en cette période de besoin.
Espérons que le World Community Grid aidera à trouver un traitement efficace contre la COVID-19, mais son travail ne s'arrêtera pas là. Les scientifiques veulent être préparés à la prochaine urgence. Les futures pandémies pourraient provenir de mutations conduisant à une nouvelle variante du virus. Pour être prêts, les chercheurs ont besoin d'un accès rapide à des outils qui peuvent être déployés dès qu'une maladie menace. Le Grid peut aider à évaluer la difficulté de concevoir des molécules pour surmonter ces mutations inévitables.
Nokia est fier de soutenir le Grid dans la recherche de pointe sur les questions humanitaires telles que la COVID, la prévision des précipitations, le cancer infantile, le sida, etc. Aider à résoudre les plus grands problèmes mondiaux de santé et de développement durable est une cause proche des valeurs de Nokia.
Partagez vos réflexions sur ce sujet en rejoignant la discussion Twitter avec @nokia ou @nokianetworks en utilisant # 5G #cloud #CES #core
par Ashish Nainwal
5 août 2020
A propos d'Ashish Nainwal
À la tête du marketing Global Service Delivery, Ashish est enthousiasmé par la façon dont la numérisation, l'automatisation robotique et l'intelligence artificielle transforment la prestation de services chez Nokia.
Fort de plus de deux décennies de savoir-faire en matière de télécommunications, il aime également garder le doigt sur le pouls de l'innovation et des tendances technologiques.
Et son autre passion qui améliore la vie est la musique.
Il tweete souvent via : @NainwalAshish
traduction de l'article de Nokia : https://www.nokia.com/blog/fighting-covid-19-using-5g-rd-computing-capacity/
- Affichages : 934
WCG : OpenPandemics - COVID-19 : Mise à jour d'août
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
OpenPandemics - COVID-19 lancé en mai, et les travaux ne font que commencer. Apprenez-en davantage sur les progrès des scientifiques jusqu'à présent, ainsi que sur les collaborations qui aideront à faire avancer la recherche dans les semaines et les mois à venir.
L'équipe de recherche OpenPandemics
En haut : Stefano Forli, Paolo Governa, Andreas Tillack, Jérôme Eberhardt
Au milieu : Giulia Bianco, Batuujin Burendei, Diogo Santos-Martins, Martina Maritan
En bas : Matthew Holcomb, Christina Garza
Cliquez ici pour en savoir plus sur l'équipe.
Contexte
OpenPandemics - COVID-19 a été créé pour aider à accélérer la recherche de traitements COVID-19.
Vous pouvez en savoir plus sur les détails des travaux sur le site Web de l'équipe de recherche.
L'analyse des données
Depuis le lancement d'OpenPandemics - COVID-19 en mai, le projet a examiné des millions de composés chimiques qui pourraient être des traitements potentiels pour la maladie. Le dépistage est toujours en cours, mais l'équipe de recherche a analysé les résultats obtenus jusqu'à présent (45,7 millions de pistes et 2,3 milliards de questions posées) et a réduit le groupe initial à environ 1500 composés (0,00003% du total des ligands amarrés ! ) qui ont été sélectionnées pour leurs interactions avec les protéines cibles et qui justifient une analyse plus approfondie.
À partir du groupe actuel de 1 500 composés, les chercheurs effectueront une analyse manuelle pour identifier environ 100 des plus prometteurs, qui seront ensuite transmis à leurs collaborateurs pour des tests en laboratoire supplémentaires.
(Vous pouvez voir une liste de collaborateurs vers le bas de la page Participants à la recherche.)
Pendant que ces tests se poursuivent, ils continueront d'analyser les données qu'ils reçoivent de notre part et continueront à nous envoyer de nouveaux travaux.
Collaborations additionnelles
Le chercheur principal est en contact avec l'équipe de scientifiques européens du Coronavirus Structural Taskforce pour aider à améliorer la qualité des résultats de toutes les recherches fondamentales sur le SRAS-CoV-2. L'équipe recueille et conserve les données structurelles des protéines disponibles sur les virus SARS-CoV et SARS-CoV2 qui sont constamment produites par des chercheurs du monde entier. Ils affinent les données publiées et effectuent des validations statistiques et des diagnostics sur les structures pour corriger les erreurs ou fluctuations expérimentales.
Attribution des subventions
Le laboratoire Forli a récemment reçu un prix du jeune chercheur de la Fondation Baxter pour l'identification de nouveaux composés chimiques en tant que candidats prometteurs pour le développement de médicaments.
Version GPU
L'équipe de développement de World Community Grid commence à créer des unités de travail pour les premiers tests alpha. Leur problème actuel est de créer des unités de travail qui peuvent fonctionner à la fois sur le CPU et le GPU, plutôt que de devoir créer deux versions différentes, ce qui ajouterait de la complexité au projet. La prochaine étape au sein d'IBM sera une revue de sécurité de la nouvelle version. Les travaux sont en cours et il n'y a actuellement aucune estimation de la date à laquelle ils seront terminés.
Publications potentielles
Les chercheurs travaillent sur plusieurs articles. L'un des articles concerne l'histoire d'AutoDock (le logiciel qui exécute OpenPandemics, qui a été créé par Scripps Research). Si l'article est accepté, il sera publié au début de 2021.
Ils ont également soumis un article décrivant le développement et l'application de protocoles pour l'étude des inhibiteurs covalents (y compris le protocole d'amarrage réactif utilisé dans l'OpenPandemics).
Un autre article a été soumis décrivant leur travail de collaboration avec l'équipe du Oak Ridge National Laboratory et NVIDIA pour exécuter des simulations afin d'identifier de nouvelles molécules contre le virus SARS-CoV2.
État actuel des unités de travail
- Disponible pour téléchargement: 4882 lots
- En cours: 2 052 lots (16 101 394 unités de travail)
- Terminé: 5459 lots (2587 lots au cours des 30 derniers jours, soit une moyenne de 86 lots par jour)
- Reste-à-faire estimé: 56 jours
Cliquez ici pour en savoir plus sur les mises à jour mensuelles des projets de World Community Grid.
13 août 2020
traduit de l'article WCG : https://www.worldcommunitygrid.org/about_us/viewNewsArticle.do?articleId=635&linkId=97049398
- Affichages : 848
WCG - Mise à jour d'août : Africa Rainfall Project
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
L'équipe du World Community Grid a eu une rapide réunion mensuelle avec les chercheurs du projet Africa Rainfall, dont vous pouvez lire le compte-rendu dans cet article.
Contexte du projet
95% de l'agriculture en Afrique dépend des précipitations. L'Africa Rainfall Project utilise une puissance de calcul massive, des données de The Weather Company et d'autres données pour fournir des prévisions de précipitations plus précises, ce qui aidera les agriculteurs à mieux cultiver.
Recherche d'un membre supplémentaire de l'équipe
Les chercheurs recherchent un membre supplémentaire de l'équipe pour aider au post-traitement des données. La recherche d'une personne qualifiée prendra probablement quelques mois.
Prochaines conférences
L'équipe de recherche a soumis un résumé pour faire une présentation à la conférence America Geophysical Union, qui doit avoir lieu en décembre. En raison de la pandémie en cours, la conférence sera virtuelle, cette année.
État actuel des unités de travail
Nous envoyons actuellement les générations 18 et 19.
(Une génération est un ensemble de travaux - dans ce cas, un ensemble de simulations informatiques de précipitations en Afrique subsaharienne.)
L'équipe technique de World Community Grid augmente le taux quand nous envoyons du travail.
Nous publierons à propos de cette augmentation dans le forum African Rainfall Project dès sa mise en œuvre.
Cliquez ici pour en savoir plus sur les mises à jour mensuelles des projets de World Community Grid.
10 août 2020 |
traduction de l'article World Community Grid : https://www.worldcommunitygrid.org/about_us/viewNewsArticle.do?articleId=633&linkId=96668123
- Affichages : 691
Dans les coulisses des projets actifs de World Community Grid
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Récapitulatif
Vous souhaitez en savoir plus sur nos appels mensuels avec les chercheurs pour chaque projet World Community Grid actif? Vous pouvez obtenir des mises à jour sur notre site Web, dans notre forum et par e-mail.
- Affichages : 870
Lire la suite : Dans les coulisses des projets actifs de World Community Grid
Deux articles récents ont publié des résultats de GPUGRID
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Deux articles récents ont publié des résultats de GPUGRID :
PlayMolecule CrypticScout :
Prédire les sites cryptiques de protéines à l'aide de la simulation moléculaire à solvant mixte
Gerard Martinez-Rosell, Silvia Lovera, Zara A. Sands, and Gianni De Fabritiis
Journal of Chemical Information and Modeling 2020 60 (4), 2314-2324 DOI: 10.1021 /acs.jcim.9b01209
Dans cet article (et le système live correspondant), les calculs de GPUGRID sont utilisés pour alimenter une recherche de poches insaisissables (transitoires) qui peuvent devenir des cibles de médicaments.
Merci pour les contributions !
Les poches cryptiques sont des cavités protéiques qui restent cachées dans les structures apo résolues et nécessitent généralement la présence d'un ligand co-cristallisé pour devenir visible. La découverte de nouvelles poches cryptiques est cruciale pour la découverte de médicaments basés sur la structure afin d'identifier de nouvelles façons de moduler l'activité des protéines et d'élargir ainsi l'espace médicamenteux. Nous présentons ici une nouvelle méthode et une application Web associée exploitant des simulations de dynamique moléculaire à solvant mixte (MD) utilisant le benzène comme sonde hydrophobe pour détecter les poches cryptiques. Notre flux de travail basé sur MD tout atome a été systématiquement testé sur 18 systèmes différents et 5 kinases supplémentaires et représente la plus grande étude de validation de ce type. CrypticScout identifie les points chauds de liaison de sonde de benzène sur une surface de protéine en cartographiant l'occupation de la sonde, le temps de séjour et l'occupation de benzène repesé par le temps de séjour.
GPCRmd dévoile la dynamique du 3D-GPCRome
Rodríguez-Espigares, I., Torrens-Fontanals, M., Tiemann, JKS et al.
Méthodes Nat (2020). 10.1038 / s41592-020-0884-y
Ici, vos calculs ont été utilisés pour construire une base de données de configurations pour la plupart des types et sous-types de protéines de classe GPCR. Les GPCR sont des récepteurs «à tout faire» - il existe de nombreux sous-types, chacun avec des activateurs et des inhibiteurs. La base de données GPCRmd fournit pour la première fois une couverture *systématique* de leur dynamique.
Les récepteurs couplés aux protéines G (GPCR) sont impliqués dans de nombreux processus physiologiques et sont les cibles les plus fréquentes des médicaments approuvés. L'explosion du nombre de nouvelles structures moléculaires tridimensionnelles (3D) des GPCR (3D-GPCRome) au cours de la dernière décennie a considérablement fait progresser la compréhension mécaniste et les opportunités de conception de médicaments pour cette famille de protéines. Les simulations de dynamique moléculaire (MD) sont devenues une technique largement établie pour explorer le paysage conformationnel des protéines au niveau atomique. Cependant, l'analyse et la visualisation des simulations MD nécessitent des ressources de stockage efficaces et des logiciels spécialisés. Nous présentons ici GPCRmd (http://gpcrmd.org/), une plate-forme en ligne qui intègre des capacités de visualisation Web ainsi qu'une boîte à outils d'analyse complète et conviviale qui permet aux scientifiques de différentes disciplines de visualiser, analyser et partager les données GPCR MD. GPCRmd est le fruit d'un effort mené par la communauté pour créer une base de données ouverte, interactive et standardisée de simulations GPCR MD.
La ressource en ligne pour les simulations GPCR
GPCRmd est une plate-forme en ligne avec des capacités de visualisation Web et une boîte à outils d'analyse complète qui permet aux scientifiques de n'importe quelle discipline de visualiser, d'inspecter et d'analyser la dynamique moléculaire du GPCR. Il s'agit d'une initiative communautaire dont le but final est d'accélérer la recherche fondamentale et au-delà de la découverte de thérapies plus efficaces et plus sûres.
traduit depuis le forum GPUGrid :
- https://www.gpugrid.net/forum_thread.php?id=5148&nowrap=true#55110
- https://www.gpugrid.net/forum_thread.php?id=5149&nowrap=true#55111
- Affichages : 867
WCG : OpenPandemics - COVID-19 : Mise à jour du projet 20/07/2020
- Détails
- Écrit par : franky82
- Catégorie parente: Actualités
Au cours des derniers mois, l'équipe a travaillé très dur pour lancer une nouvelle initiative en collaboration avec l'initiative IBM World Community Grid: le projet OpenPandemics: COVID-19.
L'objectif du projet est de cribler virtuellement de très grandes collections de composés chimiques pour identifier les inhibiteurs potentiels du virus SARS-CoV2 qui peuvent fournir un point de départ pour le développement de nouveaux outils thérapeutiques pour COVID-19.
Après avoir fait face à plusieurs défis, nous avons finalement lancé le projet et nous avons déjà recueilli de nombreux résultats qui sont actuellement analysés. Chaque composé que nous identifierons dans nos criblages virtuels sera testé expérimentalement dans des tests in vitro par nos collaborateurs (chez Scripps et ailleurs), et nous espérons évoluer pour devenir des antiviraux COVID-19.
Notre projet est l'un des nombreux efforts actifs qui tentent de trouver de nouveaux médicaments potentiels pour lutter contre cette pandémie. Ce qui est unique dans notre projet, c'est que nous utilisons de nouveaux protocoles d'amarrage moléculaire, ainsi que des approches plus conventionnelles, qui nous permettent de cibler des résidus et des régions spécifiques des protéines virales d'une manière très difficile pour le virus de s'échapper.
Jusqu'à présent, nous avons été très occupés à mettre en place l'infrastructure logicielle, à préparer les données d'entrée à traiter par les volontaires et à nous préparer à recevoir et à analyser l'énorme quantité de données qui va être retournée.
Merci à tous pour votre contribution !
Cet article est un résumé ( attendu depuis longtemps! ) Pour tous les volontaires, couvrant la stratégie de dépistage virtuel et les détails sur les cibles du SRAS-CoV-2 qui ont été considérées jusqu'à présent pour le projet OpenPandemics: COVID-19. Il s'agit d'un travail continu et d'autres structures seront ciblées et nous vous tiendrons au courant des nouvelles structures incluses et des premiers résultats à venir.
Bibliothèques Ligand (Diogo, Matthew)
Les calculs effectués par les volontaires du World Community Grid (WCG) simulent des millions de composés chimiques pour aider à identifier ceux qui peuvent interagir avec les protéines du SRAS-CoV-2. Bien qu'il existe plusieurs sources commerciales de composés, nous avons décidé de simuler non seulement des molécules disponibles à l'achat, mais également des molécules pouvant être fabriquées en modifiant celles existantes. En particulier, nous avons envisagé des réactions chimiques qui insèrent une ogive chimique suffisamment réactive pour réagir avec les protéines virales, mais pas trop pour devenir dangereusement toxique. Le but de l'ogive réactive est de former une liaison covalente avec les protéines virales, rendant l'événement de liaison irréversible. Nous n'avons considéré que de simples réactions chimiques pouvant être réalisées par nos collaborateurs en peu de temps. En ce moment, Les volontaires de WCG simulent une bibliothèque de 37 millions de composés contenant l'ogive d'acrylamide qui est spécifique aux résidus de cystéine. De nouveaux composés seront ajoutés à la bibliothèque dans les mois à venir.
Structures cibles (Jerome, Giulia, Batuu, Paolo, Martina, Christina)
Dans la phase initiale du projet, nous concentrons nos efforts sur 3 cibles protéiques du SRAS-CoV-2: les protéases de type papaïne (PLpro ou nsp3), la protéase principale (Mpro ou nsp5) et l'endoribonucléase (nsp15 ). Après l'analyse des poches médicamenteuses sur chaque structure, les résidus de cystéine les plus prometteurs, ainsi que les cystéines catalytiques, ont été sélectionnés comme sites covalents potentiels.
1. La première cible que nous considérons est la protéase de type papaïne (PLpro ou nsp3) , qui fait partie de la protéine multi-domaine nsp3. Il est responsable de la maturation des polyprotéines virales et impliqué dans la répression de la réponse immunitaire innée de l'hôte. Dans cette protéine, nous ciblons un résidu spécifique, la cystéine 111, situé dans le site actif et qui joue un rôle clé dans l'activité catalytique. À l'heure actuelle, nous envisageons deux formes différentes de la protéine, l'une de SARS-CoV2 et l'autre de SARS-CoV1 (ID de la banque de données de protéines: 6w9c et 4mm3 ). Pourquoi, demandez-vous? Eh bien, au moment où nous avons commencé ce projet, en mars, peu de structures de SARS-CoV2 étaient disponibles, et une seule (ID PDB: 6w9c) avec la caractéristique clé recherchée: un modèle du résidu cystéine 111 suffisamment accessible pour être ciblé par des liants covalents. Heureusement pour nous, le site actif ne diffère pas beaucoup entre les deux virus SARS-CoV1 et CoV2, ce qui nous permet également d'exploiter une autre structure (PDB id: 4mm3) avec la bonne conformation plus adaptée aux projections virtuelles. Et plus c'est certainement mieux! Depuis, de nombreuses autres structures de nsp3 du SRAS-CoV2 ont été résolues avec d'autres variations structurelles très intéressantes dans le site actif. Et bien sûr, ces conformations seront incorporées dans les prochaines projections !
Cela représente également un défi intéressant car nous pouvons tester une hypothèse clé: pouvons-nous identifier des inhibiteurs viraux à large spectre qui agissent contre plusieurs souches virales? Le savoir est essentiel pour estimer à quel point il sera difficile de lutter contre les futures pandémies.
Pour plus de détails sur PLpro, consultez le billet de blog de nos collaborateurs scientifiques du Coronavirus Structural Task Force en Allemagne, qui fournissent un excellent service à la communauté en améliorant la qualité des structures.
Tous les calculs en cours actuellement visent les différentes conformations de PLpro.
2. La principale protéase (MPro ou nsp5), qui est la cible principale de nombreuses études d'autres laboratoires, est responsable de la maturation de la polyprotéine virale au cours de l'infection. Actuellement, nous envisageons 5 structures pour prendre en compte différentes conformations de la protéine ( ID PDB : 6y84 , 5re9 , 5ren , 6lu7 et 6w63 ). Bien sûr, ils se ressemblent tous de loin, mais quand vous regardez de plus près, certaines petites variations structurelles peuvent faire une énorme différence !
Pour cette protéine, 3 cystéines ont été choisies comme sites de liaison covalente: la cystéine 145 située dans le site actif, la cystéine 156 et la cystéine 300 situées dans des sites de liaison alternatifs, qui n'ont pas encore été explorés. Pour la cystéine 145 principale, les 5 conformations sont utilisées, mais une seule pour la cystéine 156 et la cystéine 300 (ID PDB: 6y84 ). À la fin, nous avons décidé de consacrer plus de temps de calcul à la cystéine active pour laquelle nous savons avec certitude qu'elle peut réagir avec des liants covalents.
Ce sera le prochain objectif sur lequel nous concentrerons nos efforts.
3. L' endoribonucléase spécifique de l'uridylate à ARN nidoviral (NendoU ou nsp15) est une endoribonucléase conservée dans plusieurs familles de virus à ARN, y compris les coronavirus. Bien qu'initialement suspecté de participer directement à la réplication de l'ARN, ses rôles exacts dans le cas du SRAS-CoV et du SARS-CoV-2 sont encore débattus même si plus récemment, il a été suggéré d'interférer avec la réponse immunitaire de l'hôte contre l'ARN double brin intermédiaires, qui sont générés pendant le processus de réplication. Après quelques recherches sur la structure cristalline de NendoU (PDB id: 6vww ), les résidus cystéine 293 (situés dans le site actif) et cystéine 103 ont été choisis comme sites covalents potentiels pour les ogives acrylamide. Une fois les deux premiers objectifs atteints, nous aborderons nsp15.
Concernant la glycoprotéine de pointe externe, qui est la protéine responsable de la fusion et de l'entrée dans les cellules hôtes humaines, nous savons que beaucoup d'entre vous ont demandé pourquoi nous ne ciblons pas actuellement cette protéine. Le principal défi de cette protéine réside dans sa grande flexibilité intrinsèque. Nous savons que la protéine de pointe peut exister principalement dans deux états différents: ouvert ou fermé. Alors pourquoi ne prenons-nous pas simplement ces deux structures? Eh bien, les choses sont plus compliquées car en plus d'être très flexible, cette protéine est également recouverte d'un réseau de sucre complexe qui la protège du système immunitaire de l'hôte et rend difficile la cible directe avec de petites molécules. Nos collaborateurs travaillent à la mise en place de leurs dosages biologiques, nous sommes donc vraiment intéressés à leur fournir des molécules à tester.
Méthode d'amarrage: amarrage réactif (Giulia)
La principale innovation de notre approche réside dans les protocoles d'amarrage que nous utilisons. En plus des protocoles d'amarrage classiques, dans lesquels nous essayons de prédire quelles molécules peuvent se fixer de manière transitoire (c'est-à-dire réversible) à la surface des protéines, nous utilisons un nouveau protocole, appelé "amarrage réactif", pour trouver des liants irréversibles : des molécules qui peuvent se fixer de manière plus serrée et irréversible. L'un des avantages de cette classe de molécules est qu'une fois qu'elles s'accrochent à leur cible, elles la désactivent jusqu'à ce que la protéine soit dégradée, ce qui est clairement une excellente caractéristique à avoir dans un médicament ! et si elles sont bien conçues, elles peuvent être très sélectives. Par exemple, la pénicilline, probablement l'antibiotique le plus connu, fonctionne exactement de cette manière, en réagissant spécifiquement avec les protéines de la paroi des bactéries sans interagir avec les protéines humaines. Le "reactive docking" est un protocole que nous avons développé dans notre laboratoire qui nous permet de simuler la réaction entre le ligand et un résidu covalent spécifique de la protéine. Essentiellement, chaque fois que les atomes "réactifs" du ligand et du résidu se trouvent à une distance de liaison, nous supposons que la réaction est susceptible de se produire. D'un point de vue technique, cela représente un avantage important car nous espérons que cela réduira considérablement les taux de faux positifs (c'est-à-dire les molécules dont on a prédit à tort qu'elles seraient actives), puisque nous pouvons filtrer tous ceux qui n'ont pas réagi. À ce jour, c'est la seule méthode d'arrimage qui permet de réaliser de telles expériences de criblage virtuel sur de très grandes bibliothèques de composés.
Architecture de données (Andreas)
Avant que les premiers résultats ne commencent à arriver, nous nous sommes préparés à pouvoir recevoir tous les résultats, les stocker et les rendre disponibles pour le filtrage et l'analyse. Chacune de vos exécutions crée environ 300 Ko de données dans deux fichiers de résultats - l'un avec l'extension DLG et l'autre un fichier XML simple pour une indexation plus facile. L'extension de fichier DLG est le fichier de résultat principal de notre programme (AutoDock4.2) stockant les coordonnées et les énergies des ligands candidats ancrés ( D ocking L o G ).
Alors que 300 Ko par exécution en moyenne peuvent ne pas sembler beaucoup, lorsque vous le multipliez par le nombre d'exécutions que WCG envoie par paquet d'entrée (environ 10000 exécutions), il en ressortira en fait à environ 3 Go. Nous avons commencé à préparer plus de 10 000 colis et espérons aller bien au-delà à terme. Avec la compression (bon vieux Gzip!), Nous sommes en mesure d'abaisser un seul paquet à environ 400 Mo. Sur la base des premières estimations du nombre d'exécutions, nous nous retrouverions avec plusieurs dizaines de TB de données ainsi créées.
Afin de réduire l'utilisation du disque pour stocker une si grande quantité de données, nous avons conçu une méthode pour ramener un seul paquet à environ 85 Mo, soit environ 20% de sa taille compressée, en utilisant la description interne des solutions d'accueil utilisées dans notre logiciel. Typiquement, dans les dockings, il y a une cible fixe (le soi-disant récepteur, c'est-à-dire une protéine donnée du COVID-19) et une molécule flexible à ancrer (le soi-disant ligand, c'est-à-dire un médicament potentiel). Le ligand est déplacé, tourné et sa géométrie est déterminée par des rotations de liaison entre ses atomes. Nous appelons l'ensemble de paramètres qui décrit les propriétés susmentionnées «génome» (puisque nous utilisons un algorithme génétique pour exécuter nos recherches… c'est pour un autre poste…), et comme dans la vie réelle, un génome de ligand peut être utilisé pour le décrire complètement. En stockant uniquement les «informations génétiques» du ligand, nous avons pu réduire la taille des données à environ 20% de leur taille compressée à l'origine. Ces génomes «séchés» réduisent considérablement la quantité de données à transférer et à stocker dans notre base de données.
Alors qu'il vous faut jusqu'à 2,8 années CPU pour trouver le résultat optimal du génome pour un seul paquet, il ne nous faut qu'environ 30 minutes pour régénérer les coordonnées et les énergies d'origine (puisque nous connaissons déjà la solution). Nous disposons de deux serveurs dédiés pour recevoir et stocker les données, et effectuer les opérations de traitement.
Alors, qu'arrive-t-il aux données pendant le traitement ? Il y a deux choses fondamentales qui se produisent dès que nous recevons un fichier de résultats: premièrement, les génomes «séchés» dans les résultats sont «réhydratés», ce qui signifie que les coordonnées de toutes les poses pour chaque course sont calculées dans l'espace tridimensionnel; puis chaque pose est analysée individuellement.
Un script d'analyse recueille les informations sur le type d'interactions (par exemple, polaires / non-interactions, électrostatiques, etc.) et les résidus cibles avec lesquels chaque pose interagit (c'est-à-dire la cystéine 111). Il vérifie également si la molécule a réagi ou non (selon les paramètres d'amarrage réactif). Ces informations sont collectées de manière très efficace et stockées dans notre base de données. Il s'agit d'une étape essentielle dans la phase de traitement car elle nous permet d'effectuer des requêtes très complexes qui nous permettent à terme de rechercher les quelques centaines «d'aiguilles» prometteuses dans une botte de foin contenant des milliards de poses en quelques secondes. Les composés les plus prometteurs seront inspectés visuellement un par un et sélectionnés pour passer à la phase de test. Merci à tout votre soutien, au moment de la rédaction de la base de données en contient environ 3.
traduction de l'article du ForliLab : https://forlilab.org/opn-update-7-20/?linkId=94724376
- Affichages : 873
- WCG : Un composé synthétique peut être utile pour développer un traitement contre le virus Zika
- WCG : FightAIDS@Home - Les chercheurs de la phase 1 ont identifié de nouvelles cibles potentielles pour les antiviraux
- WCG : C'est ainsi qu'une communauté mondiale s'unit pour trouver des biomarqueurs du cancer
- WCG : Les chercheurs de Help Stop TB accueillent un nouveau membre dans leur équipe
- ForliLab et WCG : OpenPandemics - COVID-19
- WCG : Aidez à mettre fin à la COVID-19 et aux futures pandémies
Page 20 sur 35