Traduction de cet article.

13 juillet 2015

Peut-être allons-nous commencer par ce qu'est Cosmology@Home

Cosmology@Home (C@H pour faire court) est un projet bénévole de calcul distribué qui permet aux gens du monde entier à faire don de leur temps processeur non utilisé (par exemple lorsque l'économiseur d'écran est activé) pour aider les cosmologistes à exécuter les calculs dont ils ont besoin pour répondre à certaines des plus grandes questions au sujet de notre univers.

Beaucoup d'entre qui lisez ceci sont peut-être déjà des bénévoles, dans ce cas, bonjour et merci!
Si vous ne l'êtes pas, mais que vous l'aimiez bien l'être, voici comment.

Je suis actuellement un des principaux développeurs de C@H. Dans le processus de planification des mises à jour, nous avions besoin d'avoir un aperçu détaillé de quelques statistiques sur nos utilisateurs. Puis nous avons pensé, cette information est cool et d'autres que nous pourraient être très intéressés ! Le voici donc :) Il ya aussi un bloc note de scripts Python si vous êtes curieux de voir comment ces graphiques ont été faits ou si vous aimeriez faire quelque chose de similaire pour votre propre projet@Home.

C@H est là depuis 2007 et au fil des années environ 50.000 ordinateurs uniques ont exécuté un calcul pour nous. Le nombre d'ordinateurs actifs, qui est un ordinateur ayant retourné un résultat dans le dernier mois, se situe actuellement autour de 5700. Les données dans la suite de ce post vont être seulement à propos de ces ordinateurs.

Basé sur les adresses IP, voici où ils sont situés:

C@H est actuellement utilisé pour créer des "groupes de données de formation" pour le code PICO. Ces groupes de données de formation sont constitués d'échantillons provenant de paramètres spatiaux de modèles cosmologiques possibles (par exemple un univers avec 30% de matière et 70% d'énergie sombre, ou un avec 31% de matière et 69% d'énergie sombre, etc. en réalité il n'y a pas moins de 10 paramètres que nous faisons varier). Chaque échantillon est envoyé à un autre ordinateur qui calcule ce à quoi un tel univers pourrait ressembler, et est récompensé par un certain nombre de «crédits» pour chaque calcul. Nous utilisons ces données pour entrainer PICO et pour voir quels modèles s'ajustent le mieux aux données cosmologiques disponibles (une description plus détaillée sera l'objet d'un prochain post).

Nous voulions nous assurer que notre mise à jour prévue sera compatible avec les systèmes d'exploitation de presque tout le monde, et sur cette base, il devra:

Nous ne supportons actuellement pas les Macs, mais en fait, la mise à jour va en ajouter le support!

[NDLR WHAT A GREAT FUCKING GOOD NEWS !]

Le "nombre de crédits" dans le graphique ci-dessus représente le nombre de crédits reçus par les ordinateurs fonctionnant sous ce système d'exploitation (arbitrairement réduite à apparaître sur les mêmes axes). L'interprétation est que, par exemple les hôtes exécutant Windows Server 2008 R2 sont très efficaces, alors que les ordinateurs Windows 8.1 le sont moins [NDLR et Linux n’est pas mal du tout !]. Un facteur important dans la performance est le nombre de processeurs qu'a un ordinateur donné. Voici ce à quoi notre distribution sur tous les ordinateurs ressemble:

De nombreux utilisateurs utilisant des systèmes multi-core sont super, car notre mise à jour permettra une utilisation plus efficace de ses systèmes. (Aussi, si vous regardez de près, non, Intel n'a pas sorti de nouveaux processeurs 3-core et 7-core, ce sont les utilisateurs qui limitent le nombre de cœurs qu'ils laissent calculer sur C@H).

Nous cherchons également à faire des mises à jour ciblant des ordinateurs de 64 bits, qui représentent une large et croissante majorité de la puissance de calcul totale (basé sur les crédits reçus):

Exécuter des tâches signifie télécharger des fichiers d'entrée et de téléverser les résultats, et pour nos besoins actuels, les connexions Internet de C@H sont largement suffisantes:

Enfin, une statistique importante est le délai d'exécution. Autrement dit, combien de temps s'écoule entre le moment où un ordinateur reçoit une tâche à traiter et celui où le résultat est renvoyé. Voici la répartition des temps d'exécution moyens,

Environ, la moitié des ordinateurs retournent un résultat dans les trois premiers jours. Les temps d'attente pour soumettre de gros travaux similaires sur certains clusters de calcul sont comparables à cela, ce qui est vraiment bon pour un projet de bénévolat!

Il y a beaucoup d'autres statistiques que l'on pourrait regarder, pour nous c'était tout ce que nous devions savoir sur les ordinateurs de C@H qui semblent prêts pour les améliorations prévues. Nous espérons que vous les avez trouvés intéressantes aussi!