Einstein@home : fin de la S5RI et début de la S5R2

Dans maintenant moins de 48 heures (voir le graphique), la S5RI va se terminer. Bernd Machenschalk, développeur du projet Einstein@Home, nous explique ce qui va se passer ensuite :

Nous sommes proche de la fin de la série intermédiaire S5RI et nous allons par conséquent commencer la S5R2 qui est attendue depuis longtemps. Les propriétés de la S5R2 changent extrêmement rapidement, ainsi lorsque vous aurez lu ces quelques lignes, le message sera dejà périmé. Mais je voudrais tout de même vous donner quelques indications de ce qui est maintenant plus ou moins fixé.

La « série scientifique #5 » issue des instruments du LIGO, ou S5 pour faire court, nous fournit non seulement les données les plus sensibles, mais également la plus grande quantité de données que nous avons jamais eues à traiter. C'est très bon pour la science, car la sensibilité de la recherche des signaux continus augmente avec le "temps d'observation", c'est à dire la longueur des données disponibles.

Cependant, avec notre outil actuel d'analyse, le temps de calcul nécessaire augmente exponentiellement à la puissance 6 par rapport à la quantité de données. Il est donc évident que nous avons besoin d'une application "plus intelligente" pour traiter une plus grande quantité de données, ainsi nous avons développé un nouveau programme que nous appelons "recherche hiérarchique" ("Hierarchical Search"). L'idée fondamentale est dans un premier temps de balayer l'ensemble des données avec une "grille" brute puis seulement de regarder plus précisement, dans une "étape suivie" ("follow-up stage"), les zones de l'espace qui ont été détectées comme intéressantes. Le code actuel n'est conçu que pour accomplir la première étape, nous n'avons pas encore décidé si cette "étape suivie" sera calculée sur Einstein@Home ou sur la grappe d'ordinateurs du LSC.

L'application que nous utiliserons pour cette série est tout nouvelle et n'a encore jamais été employée auparavant. L'algorithme utilisé par l'ancienne application fait toujours partie intégrante de la nouvelle, et a également dejà été employé auparavant, mais elles n'ont jamais été couplées, en particulier jamais dans un projet d'informatique répartie de cette ampleur. Nous nous attendons à ce que quelques problèmes en résultent.

Un des problèmes sur lequel nous travaillons toujours, ce sont les "transparents" ("overhead") , c'est à dire des calculs qui sont effectués pour des raisons techniques, mais ne contribuent pas réellement aux résultats, ils gaspillent la puissance de calcul.

Nous organisons donc une S5R2 courte, la série expérimentale limite la recherche à une partie de l'ensemble des données où les "transparents" sont controlés. Pendant cette courte série nous améliorerons divers aspects de l'application. Les résultats nous aideront également à régler les paramètres pour la prochaine série qui sera plus longue (probablement appelée S5R3).

Cependant la quantité de données à analyser accroît également la quantité de données à télécharger par vos machines. Pour économiser la bande passante pour vous ainsi que de notre côté, nous avons développé un nouveau procédé pour les fichiers. Ils sont divisés en petits dossiers d'environ 3Mo (qui sont quelque peu recombinés dans l'application). Quand il n'y a plus de travail disponible pour les fichiers que vous avez déjà sur votre machine, le programmateur essayera d'attribuer du travail à votre ordinateur en réduisant au minimum le nombre de dossiers que vous devez télécharger, ainsi vous devriez obtenir dans la plupart des cas seulement deux dossiers (~6Mo) à chaque nouveau téléchargement

Cependant, l'ensemble des dossiers (qui sera utilisé pour beaucoup des travaux que vous obtiendrez) pourra être composé jusqu'à 10 dossiers, ainsi le téléchargement initial pourrait être de plus que 40Mo (en incluant l'application et d'autres fichiers de données qui doivent être téléchargés seulement une fois par série). Ceci pourrait ne pas convenir pour les utilisateurs de modem et de connexion bas débit.

Nous épuisons actuellement les dernières unités S5RI, et comme d'habitude BOINC devra télécharger un nouveau fichier pour seulement quelques unités de calcul, donc les utilisateurs de modem : faites attention

Nous espérons distribuer aujourd'hui les premières 1000 unités S5R2. (les unités viennent d'être distribuées, et un problème vient dejà d'être découvert - valeur de l'espace disque dépassée)

Au début, l'application ne sera disponible que sur les principales plateformes (Windows-x86, Linux-x86, MacOS-PPC et MacOS-x86) ; d'autres plateformes suivront. J'espère obtenir l'application finale avant que les derniers résultats de la S5RI soient envoyés.

BM

 

Questions :

La S5R2 sera-t-elle plus courte que la série actuelle (S5R1) ?

Je ne suis pas certains de pouvoir répondre à cette question, mais de toute façon : il est difficile de le dire pour le moment. Actuellement nous pensons à une S5R2 de la même durée que la série finale S5RI (quelques mois), et la S5R3 sera probablement lancée pour une durée à peu près identique à la S5R1 (6-12 mois). Mais nous fixons encore quelques paramètres, et comme nous comptons optimiser l'application durant la série, il nous est difficile de prévoir quand est-ce que nous les achèveront. Les optimisations et les changement de paramètres auront un impact important sur le temps d'exécution.

Et ensuite...

Le shéma suivant résume le calendrier du projet Einstein pour les 3 prochaines années.

La S6 devrait commencer fin 2009, début 2010. En attendant, comme l'a souligné Bernd, il y aura la S5R2 puis une S5R3 qui devraient durer à elles deux environ une année. C'est ce qui correspond à la partie verte du graphique (période 2007-2008).

L'accords de mise en commun des données issues des interféromètres LIGO et VIRGO s'applique à partir du 18 Mai 2007.

A partir de cette date, les données des interferomètre LIGO, GEO et VIRGO seront analysées conjointement. Il y a donc de grandes chances de calculer à l'avenir des données issues de VIRGO.