Le texte suivant est une traduction d'un article du journal The Economist qui se réfère à la publication de
David Stainforth (membre de l'équipe de recherche de Climateprediction.net)
parue dans la dernière édition (numéro 1857) d'un des journaux de la
Royal Society
:
Philosophical Transactions. Ce numéro est entièrement consacré aux sciences de la modélisation climatique.
L'article vient conforter la méthode de travail des scientifiques du projet Climateprediction.net, comme le futur est incertain et comme les valeurs de départ choisies par tel ou tel groupe de scientifique sont souvent discutables (venir conforter une idée préconçue ou faire de la publicité pour son propre modèle, ses propres paramètres), il faut calculer des centaines de milliers de modèles pour produire un large éventail de résultats possibles. Ces résultats étant supposés se regrouper autour de la version la plus probable du futur.
La modélisation mathématique du climat de la planète était déjà un exercice difficile. Voila qu'une nouvelle difficulté est en train d'émerger.
Illustration de
Dettmer Otto |
|
Le mot "SCIENCE" est un terme récent dans la
langue anglaise. Lorsque la Royal Society, la plus ancienne
académie au monde consacrée à la
discipline, fut fondée à Londres en 1660, la
matière était décrite sous le nom de natural
philosophy (philosophie naturelle). Au XIXème
siècle, la nature et la philosophie ont
été séparés alors que les
philosophes naturels continuaient à croître en
nombre, en pouvoir et en influence.
Quoi qu'il en soit, la raison de s'attarder sur cette pointe
de culture est donnée par le nom d'un des journaux de la
Royal Society, Philosophical Transactions. Et ça tombe bien,
la dernière édition de cette publication, qui est
consacrée aux sciences de la modélisation
climatique, est en partie une discussion sur la
compréhension et le flou autour de la thèse d'un
philosophe anglais du XVIIIème
siècle : Thomas Bayes.
Bayes fut l'un des deux pères du
développement précoce de la théorie
probabiliste et des statistiques. Le second fut le français
Blaise Pascal. Mais, tandis que les idées de Pascal sont
simples et très largement comprises, il a toujours
été plus difficile de saisir la pensée
de Bayes.
La manière de Pascal de voir le monde
était celle d'un joueur : chaque lancer de dés
est indépendant du précédent. Bayes
tient compte de l'accumulation de l'expérience, en
l'incorporant dans un modèle statistique sous forme
d'hypothèses qui peuvent varier selon les circonstances. Par
exemple, une bonne hypothèse au sujet du temps qu'il va
faire demain est que la météo sera identique
à celle d'aujourd'hui. Les hypothèses au sujet du
temps qu'il va faire après-demain seront
modifiées en fonction de ce qui se produira
réellement demain.
Les gens tendent naturellement à être
Bayésien, dans la mesure où ils posent souvent de
fausses relations. Et ce risque de fausses relations explique pourquoi
les scientifiques aiment la manière de Pascal de voir le
monde. Elle semble être objective. Mais quand des
modèles sont construits, il est impossible ou presque de ne
pas y incorporer des hypothèses de type Bayésien.
Par défaut de le reconnaître, les
créateurs de modèles risquent de faire de
sérieuses erreurs.
Prendre en compte le néant
Dans un sens, il est évident que les
hypothèses affecteront les résultats, c'est
d'ailleurs une autre raison pour laquelle Bayes n'est pas correctement
reconnu. Malgré cela, cette évidence cache des
subtilités plus profondément enfouies. Dans l'une
des publications parues dans Philosophical Transactions,
David Stainforth de l'université d'Oxford met en
lumière un exemple pertinent.
Les modèles climatiques admettent bon nombre de
paramètres représentés par des
nombres. Par exemple, à quelle fréquence les
cristaux de neige tombent des nuages, ou pendant combien de temps
restent-ils dans ces nuages. En fait, ce sont deux manières
différentes de mesurer la même chose, ainsi si un
modèle utilise l'un ou l'autre des deux
paramètres, cela ne devrait faire aucune
différence dans les prévisions. Et, pour un
même run (série d'un
même modèle réalisé
à un moment donné), ça ne donnera
aucune différence. Mais les modèles ne sont pas
issus d'un même run. Comme le futur est
incertain, ils sont calculés des milliers de fois, avec des
paramètres ayant des valeurs différentes, pour
produire un éventail de résultats possibles. Les
résultats sont supposés se regrouper autour de la
version la plus probable du futur.
La gamme précise de valeurs choisies pour un
paramètre donné est un exemple
d'hypothèse Bayésienne, puisque ces valeurs sont
dérivées d'une expérience
réelle sur la façon dont le climat se comporte,
et peuvent donc être modifiées à la
lumière de l'expérience. Mais la façon
de sélectionner les différentes valeurs dans le
simple but de faire de la publicité à son
modèle peut poser des problèmes.
On pourrait, par exemple, assumer que ces valeurs sont
espacés de façon régulière,
penser 1, 2, 3, 4. Mais dans l'exemple de la conservation de la neige
dans les nuages, un espacement régulier des taux-de-chute et
des
taux-de-séjour-à-l'intérieur-des-nuages
donneront différentes distributions de résultats.
Ceci parce que le deuxième paramètre est le
réciproque parfait du premier. Pour confronter ces 2
valeurs, vous aurez besoin, dans le deuxième cas, de compter
d'une façon non régulière : 1,
½, ⅓, ¼ . Si vous utilisiez des valeurs
régulièrement espacées, les deux
résultats des modèles se regrouperont de deux
différentes façons.
Les modèles climatiques ont des centaines de
paramètres qui pourraient être reliés
d'une façon ou d'une autre. Pour être
sûr que vous avez des résultats valides
plutôt que le simple produit des modèles, vous
devez tenir compte de tout ce qui peut se produire.
Ce cauchemar organisationnel commence seulement a
être pris en compte, et les conséquences pratiques
ont encore à être établies. Mais en
raison de leur formation philosophique dans la rigueur de la
méthode de Pascal, les rouages Bayésiens ne
semblent pas facile à comprendre pour les scientifiques.
Comme les anciens le disaient, déchêt à
l'entrée, déchêt à la
sortie. La difficulté intervient lorsque vous ne savez pas
à quoi ressemblent ces déchets.
Dernière mise à jour : 28-08-2007 00:26