Membres à l'honneur: titidestroy () | Jejj () | skwthegreat () | [AF>Belgique]Mamouth () | [AF>libristes] overclockman () | fzs600 () | olivier () | LeChat51X () | zelandonii () | modesti () | Lucas Scartazzini (40 000) | ticai (5 000 000) | John (6 000 000) | sauvagemaxim (300 000) | picca.rmh (200 000) |

Pari sur le lendemain

Le texte suivant est une traduction d'un article du journal The Economist qui se réfère à la publication de David Stainforth (membre de l'équipe de recherche de Climateprediction.net) parue dans la dernière édition (numéro 1857) d'un des journaux de la Royal Society : Philosophical Transactions. Ce numéro est entièrement consacré aux sciences de la modélisation climatique.

L'article vient conforter la méthode de travail des scientifiques du projet Climateprediction.net, comme le futur est incertain et comme les valeurs de départ choisies par tel ou tel groupe de scientifique sont souvent discutables (venir conforter une idée préconçue ou faire de la publicité pour son propre modèle, ses propres paramètres), il faut calculer des centaines de milliers de modèles pour produire un large éventail de résultats possibles. Ces résultats étant supposés se regrouper autour de la version la plus probable du futur.

 

La modélisation mathématique du climat de la planète était déjà un exercice difficile. Voila qu'une nouvelle difficulté est en train d'émerger.

Illustration de Dettmer Otto

 

Le mot "SCIENCE" est un terme récent dans la langue anglaise. Lorsque la Royal Society, la plus ancienne académie au monde consacrée à la discipline, fut fondée à Londres en 1660, la matière était décrite sous le nom de natural philosophy (philosophie naturelle). Au XIXème siècle, la nature et la philosophie ont été séparés alors que les philosophes naturels continuaient à croître en nombre, en pouvoir et en influence.

Quoi qu'il en soit, la raison de s'attarder sur cette pointe de culture est donnée par le nom d'un des journaux de la Royal Society, Philosophical Transactions. Et ça tombe bien, la dernière édition de cette publication, qui est consacrée aux sciences de la modélisation climatique, est en partie une discussion sur la compréhension et le flou autour de la thèse d'un philosophe anglais du XVIIIème siècle : Thomas Bayes.

Bayes fut l'un des deux pères du développement précoce de la théorie probabiliste et des statistiques. Le second fut le français Blaise Pascal. Mais, tandis que les idées de Pascal sont simples et très largement comprises, il a toujours été plus difficile de saisir la pensée de Bayes.

La manière de Pascal de voir le monde était celle d'un joueur : chaque lancer de dés est indépendant du précédent. Bayes tient compte de l'accumulation de l'expérience, en l'incorporant dans un modèle statistique sous forme d'hypothèses qui peuvent varier selon les circonstances. Par exemple, une bonne hypothèse au sujet du temps qu'il va faire demain est que la météo sera identique à celle d'aujourd'hui. Les hypothèses au sujet du temps qu'il va faire après-demain seront modifiées en fonction de ce qui se produira réellement demain.

Les gens tendent naturellement à être Bayésien, dans la mesure où ils posent souvent de fausses relations. Et ce risque de fausses relations explique pourquoi les scientifiques aiment la manière de Pascal de voir le monde. Elle semble être objective. Mais quand des modèles sont construits, il est impossible ou presque de ne pas y incorporer des hypothèses de type Bayésien. Par défaut de le reconnaître, les créateurs de modèles risquent de faire de sérieuses erreurs.

Prendre en compte le néant

Dans un sens, il est évident que les hypothèses affecteront les résultats, c'est d'ailleurs une autre raison pour laquelle Bayes n'est pas correctement reconnu. Malgré cela, cette évidence cache des subtilités plus profondément enfouies. Dans l'une des publications parues dans Philosophical Transactions, David Stainforth de l'université d'Oxford met en lumière un exemple pertinent.

Les modèles climatiques admettent bon nombre de paramètres représentés par des nombres. Par exemple, à quelle fréquence les cristaux de neige tombent des nuages, ou pendant combien de temps restent-ils dans ces nuages. En fait, ce sont deux manières différentes de mesurer la même chose, ainsi si un modèle utilise l'un ou l'autre des deux paramètres, cela ne devrait faire aucune différence dans les prévisions. Et, pour un même run (série d'un même modèle réalisé à un moment donné), ça ne donnera aucune différence. Mais les modèles ne sont pas issus d'un même run. Comme le futur est incertain, ils sont calculés des milliers de fois, avec des paramètres ayant des valeurs différentes, pour produire un éventail de résultats possibles. Les résultats sont supposés se regrouper autour de la version la plus probable du futur.

La gamme précise de valeurs choisies pour un paramètre donné est un exemple d'hypothèse Bayésienne, puisque ces valeurs sont dérivées d'une expérience réelle sur la façon dont le climat se comporte, et peuvent donc être modifiées à la lumière de l'expérience. Mais la façon de sélectionner les différentes valeurs dans le simple but de faire de la publicité à son modèle peut poser des problèmes.

On pourrait, par exemple, assumer que ces valeurs sont espacés de façon régulière, penser 1, 2, 3, 4. Mais dans l'exemple de la conservation de la neige dans les nuages, un espacement régulier des taux-de-chute et des taux-de-séjour-à-l'intérieur-des-nuages donneront différentes distributions de résultats. Ceci parce que le deuxième paramètre est le réciproque parfait du premier. Pour confronter ces 2 valeurs, vous aurez besoin, dans le deuxième cas, de compter d'une façon non régulière : 1, ½, ⅓, ¼ . Si vous utilisiez des valeurs régulièrement espacées, les deux résultats des modèles se regrouperont de deux différentes façons.

Les modèles climatiques ont des centaines de paramètres qui pourraient être reliés d'une façon ou d'une autre. Pour être sûr que vous avez des résultats valides plutôt que le simple produit des modèles, vous devez tenir compte de tout ce qui peut se produire.

Ce cauchemar organisationnel commence seulement a être pris en compte, et les conséquences pratiques ont encore à être établies. Mais en raison de leur formation philosophique dans la rigueur de la méthode de Pascal, les rouages Bayésiens ne semblent pas facile à comprendre pour les scientifiques. Comme les anciens le disaient, déchêt à l'entrée, déchêt à la sortie. La difficulté intervient lorsque vous ne savez pas à quoi ressemblent ces déchets.