Nouvelles du futur : où en sommes-nous avec les prévisions?

English version available here.

Cet article examine plusieurs méthodes qui ont montré une capacité certaine de prévoir le futur. La première comprend des équations simples (lois de puissance, power laws) dont les coefficients empiriques ont pu être déterminés sur plusieurs ordres de grandeur dans des conditions très variées. Les modèles sous-jaçants sont à la limite de plusieurs disciplines, de l'écologie à la sociologie. Vient ensuite le suivi systématique des innombrables sources d'information numériques sur l'actualité dont nous dispososons dorénavant, approche connue sous le nom de culturomique (note 3). Finalement, la vieille méthode des seuils critiques chère aux anciens polémologues (Bouthoul, 1962) et dont le dépassement conduit à des changements qualitatifs a été remis à l'honneur dans le cas des émeutes liées au prix des denrées alimentaires.

Peut-on prévoir le futur à partir des connaissances sur la psychologie humaine et les phénomènes sociaux, en appliquant une analyse statistique à l'image de la thermodynamique (Voir note 1)? Il semble bien que la réponse soit oui, et de nombre de publications scientifiques récentes vont dans ce sens.

1. Equations empiriques

Commençons par quelques articles publiés il y a deux ans environ par Bohorquez et al. (2009) et par Johnson et al. (2011). Dans le cas du premier article,

Fréquence cumulée d'actes de guerre en Afghanistan en fonction du nombre de blessés (a) nombre de tels actes depuis le 5ooème jour des opérations dans le pays (b). Figure composée à partir de deux figures de Bohorquez, 2009. Voir note 2.

les auteurs sont des ingénieurs, des physiciens et un économiste. A l'époque de la publication, Bohorquez travaillait au Department of Industrial Engineering and CEIBA Complex Systems Research Center à l'Universidad de Los Andes à Bogota, en Colombie. Les scientifiques qui cosignent l'article de Johnson comprennent un plus grand nombre de disciplines, de la biologie à la sociologie en passant par l'informatique et la physique. Johnson lui-même est un physicien de l'université de Miami. Notons par ailleurs que ces deux groupes travailent en collaboration.

Que disent ces articles? D'abord qu'il existe un loi de puissance (power law) très simple qui relie l'intervalle entre deux attaques terrroristes (ou actions belliqueuses). Cet intervalle a tendance à raccourcir en même temps que les terroristes apprennent leur métier. Si la loi est connue, la date de la prochaine attaque peut être estimée (avec une certaine erreur, bien évidemment). Il existe aussi un rapport simple entre l'importance des attaques et leur fréquence: la fréquence diminue avec la "taille" des attaques à la puissance 2.5 (Gilbert, 2009).

Le mérite de ces travaux est qu'ils relient de manière quantitative certains comportements humains violents ou non (au-delà du terrorisme, donc), l'écologie et certains modèles économiques (ce n'est pas par hasard que nous avons l'éco-logie et l'éco-nomie!). Ils ne manquent pas de rappeler d'autres études (Bettencourt et al, 2007; Bettencourt et  West, 2011) qui utilisent des lois de puissance pour décrire les relations entre la taille des villes (mesurée par leur nombre d'habitants) et une collection disparate d'indicateurs qui vont du salaire moyen au nombre d'inventeurs en passant par la consommation  d'électtricité des ménages et la densité des stations d'essence. Ces travaux permettent eux aussi de "prédire" la façon dont un certain nombre de variables vont se comporter dans le futur, disons en 2050. En effet, beaucoup d'indicateurs sont liés à la population comme variable indépendante, laquelle population est très prévisible puisque la majorité des êtres humains qui peupleront la terre en 2050 sont déjà nés. Par ailleurs, les projections de population faites au cours de l'immédiat après-guerre (je parle de 1940-45) se sont avérées étonnamment exactes (voir par exemple Chi, 2009).

Figure extraite de Lagi et al., 2011: historique des émeutes/révolutions depuis 2004 en fonction d'un indice de prix des denrées alimentaires.

2. Culturomique

Récemment, d'autres auteurs, dont Leetaru (2011), ont abordé les prévisions d'une manière radicalement différente, basée sur le fait que nous disposons maintenant d'énormes bases de données numériques relatives à la presse écrite et parlée et aux agences de presse, sans parler des sites web des journaux et magazines nationaux et internationaux. Ces bases de données couvrent au moins les trente dernières années. Les techniques d'exploration des données (data mining) permettent de trouver certains termes, leur fréquence, leur association avec d'autres termes, ainsi que leur ton et leur géolocation. Le ton (tone en anglais, mais mood serait plus approprié) et la géolocation constituent la principale innvation apportée par Leetaru. Le ton est donné par des termes "postifs" ou "négatifs" comme "terrible", "amélioration" ou "heureux". La géolocation consiste simplement à situer géographiquement tous ces termes. Cette approche, que Leetaru appelle "culturomique" (note 3) lui a permis de faire des prévisions à court terme relatives aux révolutions en Egypte, Tunisie et Lybie, de voir se préparer le conflit en Serbie et prédire la stabilité de l'Arabie Saoudite jusqu'en 2012. Appliquée à la localisation de Ossama Bib Laden, la méthode identifie une région qui comprend Abbotabad où le raid étatsunien a finalement eu raison de lui.

3. Dépassement de seuils critiques

Je terminerai en signalant une étude très remarquée de Lagi et al. (2011) dont une description très lisible est donnée par Johnson, 2011 (Il s'agit d'un autre Johnson que l'auteur cité plus haut.) Ces auteurs ont observé une association historique entre certaines émeutes et la cherté des denrées alimentaires. Le seuil se situe vers 220 $/tonne en prix courants et vers 190$/tonne en prix constants de 2004. Il a été dépassé en 2008 et en concordance avec le Printemps Arabe. Selon les auteurs, si la tendance des prix courante se maintient, les prochaines révolutions sont à attendre entre juillet 2012 et août 2013.

4. Conclusion

Dans l'ensemble, ces méthodes sont intéressantes, et l'engouement suscité par les articles de Leetari, Lagi et ceux issus du cercle de Geoffrey West (p.ex. Bettencourt et al.) témoignent de l'intérêt des milieux scientifiques comme de celui de la prese généraliste pour les prévisions. Il me semble,  cependant,  que le succès des méthodes soit dû à l'abondance des données disponibles plus qu'à la nouveauté des approches. D'une certaines façon, ces méthodes témoignent toutes de l'importance et de l'efficacité de l'internet. La note de Leetari, par exemple, n'a pas souffert de sa publication sur un site jusqu'alors confidentiel. Le village global existe bel et bien!

Notes

Note 1 : Cette note est un clin d'oeil. La phrase est extraite avec quelques modifications mineures de Wikipedia: La psychohistoire est une science imaginée par l'auteur de science-fiction Nat Schachner et développée plus largement par Isaac Asimov (1920-1992) dont le but est de prévoir l'Histoire à partir des connaissances sur la psychologie humaine et les phénomènes sociaux en appliquant une analyse statistique à l'image de la thermodynamique.

Note 2 : La partie supérieure de la figure (a) indique que 100% des actes de guerre font au moins une victime, alors que 1/1000 fait 100 victimes. Partie inférieure (b): 8 événements par jour ne se produisent pratiquement jamais, alors quer 30% des jours sont caractérisés par deux événements.

Note 3 : culturomics en anglais. Comme thermodynamics devient "la thermodynamique" et cyndinics "la cyndinique" j'ai osé le terme de "culturomique"

References

Bettencourt, L.M.A., J.Lobo, D.Helbing, C.Kühnert & G.B. West. 2007. Growth, innovation, scaling, and the pace of life in cities. PNAS, 104(17):7301–7306.

Bettencourt, L.M.A & G.B. West. 2011. Bigger Cities do more with less: new science reveals why cities become more productive and efficient as they grow. 305(3):51-53.

Bohorquez, J.C., S.Gourley, A.R.Dixon, M.Spagat & N.F.Johnson. 2009. Common ecology quantifies human insurgency. Nature 462:911-914.

Bouthoul, G. 1962. Le Phénomène-Guerre. Petite bibliothèque Payot, Paris. 283 pp.

Chi, G. 2009. Can knowledge improve population forecasts at subcounty levels? Demography,46:405–427. Disponible sur le net. Voir aussi http://www.esri.com/library/whitepapers/pdfs/evaluating-population.pdf et http://www.ageing.ox.ac.uk/files/workingpaper_507.pdf

Gilbert, N. 2009. Modellers claim wars are predictable.Insurgent attacks follow a universal pattern of timing and casualties. Nature 462:836. L'article de Gilbert est une présentation du travail de Bohorquez et al., 2009.

Johnson, E.M. 2011. Freedom to Riot: On the Evolution of Collective Violence.

Johnson, N.F., S.Carran, J.Botner, K.Fontaine, N.Laxague, P.Nuetzel, J.Turnley & B.Tivnan. 2011. Patterns of Escalations in Insurgent and Terrorist Activity. Science 333(81):81-84. Voir aussi NPR staff, 2011. Math Can Predict Insurgent Attacks.

Lagi, M., K.Z.Bertrand & Y.Bar-Yam. 2011. The Food Crises and Political Instability in North Africa and the Middle East. http://arxiv.org/abs/1108.2455v1. L'article est téĺéchargeable.

K.H.Leetaru. 2011. Culturomics: forecasting large-scale human behaviour using glocal news mwdia tone in time and space. First Monday,  16(9). This is an internet publication. Voir ce site. Voir aussi http://www.kurzweilai.net/culturomics-2-0-forecasting-large-scale-human-behavior-using-global-news-media-tone-in-time-and-space qui comprend des animations intéressantes.

 

2 thoughts on “Nouvelles du futur : où en sommes-nous avec les prévisions?

  1. C'est super interessant. J'ai deux remarques/ questions assez differentes.

    En lisant les articles de West et coll. je m'etais deja demande si on ne pouvait pas appliquer une analyse dimensionnelle a ce type de probleme. Par exemple, pour l'impact de la hausse des prix sur les emeutes, un indice (adimensionnel) serait la fraction des 2500 cal/jour que le revenu moyen permet d'acheter, au prix du marché local. Il se pourrait que toutes les emeutes (meme a travers l'histoire) se produisent au meme seuil. Quid de la revolution francaise?

    Le deuxieme point est la distribution statistique des attentats et guerres à-la-Pareto. En quoi est-ce vraiment un outil de prevision? Se servir de cette loi pour faire des previsions, est-ce que ce n'est pas la meme chose que de se dire que le rouge doit sortir puisque le noir est deja sorti 5 fois?

    • Pour la première question: voir http://blogs.scientificamerican.com/primate-diaries/2011/09/06/freedom-to-riot/ (la référence Johnson, 2011). Tu y trouveras une figure construite à partir de données prises dans Archer (2000; Social unrest and popular protest in England, 1780-1840, Cambrige University Press) qui montre que la concomitance des prix élevés et des émeutes ne date pas de 2008. Pour le cout local des 2500 calories, on pourrait essayer, mais les pays où il y a eu des problèmes sont de gros importateurs, où les prix locaux doivent être assez près des cours internationaux. Par ailleurs, il n'y a pas une bonne relation entre la consommation effective de céréales (consommation locale annuelle divisée par la population) et les 2500 calories. Mais effectivement, to idée permettrait de s'abstraire des cours du marché. Peut-être devrait-on aussi voir la capacité d'achat de céréales en fonction du revenu moyen! De toute façon, quand les disponibilités sont plus ou moins normales, on peut ergoter. Quand ça se corse, les mécanismes simples prennent le dessus!

      Deuxième point: l'interprétation de Johnson et al. n'est pas stochastique. Ils voient leur modèle comme une illustration de ce qu'on appelle la red queen hypothesis selon laquelle l'évolution se produit (doit se produire) pour maintenir la capacité d'adaptation. Evidemment, il y a aussi des gens qui disent que l'évolution se produit par sauts, et personnellement, j'aime assez cette idée.