English version available here.
Cet article examine plusieurs méthodes qui ont montré une capacité certaine de prévoir le futur. La première comprend des équations simples (lois de puissance, power laws) dont les coefficients empiriques ont pu être déterminés sur plusieurs ordres de grandeur dans des conditions très variées. Les modèles sous-jaçants sont à la limite de plusieurs disciplines, de l’écologie à la sociologie. Vient ensuite le suivi systématique des innombrables sources d’information numériques sur l’actualité dont nous dispososons dorénavant, approche connue sous le nom de culturomique (note 3). Finalement, la vieille méthode des seuils critiques chère aux anciens polémologues (Bouthoul, 1962) et dont le dépassement conduit à des changements qualitatifs a été remis à l’honneur dans le cas des émeutes liées au prix des denrées alimentaires.
Peut-on prévoir le futur à partir des connaissances sur la psychologie humaine et les phénomènes sociaux, en appliquant une analyse statistique à l’image de la thermodynamique (Voir note 1)? Il semble bien que la réponse soit oui, et de nombre de publications scientifiques récentes vont dans ce sens.
1. Equations empiriques
Commençons par quelques articles publiés il y a deux ans environ par Bohorquez et al. (2009) et par Johnson et al. (2011). Dans le cas du premier article,

Fréquence cumulée d’actes de guerre en Afghanistan en fonction du nombre de blessés (a) nombre de tels actes depuis le 5ooème jour des opérations dans le pays (b). Figure composée à partir de deux figures de Bohorquez, 2009. Voir note 2.
les auteurs sont des ingénieurs, des physiciens et un économiste. A l’époque de la publication, Bohorquez travaillait au Department of Industrial Engineering and CEIBA Complex Systems Research Center à l’Universidad de Los Andes à Bogota, en Colombie. Les scientifiques qui cosignent l’article de Johnson comprennent un plus grand nombre de disciplines, de la biologie à la sociologie en passant par l’informatique et la physique. Johnson lui-même est un physicien de l’université de Miami. Notons par ailleurs que ces deux groupes travailent en collaboration.
Que disent ces articles? D’abord qu’il existe un loi de puissance (power law) très simple qui relie l’intervalle entre deux attaques terrroristes (ou actions belliqueuses). Cet intervalle a tendance à raccourcir en même temps que les terroristes apprennent leur métier. Si la loi est connue, la date de la prochaine attaque peut être estimée (avec une certaine erreur, bien évidemment). Il existe aussi un rapport simple entre l’importance des attaques et leur fréquence: la fréquence diminue avec la « taille » des attaques à la puissance 2.5 (Gilbert, 2009).
Le mérite de ces travaux est qu’ils relient de manière quantitative certains comportements humains violents ou non (au-delà du terrorisme, donc), l’écologie et certains modèles économiques (ce n’est pas par hasard que nous avons l’éco-logie et l’éco-nomie!). Ils ne manquent pas de rappeler d’autres études (Bettencourt et al, 2007; Bettencourt et West, 2011) qui utilisent des lois de puissance pour décrire les relations entre la taille des villes (mesurée par leur nombre d’habitants) et une collection disparate d’indicateurs qui vont du salaire moyen au nombre d’inventeurs en passant par la consommation d’électtricité des ménages et la densité des stations d’essence. Ces travaux permettent eux aussi de « prédire » la façon dont un certain nombre de variables vont se comporter dans le futur, disons en 2050. En effet, beaucoup d’indicateurs sont liés à la population comme variable indépendante, laquelle population est très prévisible puisque la majorité des êtres humains qui peupleront la terre en 2050 sont déjà nés. Par ailleurs, les projections de population faites au cours de l’immédiat après-guerre (je parle de 1940–45) se sont avérées étonnamment exactes (voir par exemple Chi, 2009).

Figure extraite de Lagi et al., 2011: historique des émeutes/révolutions depuis 2004 en fonction d’un indice de prix des denrées alimentaires.
2. Culturomique
Récemment, d’autres auteurs, dont Leetaru (2011), ont abordé les prévisions d’une manière radicalement différente, basée sur le fait que nous disposons maintenant d’énormes bases de données numériques relatives à la presse écrite et parlée et aux agences de presse, sans parler des sites web des journaux et magazines nationaux et internationaux. Ces bases de données couvrent au moins les trente dernières années. Les techniques d’exploration des données (data mining) permettent de trouver certains termes, leur fréquence, leur association avec d’autres termes, ainsi que leur ton et leur géolocation. Le ton (tone en anglais, mais mood serait plus approprié) et la géolocation constituent la principale innvation apportée par Leetaru. Le ton est donné par des termes « postifs » ou « négatifs » comme « terrible », « amélioration » ou « heureux ». La géolocation consiste simplement à situer géographiquement tous ces termes. Cette approche, que Leetaru appelle « culturomique » (note 3) lui a permis de faire des prévisions à court terme relatives aux révolutions en Egypte, Tunisie et Lybie, de voir se préparer le conflit en Serbie et prédire la stabilité de l’Arabie Saoudite jusqu’en 2012. Appliquée à la localisation de Ossama Bib Laden, la méthode identifie une région qui comprend Abbotabad où le raid étatsunien a finalement eu raison de lui.
3. Dépassement de seuils critiques
Je terminerai en signalant une étude très remarquée de Lagi et al. (2011) dont une description très lisible est donnée par Johnson, 2011 (Il s’agit d’un autre Johnson que l’auteur cité plus haut.) Ces auteurs ont observé une association historique entre certaines émeutes et la cherté des denrées alimentaires. Le seuil se situe vers 220 $/tonne en prix courants et vers 190$/tonne en prix constants de 2004. Il a été dépassé en 2008 et en concordance avec le Printemps Arabe. Selon les auteurs, si la tendance des prix courante se maintient, les prochaines révolutions sont à attendre entre juillet 2012 et août 2013.
4. Conclusion
Dans l’ensemble, ces méthodes sont intéressantes, et l’engouement suscité par les articles de Leetari, Lagi et ceux issus du cercle de Geoffrey West (p.ex. Bettencourt et al.) témoignent de l’intérêt des milieux scientifiques comme de celui de la prese généraliste pour les prévisions. Il me semble, cependant, que le succès des méthodes soit dû à l’abondance des données disponibles plus qu’à la nouveauté des approches. D’une certaines façon, ces méthodes témoignent toutes de l’importance et de l’efficacité de l’internet. La note de Leetari, par exemple, n’a pas souffert de sa publication sur un site jusqu’alors confidentiel. Le village global existe bel et bien!
Notes
Note 1 : Cette note est un clin d’oeil. La phrase est extraite avec quelques modifications mineures de Wikipedia: La psychohistoire est une science imaginée par l’auteur de science-fiction Nat Schachner et développée plus largement par Isaac Asimov (1920–1992) dont le but est de prévoir l’Histoire à partir des connaissances sur la psychologie humaine et les phénomènes sociaux en appliquant une analyse statistique à l’image de la thermodynamique.
Note 2 : La partie supérieure de la figure (a) indique que 100% des actes de guerre font au moins une victime, alors que 1/1000 fait 100 victimes. Partie inférieure (b): 8 événements par jour ne se produisent pratiquement jamais, alors quer 30% des jours sont caractérisés par deux événements.
Note 3 : culturomics en anglais. Comme thermodynamics devient « la thermodynamique » et cyndinics « la cyndinique » j’ai osé le terme de « culturomique »
References
Bettencourt, L.M.A & G.B. West. 2011. Bigger Cities do more with less: new science reveals why cities become more productive and efficient as they grow. 305(3):51–53.
Bohorquez, J.C., S.Gourley, A.R.Dixon, M.Spagat & N.F.Johnson. 2009. Common ecology quantifies human insurgency. Nature 462:911–914.
Bouthoul, G. 1962. Le Phénomène-Guerre. Petite bibliothèque Payot, Paris. 283 pp.
Chi, G. 2009. Can knowledge improve population forecasts at subcounty levels? Demography,46:405–427. Disponible sur le net. Voir aussi http://www.esri.com/library/whitepapers/pdfs/evaluating-population.pdf et http://www.ageing.ox.ac.uk/files/workingpaper_507.pdf
Gilbert, N. 2009. Modellers claim wars are predictable.Insurgent attacks follow a universal pattern of timing and casualties. Nature 462:836. L’article de Gilbert est une présentation du travail de Bohorquez et al., 2009.
Johnson, E.M. 2011. Freedom to Riot: On the Evolution of Collective Violence.
Johnson, N.F., S.Carran, J.Botner, K.Fontaine, N.Laxague, P.Nuetzel, J.Turnley & B.Tivnan. 2011. Patterns of Escalations in Insurgent and Terrorist Activity. Science 333(81):81–84. Voir aussi NPR staff, 2011. Math Can Predict Insurgent Attacks.
Lagi, M., K.Z.Bertrand & Y.Bar-Yam. 2011. The Food Crises and Political Instability in North Africa and the Middle East. http://arxiv.org/abs/1108.2455v1. L’article est téĺéchargeable.
K.H.Leetaru. 2011. Culturomics: forecasting large-scale human behaviour using glocal news mwdia tone in time and space. First Monday, 16(9). This is an internet publication. Voir ce site. Voir aussi http://www.kurzweilai.net/culturomics-2–0-forecasting-large-scale-human-behavior-using-global-news-media-tone-in-time-and-space qui comprend des animations intéressantes.










Commentaires