Hot news

[Coronavirus data projection #1] Une autre lecture des données de l’OMS

Pour quoi regarder des courbes exponentielles ne nous apprends rien, ou presque rien

Depuis quelques semaines, nous sommes abreuvés de courbes et de chiffres liés à la pandémie de Covid-19 en cours. Chaque jour plus spectaculaires, ces chiffres et ces courbes entretiennent un climat anxiogène, salvateur car il attire l’attention de tous sur la gravité de cette situation, pourtant pas inédite. Les pandémies ont depuis bien avant notre époque décimé les populations humaines. Mais c’est la première fois que l’on peut tous la suivre avec une telle instantanéité

Pour rendre compte de la situation, il est fait usage de courbes et de chiffres spectaculaires

Les courbes habituelles sont présentées en fonction du temps : nombre de cas en fonction de la date ou du nombre de jours après un seuil défini (10 morts ou 1000 contaminés généralement).

Ce qui donne ceci (au 01/04/2020 au soir, chiffres de l’OMS)

Fig. 1 : nombre de cas testés positifs en France en fonction de la date

 

La même courbe débutant au jour du dixième décès enregistré.

Fig. 1.1 : nombre de cas testés positifs en France en fonction du nombre de jours après le 10ème décès

 

Les décès suivent une courbe tout aussi impressionnante et proportionnelle (qui traduit indirectement le taux de mortalité)

Fig. 2 : Décès en France en fonction du nombre de jours après le 10ème décès

Cette façon de voir les choses est spectaculaire puisque nous sommes face à un phénomène par nature exponentiel : une personne contaminée en contamine plusieurs, qui à leur tour en contaminent plusieurs. Sinon il ne s’agit pas d’une épidémie. Mais cette représentation ne montre pas directement si nous sommes en phase d’accélération de la pandémie ou au contraire, dans une phase de reprise de contrôle. En effet, chaque jour, il y a plus de décès, plus de cas positifs que la veille… et on bat des records de jour en jour.

Est-ce pour autant que la pandémie est en phase ascensionnelle ? Pas sûr.

Notre cerveau est impuissant face à une courbe exponentielle. Elle grimpe, verticalement ou presque, et c’est tout ce que l’on peut voir.

Des situations inégales en fonction des zones, des pays

 Au mieux peut on voir que certains pays connaissent des croissances plus rapides que d’autres en comparant visuellement les pentes des exponentielles.

 Fig. 3 : courbes pour quelques pays du nombre de personnes testées positives en fonction du nombre de jours après le dixième décès

 

On peut également avec ces courbes mesurer la diffusion de la maladie le long de la surface du globe.

 Fig. 4 : courbes pour les 6 grandes régions du nombre de personnes testées positives en fonction de la date

 

L’Asie démarre en janvier 2020, suivie par l’Europe qui subit une croissance bien plus impressionnante que l’Asie (mais les chiffres donnés par la Chine posent question aujourd’hui, nous y reviendrons) puis l’Amérique du nord qui démarre aussi fort que l’Europe, en même temps que l’Afrique (qui démarre lentement) suivies de l’Amérique du sud et du Pacific qui n’en sont qu’au début.

Est-ce lié à la taille du pays ? Est-ce que le fait de rapporter les chiffres de la contagion à la population du pays nous en dit plus ?

On peut se dire que rapporter ces chiffres à la population du pays permet de relativiser ces phénoménales croissances. 

 Fig. 5 : courbes pour les 6 grandes régions du nombre de personnes testées positives par 100 000 personnes de la population de la zone en fonction de la date

 

En fait, oui et non. Une épidémie se propage de proche en proche. C’est donc la taille du foyer d’infection et surtout l’étendue de ses frontières qui détermine sa capacité à croitre plus ou moins rapidement. Et c’est plutôt la mobilité des individus contagieux qui accélère ou réduit sa vitesse de propagation. Un individu contagieux crée autour de lui un foyer d’infection. S’il est parachuté au milieu d’une population saine, il va créer un nouveau foyer exponentiel de contamination. D’où les mesures de confinement et de restriction des mobilités qui évitent un embrasement généralisé de la maladie au sein de la population.

Fig. 6 : courbes pour les 6 grandes régions du nombre de personnes testées positives par 100 000 personnes de la population de la zone en fonction du nombre de jours depuis le 10ème décès

On peut constater que l’Amérique du nord connait une croissance des cas beaucoup plus rapide que celle de l’Europe, qui pourtant était impressionnante comparée à celle de l’Asie. Ce qui apparaît mieux la figure suivante où les tracés sont exprimés en jour après le 10ème décès.

Alors ? Sommes-nous en train de gagner la guerre ou en sommes-nous loin ?

On pourrait se dire qu’il faut observer le nombre de nouveaux cas détectés jour après jour pour évaluer si l’on est en train de gagner la guerre.

 Fig. 7 : courbes pour France, Espagne, Italie et Corée du Sud du nombre de personnes testées positives par 100 000 personnes de la population de la zone en fonction du nombre de jours depuis le 10ème décès – Echelles logarithmique – non filtré

 

On constate que l’Espagne et l’Italie semblaient être en train de maîtriser le nombre de nouveaux cas détectés chaque jour depuis environ 5 jours. Un petit filtrage Savitzky-Golay par-dessus permet d’y voir plus clair.

 Fig. 8 : courbes pour France, Espagne, Italie et Corée du Sud du nombre de personnes testées positives par 100 000 personnes de la population de la zone en fonction du nombre de jours depuis le 10ème décès – Echelles logarithmique – Filtre Savitzky-Golay

 

La tendance se confirme pour l’Italie, mais pas du tout pour l’Espagne et la France. Mais n’aurait-il pas été possible de voir cette inflexion avant qu’elle ne soit aussi visible ?

Changer de mode de représentation pour espérer comprendre quelque chose à la situation.

Le seul moyen de savoir ce qu’il se passe réellement sur le front de la lutte contre la pandémie est d’analyser le nombre de contaminations sur une période de temps et de le rapporter au nombre total de personnes contaminées au même moment. En effet, si la contagion n’est pas sous contrôle, le nombre de nouvelles contaminations par des personnes contaminées reste constant. Donc le nombre de nouvelles contaminations continue d’augmenter exponentiellement. Par-contre, si les mesures prises (distanciation sociale, protection individuelle, confinement, voire vaccination plus tard) permettent d’enrayer le phénomène d’expansion de la maladie, on ne peut le voir qu’en analysant l’évolution du ratio nouvelles contaminations / total des contaminations.

Ce ratio se rapproche du R-0 (nombre de contamination moyen par une personne contaminée), donc entre 1 et 4 pour la maladie covid-19. Mais, les nombres en jeu sont des milliers voire des millions de gens. Il faut utiliser des échelles logarithmiques. L’échelle logarithmique présente les phénomènes exponentiels sous forme d’une droite dont l’inclinaison donne le facteur. Ce qui donne un tracé plus simple à interpréter qu’une exponentielle.

Voici le cas de la France sous forme d’un tracé logarithmique.

Fig. 9 : Nombre de nouveaux cas positifs en fonction du nombre de personnes testées positives, échelle logarithmique, filtrage Savitzky-Golay

On voit sur cette courbe que pendant une période qui va de 1000 à 20 000 cas de contamination, la maladie progresse sans encombre car la ligne est droite, donc le taux de contamination est standard, conforme au R-0 de la maladie Covid-19. Mais à partir de 20 000 cas environ, la courbe s’infléchit. Ce qui veut dire que les contaminés contaminent moins vite les gens sains. Ce qui est une bonne nouvelle. Mais, elle remonte brutalement ce qui nous amène aux alertes des autorités sanitaires qui répètent à l’envie que le pire est devant nous.

Si l’on prend la Corée du Sud, dont on loue la maîtrise de l’épidémie, on constate que le décrochage de la courbe est très net.

 Fig. 10 : Nombre de nouveaux cas positifs pour France et Corée du Sud en fonction du nombre de personnes testées positives, échelle logarithmique, filtrage Savitzky-Golay
A environ 3000 cas de contamination recensés, la courbe décroche, les gens contaminés ne contaminent plus les gens sains. L’épidémie est enrayée en Corée du Sud.

Qu’en est-il alors?

Cette figure montre les courbes pour quelques pays ayant eu recours au confinement, plus ou moins rapidement. D’abord en traçant le nombre de cas contaminés en fonction du temps, depuis le 10ème décès.

 Fig. 11 : Nombre de cas positifs pour France, Italie, Espagne et Corée du Sud en fonction du nombre de jours depuis le 10ème décès, filtrage Savitzky-Golay

 

Difficile de dire comment se porte le malade. D’autant plus que le nombre de cas détecté dépend des modalités de détection adoptées par le pays. L’Espagne semble aller mieux car la pente est moins forte. En ce qui concerne l’Italie et la France, difficile à dire comme ça.

Pourtant, on l’a vu, la courbe des contaminations quotidiennes de l’Italie est clairement en train de montrer des signes d’embellie sur le front de la lutte contre Covid-19.

L’Italie semble sur la bonne voie, l’Espagne connait un répit mais la situation en France n’est pas rassurante.

Si l’on prend l’Italie et que l’on trace le graphique logarithmique des nouveaux cas rapportés au cas totaux.

 Fig. 12 : Graphique logarithmique de l’Italie, filtrage

 

On note un décrochage par rapport à la droite à partir d’environ 40 000 cas. Ce qui correspond à la date du 19 mars 2020. Où en était-on sur la courbe des contaminations journalières à cette date ?

 Fig. 13 : Evolution du nombre de cas positifs quotidiens en fonction de la date

 

Le 19 mars, l’Italie rapportait 4207 nouveaux cas, puis le 20 mars, 5322, puis plus de 5900 le 21 jusqu’à culminer à 6557 le 29 mars. Si l’on regarde la courbe, à cette date le nombre de contaminations quotidiennes était même en accélération. Le combat pouvait sembler tourner en la faveur du virus, et rendre vaines les mesures prises alors.

Pourtant, le décrochage était visible à partir du 19 mars grâce à cette représentation logarithmique.

Si l’on reprend nos pays proches ayant mis en place le confinement, on obtient les graphiques logarithmiques suivants.

 Fig. 14 : Graphique logarithmique de France, Italie, Espagne et Corée du Sud, filtrage.

 

On remarque que l’Espagne et l’Italie semblent donc sur la bonne voie avec un décrochage marqué pour l’Italie, timide pour l’Espagne. En ce qui concerne la France, c’est moins bon pour l’instant même si l’on note un décrochage à partir de 22300 contaminés environ. C’est la date du 24 mars qui correspond à ce nombre total de contaminations.

Les mesures de confinement ont-elles un effet ?

Pour rapprocher cela des mesures prises par les gouvernement, l’Italie a mis en place le confinement le 9 mars. Il aura donc fallu 10 jours pour que les effets se fassent sentir sur le rythme des contaminations. La France a pris les mêmes disposition le 17 mars. Les premiers signes de ralentissement de la progression de l’épidémie semblent apparaître le 24 mars, soit 7 jours après. Mais une ré-accélération depuis deux jours montre à quel point c’est sensible et instable.

On se souvient que la mise en place du confinement en Italie a donné lieu à une transhumance massive vers le sud, créant de nouveaux foyers d’infection par des personnes contaminées ayant migré vers le sud. Ce qui explique peut-être que les effets aient mis 10 jours à se faire sentir. Le confinement aurait-il des effets réels sur la progression de la maladie ? On peut le penser.

Qu’en est-il des pays ayant tardé à mettre en place des mesures de confinement pour réduire la progression de la maladie ?

Le Royaume-Uni est un cas intéressant. Boris Johnson adopte une stratégie dite « de l’immunité collective » le 3 mars. 10 jours après, soit le 13 mars, le Royaume-Uni compte 725 cas avérés. Ce qui sur la courbe logarithmique correspond à une période bien linéaire.

 Fig. 15 : Graphique logarithmique du Royaume Uni, filtrage

 

Le 23 mars, le Royaume-Uni adopte le confinement obligatoire. Dès le 26 mars, à 11 500 contaminations environ, on note enfin une inflexion, légère. La vraie inflexion arrive le 29 mars, soit 6 jours après la mise en place du confinement obligatoire.

Voici le graphique logarithmique comparé des USA, de l’Italie et de la France.

 Fig. 16 : Graphique logarithmique des Etats-Unis, Italie et France, filtrage

 

On remarque tout de suite que la courbe des Etats-Unis est très au-dessus de celles de la France et de l’Italie à partir de 4000 contaminations environ. Ce qui veut dire que les contaminations de personnes saines sont beaucoup plus nombreuses pour chaque cas avéré.

Le très récent revirement de situation aux Etats-Unis pourrait donner des résultats dans 6 à 10 jours on l’espère, ce que nous surveillerons attentivement sur les courbes.

La Chine aurait elle fournit des chiffres faux sur l’épidémie ?

Il reste le cas de la Chine. La polémique enfle sur la réalité des chiffres donnés par la Chine lorsque l’épidémie faisait rage chez eux.

 

Fig. 17 : Graphique logarithmique comparé de la Chine, l’Italie et la Corée du Sud.

Un rapide coup d’œil au graphique logarithmique comparant les situations en Chine, Corée du Sud et Italie ne fait pas douter de la justesse des chiffres de contamination. La courbe est bien alignée avec les autres, ce qui traduit un R-0 du SARS-CoV-2 identique. Sur la contamination elle-même, il n’y a pas eu « d’erreurs » de mesure.

Qu’en est il de la mortalité de la maladie ?

Sur ce graphique, sont représentés le nombre total de décès recensés depuis le 100ème décès en fonction du nombre total de personnes contaminées.

Fig. 18: nombre de personnes contaminées en fonction du nombre de gens contaminés

 

A la vue de ces courbes, on peut se dire que la médecine chinoise est plus efficace que la médecine européenne et qu’elle rivalise avec la médecine américaine, qui semblent contenir de la même façon les cas mortels de Covid-19.

Mais pour être complet, il faut prendre en compte qu’il y a un délai entre la détection de la contamination d’un individu et d’éventuelles complications pouvant mener au décès. On doit donc prendre en compte la vitesse à laquelle l’épidémie se développe pour relativiser la qualité des soins.

Fig. 19 : nombre de nouveaux cas infectés en fonction du nombre de jours après le 100ème décès.

 

Fig. 20 : nombre total de personnes infectées en fonction du nombre de jours après le 100ème décès.

 

Ces courbes montrent que la Chine a connu un rythme de contagion très similaire à celui des autres pays, notamment Européens. Or, le taux de décès en fonction du nombre de cas de contamination est très inférieur à ce que l’on constate en Europe. On peut donc s’interroger sur la méthode de comptage de décès ou aux éventuelles erreurs.

Les évolutions des taux aux USA nous donneront quelques pistes pour évaluer si le scénario chinois se confirme. Restez connecté !

Ces analyses ont été mené en s’appuyant sur les données de l’OMS et l’utilisation des outils de Data Science open source de l’environnement Python.

Bien que nous ayons pris des précautions  dans l’interprétation de ces données, elles représentent un point de vue de Bengs à un instant t.