Big data, algorithmes, machine learning, etc. Autant de termes techniques qu’il existe d’utilités à nos données. Guillaume Rozier, data scientist et fondateur du site CovidTracker nous explique.

Le 5 mars, alors qu’un confinement généralisé du pays est inenvisageable en France, Guillaume commence à s’intéresser aux données existantes sur le coronavirus. “ À cette époque, Santé publique France ne publiait pas de données, j’ai donc récupéré celles collectées par l’université américaine John Hopkins, explique-t-il. Rapidement, il commence à créer un premier graphique sur le nombre de cas en France. La situation quant à elle s’envenime en Italie. “J’ai tracé sur le même graphique le nombre de cas en France et en Italie, je me suis rendu compte que les courbes se superposaient parfaitement. Nous avions la même évolution mais personne n’en parlait.”

Rapidement, le jeune ingénieur commence à partager ses graphiques à son entourage et sur Twitter. “ Les gens ont pris conscience de ce qu’il se passait et à partir de ce moment-là, ils me demandaient une mise à jour quotidienne. ” Pour se faciliter la tâche, Guillaume décide de créer son propre site. “ Au début, le site était hébergé sous guillaumerozier.fr puis quand il y a eu 30 000 visites en trois jours, j’ai décidé de faire quelque chose de plus pro. Je n’ai jamais eu l’ambition de créer un site qui ferait des millions de vues chaque semaine, qui serait dans les médias, etc. ”

La data science, qu’est-ce que c’est ?

L’intérêt du jeune diplômé pour les données n’est pas né avec le Covid. Ainsi, après une prépa scientifique, Guillaume a intégré une école d’ingénieur et s’est spécialisé dans la data science. “ J’ai choisi la spécialité données biomédicales. Cela m’a permis d’approfondir le traitement des données qui ont un lien avec la santé. Je me rendais bien compte que l’on générait énormément de données dans tous les domaines. On les accumule mais on ne sait pas quoi en faire. Depuis peu, on commence à en faire des choses utiles, c’est notamment le cas pour le coronavirus.”

Aujourd’hui, Guillaume est data scientist. Qu’est-ce que c’est ? “ C’est l’étude des masses de données numériques, ce que l’on appelle le big data. ” En bref, cette science a pour objectif de faire parler les données afin de produire des connaissances qui peuvent permettre de faire des prédictions ou aider à la prise de décision.

Des données qui peuvent faire peur

Mais la collecte des données numériques peut inquiéter les internautes et le jeune ingénieur le comprend bien. “ C’est possible de collecter des données de manière encadrée et rigoureuse, sans qu’il y ait le moindre problème de vie privée, affirme Guillaume. Le coronavirus en est un magnifique exemple, Santé publique France nous donne énormément de données et il n’y a pas de problème, tout est encadré par la CNIL (Commission nationale de l’informatique et des libertés). ”

Des outils pédagogiques convaincants

Comparateur de vague ou calculateur de déconfinement, les outils du site CovidTracker deviennent véritablement pédagogiques. CoviRisque permet par exemple de calculer le risque de croiser un cas positif dans un évènement. “ Ces outils sont utilisés par des citoyens qui veulent se rendre compte des risques. Souvent, on me dit que le site est clair, pédagogique et instructif. ” Le calculateur de déconfinement créé par Guillaume, “outil un peu plus technique” selon le créateur, a également été utilisé par des professionnels de santé.

À l’approche des fêtes de fin d’année, CoviRisque a évolué et permet désormais de créer des événements fictifs rassemblant des personnes venant de plusieurs départements et d’estimer le risque. “ Je pense qu’il va être beaucoup utilisé dans les quinze prochains jours. ”

À quelques jours du déconfinement, le créateur de CovidTracker ne préfère pas se projeter. “J’ai fait mes adieux à la fin de la première vague, je pensais que le site allait mourir à petit feu et que quelqu’un allait faire mieux que CovidTracker, Santé publique France ou le Gouvernement par exemple. Ce qui m’a relancé c’est la reprise de l’activité épidémique fin juillet. Pour l’instant je n’ai pas envie de m’avancer, j’espère que l’épidémie s’arrêtera le plus rapidement possible. ”

Selon CovidTracker, la France passera sous la barre des 5 000 cas quelques jours avant la date du déconfinement. 

Une aventure qui ouvre des portes

Lancé sans la moindre arrière pensée et sans but précis, le travail de Guillaume s’est rapidement transformé en véritable opportunité professionnelle. “ J’ai terminé mon stage de fin d’études en août et je n’ai pas eu besoin de chercher de CDI, une petite dizaine d’entreprises se sont rapprochées de moi naturellement en voyant mon projet ”, avoue le diplômé de Télécom Nancy. Après avoir été contacté par ses futurs collègues sur Twitter, Guillaume a finalement signé un contrat de consultant dans un cabinet de conseil.

Rédactrice: Sarah Chevalier

Crédit: Guillaume Rozier | CovidTracker & graphiques officiels du site