Le problème ce sont les données (numériques ?)

Print Friendly, PDF & Email

Les écoliers vont avoir du travail : apprendre à lire les tableaux et les graphiques que nous proposent tous les médias et autorités en charge de l’épidémie. Mais il va falloir aussi leur apprendre les subtilités qui se cachent derrière ces documents et en particulier une question essentielle mais d’où viennent ces données (ou ses obtenues selon Bruno Latour) ? Les comparaisons internationales dont nous sommes abreuvés tout au long de ces semaines laissent rêveur surtout quand dans un pays les responsables vous expliquent que les autres pays ont oublié ou ne comptent pas la même chose que nous. Il y a pire encore, lorsque l’on nous explique que les données ne sont pas recueillies de la même manière d’un département à l’autre ou d’un pays à l’autre et que non seulement on ne comptabilise pas les mêmes données, mais qu’elles ne sont pas toutes correctement renseignées par ceux en charge de le faire, qui eux-mêmes peuvent ne pas pouvoir le faire (dire la cause d’une mort sans pouvoir en tester la véracité).

Les chercheurs sont confrontés à cela et même dans les sciences dites dures (mais pourquoi cet adjectif ?) ou exactes, la question se pose. Les nombreux spécialistes, enseignants, chercheurs qui sont invités à s’exprimer dans les médias sont presque tous unanimes pour expliquer les fameuses incertitudes chères à Edgar Morin (voir son article sur le site du CNRS https://lejournal.cnrs.fr/articles/edgar-morin-nous-devons-vivre-avec-lincertitude ). Les polémiques survenues au cours de cette période n’ont étonnamment pas fait rebondir le questionnement sur les fameux « bidonnages » scientifiques hormis dans les cercles catastrophistes ou complotistes. En période difficile il vaut mieux une solidarité de façade et non pas un dénigrement (bashing, terme à abandonner) systématique. La science avance dans les controverses, les hypothèses, les tentatives de vérification, et aucune méthodologie n’est efficace, réplication de l’expérience y compris, si on ne met pas en clair la manière dont elle est accomplie : les effets de marge produits par des contextes sont importants et aussi, la volonté d’un chercheur de se montrer et de prouver qu’il dit vrai ou pour capter des fonds pour ses recherches sont suffisamment courant pour qu’un biais de confirmation, entre autres (cf. l’ouvrage « Votre cerveau vous joue des tours », Albert Moukheiber, Allary Eds. 2019) ne vienne entacher la crédibilité de ses résultats.

Les journalistes veulent souvent savoir la vérité. Ils fonctionnent souvent en « noir et blanc » (binaire) alors que les problèmes se posent en « couleur » (analogique). Face aux chercheurs ils les somment souvent de donner une réponse (blanc ou noir) et souvent ils répondent en couleur, en nuance… Bien sûr le(la) journaliste peut traduire la réponse et parfois, le titre ou le chapô d’un article transforme une parole nuancée en certitude… De même les commentaires des données chiffrées ou encore des graphiques donne lieu à des interprétations qu’il convient de mettre en cause. La chaine informationnelle du savoir est donc bien fragile et l’occasion va nous être donnée dans les temps à venir de réfléchir à tout cela. D’ailleurs parmi tous les propos sur demain, il en est un qu’il ne faudra pas oublier de traiter, c’est celui de la chaine informationnelle du savoir. Remettre en question le processus de scientificité qui semble avoir envahi les cercles du politique en particulier en éducation (CF le CSEN) mais aussi dans la santé et dans toutes les disciplines scientifiques.

« Nous ne voyons du monde que ce que les outils que nous utilisons nous permettent de voir »

Pour les élèves, les jeunes, mais aussi pour toute la population il faut questionner cette chaine informationnelle :
1 – De quels matériaux et de quelle manière captons-nous les faits dont nous voulons parler (pour le fait, matériel ou non, est la base de l’information) ?
2 – Comment traitons-nous ces matériaux, quels calculs, quels algorithmes, quels traitements faisons-nous subir à ces matériaux (devenus données) ?
3 – Quelles formes choisissons nous pour exprimer le résultat de ces calculs, de ces traitements ?
4 – Quelles illustrations, graphiques et parfois analogies utilisons nous pour présenter le résultat de ces traitements ?
5 – Quels commentaires sont faits, accompagnent la diffusion de ces résultats ?
6 – Avons-nous la possibilité d’accéder à des résultats issus d’autres sources sur le même sujet ?

A la suite de ces 6 questions ou plutôt avant de commencer à faire ce travail d’analyse (et pendant) il faut s’interroger sur nos connaissances et croyances initiales. Ne suis-je pas en train de chercher la confirmation de ce que je crois, pense ou sais, avant d’accéder à ces documents ? Pour le dire autrement, est-ce que je suis critique sur moi-même avant de l’être pour les autres ?

Les moyens informatiques et numériques favorisent la circulation de l’information (comme traduction de faits sous forme diffusable). Ils favorisent leur captation, leur traitement, leur illustration et leur diffusion. Pour qui a déjà utilisé des logiciels de traitement statistique, il est facile de comprendre que l’on peut « transformer » des données captées en des formes qui peuvent être trompeuses voir fausse. On obtient de beaux tableaux et des graphiques non moins spectaculaires, et il est impossible au néophyte de décrypter le sens, il doit alors faire appel à l’expert qui parfois interprète un peu rapidement le résultat sans aller plus loin. L’exemple le plus courant est la réduction de la corrélation à la causalité. Un autre exemple c’est la généralisation statistique (99% = 100%) qui consiste à marginaliser, ignorer les cas négatifs lorsqu’ils sont rares (cf. Outsider et les ficelles du métier de Howard S. Becker).

En ce moment le recours aux moyens numériques de toutes sortes est bien sûr précieux pour tous. Mais il faut aussi mesurer combien ils cachent, dans leurs résultats, la complexité des traitements qu’ils font subir aux données. Par analogie avec les maladies : quand on traite le symptôme (le produit) plutôt que la cause (l’origine et le processus), on est dans l’inconnu et le provisoire et surtout il faut être modeste quant aux savoirs qui en découlent :

« Si le symptôme disparaît est-ce pour autant que la cause a disparue ? »

A suivre et à débattre
BD

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.

%d bloggers like this: