Le grain du cas unique, le vent du big data
Publié par Laurent Vercueil, le 5 mars 2020 3.6k
Sans doute, le titre de cet article est-il par trop polémique. Mais il sera pardonné à l'auteur, car outre la beauté de l'évocation qu'il permet, il s'agit de contraster, certes de façon un peu accusée, les deux perspectives les plus éloignées qui soient : d'un côté, l'étude descriptive du cas unique, et de l'autre, l'analyse des données massives, telles qu'elles sont désormais permises par l'utilisation d'internet : les dénommées "big data".
Avant d'aller plus loin, il est nécessaire de préciser qu'il s'agit de discuter de "cas" médicaux et de "big data" intéressant les "données patients". Il est ainsi vraisemblable que cet article ne s'applique pas à la totalité du champs des "big data".
C'est la conclusion du dernier ouvrage de Laurent Cohen, "Le parfum du rouge et la couleur du z" (Odile Jacob, février 2020), dont je recommande la lecture, une conclusion en forme de défense de l'étude du cas unique, qui a stimulé mon envie de ferrailler. De fait, le sous-titre "Le cerveau en 20 histoires vraies" est parfaitement explicite : le neurologue y aborde différents déficits neuropsychologiques à partir des histoires cliniques de patients singuliers, de façon à en tirer des enseignements concernant le fonctionnement "en général" du cerveau.
J'avais déjà abordé la question de l’utilité du "rapport de cas unique" dans "Case Reports : what's the point ?", en français : rapport de cas, à quoi bon ? -oui, pourquoi un titre en anglais si l'article est en français ? c'est une bonne question.
Dans son dernier livre, et donc, plus précisément dans sa conclusion, Laurent Cohen défend l'apport scientifique de l'étude minutieuse de cas singuliers, au delà du caractère illustratif (dont Sacks s'était fait une spécialité), en complément de ce que les techniques contemporaines (notamment d'imagerie fonctionnelle) permettent d'apporter. Il signale aussi, fort justement, que les récits des expériences déroutantes que rencontrent ces patients mobilisent, chez le lecteur, l'empathie, une fonction qui permet, outre d'élargir le champ de nos propres expériences (par celle, évoquées, d'autrui), de sensibiliser la population "saine" au sort de la population "malade".
Je vais souligner une caractéristique spécifique au "cas unique", caractéristique qui se dilue au fur et à mesure de l'amplification de la population étudiée : à partir de deux cas, on parle d'une série. Les séries peuvent intéresser des dizaines, des centaines, voire des milliers ou des millions de "cas", comme lorsqu'on s'intéresse à des données-patients collectées via internet, par exemple, soit les fameuses big-data.
Ainsi, ce qui qualifie au mieux le "cas unique" est sa granularité. Il s'agit du point 1 que je soulignais dans l'article précédent. Je vais y revenir un peu, notamment pour contraster cette caractéristique avec celles des "séries" et des "big data".
Mais qu'est-ce que le grain ? la granularité ? C'est ce qui constitue le plus petit élément d'un système, grosso modo, la qualité de la définition ou le nombre de pixel. Ainsi, une image dont le grain est infime est plus précise que celle dont le grain est grossier. Pour compléter, on peut dire que c'est la quantité d'information disponible.
Or il se trouve qu'on ne connait plus complexe, plus riche que l'expérience humaine. Ce que l'on vit, ce que l'on ressent, ce que l'on éprouve, chaque seconde, est d'une granularité extrême, probablement indépassable, et dont la transmission est toujours, globalement, insuffisante et décevante; il n'empêche, même en approximation, ça reste éblouissant. Pour preuve les livres d'Oliver Sacks, ou, précisément, celui de Laurent Cohen.
Je ne vais pas me gêner pour reprendre le texte que j’avais écris sur le sujet (on n'est jamais mieux servi que par soi-même): "Les leçons tirées des grandes échelles relèvent de la statistique et portent sur des indicateurs rudimentaires. Une population n'a pas le vécu d'un individu isolé. A constituer des groupes homogènes, on tire vers la moyenne. C'est nécessaire, c'est utile, c'est fondamental, mais c'est moins précis. Ce qu'on peut tirer d'un cas unique ne nous apprend pas beaucoup sur le voisin, c'est vrai, mais énormément sur ce que ça fait d'être un cas unique. On peut aller du simple au général en passant par le nombre (j'accumule des cas similaires pour constituer une série, quitte à plier les observations dans le moule), mais aussi en passant par l'expérience dans ce qu'elle a d'unique, de non partageable." (copié-collé de là).
Car si le cas unique nous donne accès à ce qui fait l'unicité de l'expérience humaine, notamment pathologique, quel est le degré d'information qui est produit par l'étude des données massives ? Essentiellement des données corrélatives, c'est à dire des associations statistiques : utile notamment pour déterminer certains facteurs de risque si l'on parvient à se défaire de deux écueils possibles : 1) l'établissement d'une relation statistique entre deux événements de santé A et B (on trouve souvent A chez les personnes présentant B), ne signifie pas que A soit la cause de B, parce que B peut tout aussi bien se trouver à l'origine de C, 2) il est toujours possible d'ignorer que le facteur C qui se trouve à l'origine à la fois de A et de B, crée une relation artificielle entre A et B.
Indéniablement les big-datas peuvent nous apprendre des choses, il serait absurde de le nier. Mais pour revenir au "grain des choses", quel est le degré d'information qu'elles permettent ? Par exemple, si on prend les conclusions des 10 dernières études publiées à partir de la cohorte NutriNet-Santé (disponibles ici):
- Une promotion encore plus active des comportements sains dans la population générale pourrait être un levier essentiel pour combattre l’épidémie d’hypertension.
- Nos résultats suggèrent qu'une consommation élevée de fibres alimentaires, principalement les fibres insolubles et celles issues des céréales, était associée à moins de symptômes d'asthme et à un meilleur contrôle de la maladie.
- Les associations entre le PNNS-GS2 et les facteurs sociodémographiques et nutritionnels justifiant sa validation sont cohérentes. D'autres études sont nécessaires pour évaluer son association avec la mortalité et la morbidité.
- Dans un contexte où l'OMS s'interroge sur le niveau de preuve des données scientifiques à l'appui de la mise en œuvre d'une taxe sur les boissons sucrées, les résultats de cette étude observationnelle basée sur une importante cohorte prospective suggèrent qu'une consommation accrue de boissons sucrées pourrait être associée positivement au risque de cancer au global et du sein. Il est à noter que les jus de fruits 100 % pur jus étaient également associés positivement au risque de cancer au global. Ces résultats doivent être reproduits dans d'autres études prospectives à grande échelle. Ils suggèrent que les boissons sucrées, qui sont massivement consommées dans les pays occidentaux, peuvent potentiellement représenter un facteur de risque modifiable pour la prévention du cancer.
- Ces résultats suggèrent que le régime MIND pourrait aider à prévenir ou à retarder les plaintes mnésiques (subjectives) chez les adultes plus âgés ne présentant pas de symptômes dépressifs.
- Nos résultats ont mis en évidence que les personnes qui excluent le gluten présentent un profil alimentaire globalement plus sain. Cette étude apporte de nouvelles informations sur la consommation alimentaire et les comportements des personnes excluant le gluten et pourra servir de critère à de futures études s’intéressant aux impacts potentiels d’un régime sans gluten chez les individus en bonne santé.
- Les résultats de cette étude suggèrent que la promotion d'une alimentation « saine » présentant des propriétés antiinflammatoires est importante pour la prévention des symptômes dépressifs, en particulier chez les personnes présentant un IMC supérieur au seuil de 25.
- Nos résultats suggèrent qu'une forte adhésion aux recommandations nutritionnelles nationales françaises peut être liée à une meilleure santé globale tout au long du vieillissement.
- Dans cette large étude prospective, une consommation plus élevée d'aliments ultra-transformés dans l'alimentation était associée à une augmentation de risques de maladies cardio-vasculaires, coronariennes et cérébro-vasculaires. Différentes dimensions de la transformation alimentaire telles que la composition nutritionnelle du produit final, les additifs alimentaires, les matériaux de contact et les contaminants néoformés pourraient jouer un rôle dans ces associations ? D'autres études sont donc nécessaires afin de mieux comprendre leur contribution relative. Dans l’attente, la consommation d'aliments frais ou peu transformés est à privilégier, au nom du principe de précaution
- La consommation élevée de charcuterie était associée à une augmentation des symptômes d'asthme, et son rôle était d’autant plus important quand sa consommation était combinée à d’autres facteurs de risque tels que le surpoids/obésité, le tabagisme et une mauvaise qualité nutritionnelle de l'alimentation.
Attention, qu'on ne se méprenne pas : Je ne souhaite pas du tout conduire une critique acerbe de ce type d'approche. Il s'agit clairement de données utiles, fécondes et qui peuvent déboucher sur des préconisations très importantes qui nous intéressent tous. Mon propos est seulement d'attirer l'attention sur le différence de degré dans l'information qui est produite. Ce que montrent les conclusions auxquelles amènent les analyses des données massives ("big data" en français), c'est, en l'occurrence, qu'un certain type d'alimentation, dite "saine", attentive, précautionneuse, est associée à un meilleur état de santé, physique et mentale. Il n'est toutefois pas possible de savoir si cette meilleure qualité d'alimentation est à l'origine de la meilleure santé physique et mentale ou si c'est la meilleure santé physique et mentale qui conduit à prendre soin de son alimentation.
Ce type d'information n'est pas accessible lors de l'étude de "cas unique". C'est pourquoi il est absurde d'opposer, comme je fais mine de le faire, les deux pôles à titre antagoniste. Les données massives manœuvrent des tractopelles, quand le cas unique fait dans la dentelle. Les données massives soulèvent des pistes qui sont des autoroutes ("la malbouffe nous tue"), le cas unique chemine sur la sente escarpée d'un terrain inexploré.
Le vent souffle sur le désert et modèle les dunes, mais à l'échelle du grain, chacun est unique...
Vous désirez en savoir davantage sur le cerveau ? Visitez l'INDEX de www.atoutcerveau.fr en suivant ce LIEN.