Mesures d'association, biais et causalité

Q: Comment interpréter un RR = 0,6 avec un IC 95 % [0,45 ; 0,80] dans une étude sur l'efficacité d'un médicament ?

Un RR de 0,6 signifie que les patients traités ont 60 % du risque de survenue de l'événement comparé aux non-traités, soit une réduction du risque de 40 %. L'IC 95 % est [0,45 ; 0,80] : il ne contient pas la valeur 1, donc l'association est statistiquement significative au seuil de 5 %. On peut conclure que le traitement est associé à une réduction significative du risque, d'environ 20 à 55 % selon les bornes de l'IC. Un RR < 1 indique un facteur protecteur, ici le médicament.

Q: Qu'est-ce qu'un facteur de confusion et comment le contrôler ?

Un facteur de confusion est une variable associée à la fois à l'exposition étudiée et à la maladie, indépendamment du lien que l'on cherche à étudier. Il peut créer une association apparente entre l'exposition et la maladie (confusion positive) ou masquer une vraie association (confusion négative). On le contrôle à deux niveaux : lors de la conception de l'étude par la randomisation (ECR), la restriction de l'étude à une strate, ou l'appariement des témoins sur les facteurs confondants connus ; lors de l'analyse statistique par la stratification ou les méthodes multivariables (régression logistique), qui permettent d'ajuster l'estimation de l'association sur les facteurs de confusion mesurés.

Q: Pourquoi la temporalité est-elle le critère de Bradford Hill le plus important ?

Pour qu'une relation soit causale, la cause doit nécessairement précéder l'effet. Si l'on observe une association entre deux variables sans pouvoir démontrer que l'exposition précède la maladie, toute interprétation causale est impossible. Par exemple, une étude transversale pourrait montrer que les personnes déprimées ont un réseau social plus pauvre. Mais est-ce la dépression qui appauvrit le réseau social, ou l'isolement qui provoque la dépression ? Sans données longitudinales permettant d'établir la séquence temporelle, on ne peut pas trancher. C'est pour cette raison que les études de cohorte (qui suivent les exposés non malades dans le temps) offrent une preuve de temporalité bien plus solide que les études transversales.

Cadre programme : référentiel infirmier 2026 (arrêté du 20 février 2026), Domaine C, UE C.1 « Santé publique, promotion de la santé et éducation thérapeutique ». Correspond à l'ex-UE 1.2 (référentiel 2009).

Pourquoi c'est central pour l'IDE : comprendre les mesures d'association, les biais et les critères de causalité permet à l'infirmier de lire de façon critique les études épidémiologiques, de ne pas tirer de conclusions hâtives et de distinguer une corrélation statistique d'une relation de cause à effet.

1. Les mesures d'association

Une mesure d'association quantifie la force du lien statistique entre un facteur d'exposition et l'apparition d'une maladie. Les deux mesures principales sont le risque relatif et l'odds ratio.

1.1 Le risque relatif (RR)

Le risque relatif (RR) est utilisé dans les études de cohorte. Il compare le risque (incidence cumulée) de développer la maladie chez les exposés à celui chez les non-exposés.

RR = Incidence chez les exposés / Incidence chez les non-exposés

On construit un tableau de contingence 2×2 :

	Maladie présente	Maladie absente	Total
Exposés	a	b	a+b
Non-exposés	c	d	c+d

Incidence chez les exposés = a / (a+b)
Incidence chez les non-exposés = c / (c+d)
RR = [a/(a+b)] / [c/(c+d)]

Interprétation :

Valeur de RR	Interprétation
RR = 1	Aucune association (même risque dans les deux groupes)
RR > 1	Facteur de risque : les exposés ont un risque plus élevé
RR < 1	Facteur protecteur : les exposés ont un risque plus faible

Exemple : si le RR du tabac pour le cancer du poumon est de 15, un fumeur a 15 fois plus de risque de développer un cancer du poumon qu'un non-fumeur.

1.2 L'odds ratio (OR)

L'odds ratio (OR) est utilisé dans les études cas-témoins (et souvent dans les régressions logistiques). Il compare les cotes (odds) d'exposition chez les malades (cas) et chez les non-malades (témoins).

OR = (a × d) / (b × c)

(avec le même tableau 2×2 que ci-dessus)

Interprétation :

L'OR s'interprète de la même façon que le RR :

OR = 1 : pas d'association.
OR > 1 : facteur de risque.
OR < 1 : facteur protecteur.

L'OR est une approximation du RR lorsque la maladie est rare (prévalence < 10 %). Quand la maladie est fréquente, l'OR surestime (ou sous-estime) le RR.

1.3 La différence de risque (risque attribuable)

Le risque attribuable (ou différence de risque) mesure l'excès de risque absolu lié à l'exposition :

RA = Incidence exposés - Incidence non-exposés

Il exprime la part du risque qui serait éliminée si l'exposition était supprimée. C'est un indicateur utile pour les décisions de santé publique (combien de cas évitables ?).

Exemple : si l'incidence de l'infarctus est de 5 % chez les fumeurs et de 1 % chez les non-fumeurs, le risque attribuable est de 4 % : sur 100 fumeurs, 4 infarctus sont directement attribuables au tabac.

Mnémo : RR = Rapport des Risques (cohorte) ; OR = Odds Ratio (cas-témoins). Le R de RR = R de Risque = R de cohoRte.

2. Les intervalles de confiance et la signification statistique

Un résultat épidémiologique est toujours accompagné d'un intervalle de confiance à 95 % (IC 95 %) : il indique la plage de valeurs dans laquelle on peut espérer que la vraie valeur du paramètre se trouve dans 95 % des études similaires.

Si l'IC 95 % du RR ou de l'OR ne contient pas la valeur 1 (ex. : IC [1,2 ; 3,5]), l'association est statistiquement significative au seuil de 5 %.
Si l'IC 95 % contient la valeur 1 (ex. : IC [0,8 ; 2,1]), on ne peut pas conclure à une association significative.

En pratique : face à une étude citant un RR = 1,8 [IC 95 % : 0,9 ; 3,6], ne pas conclure à un risque augmenté : l'IC contient 1 → résultat non significatif.

3. Les biais épidémiologiques

Un biais est une erreur systématique dans la conception, la réalisation ou l'analyse d'une étude qui aboutit à une estimation faussée de l'association. Les biais ne se corrigent pas par l'augmentation de la taille de l'échantillon (contrairement aux erreurs aléatoires).

3.1 Les biais de sélection

Ils surviennent quand les participants de l'étude ne sont pas représentatifs de la population cible, ou quand la comparabilité entre groupes est compromise.

Exemples :

Biais de Berkson : biais d'hospitalisation où les patients hospitalisés ont un profil différent de la population générale (comorbidités, accès aux soins).
Biais de l'immigrant en bonne santé : les migrants sont en meilleure santé à l'arrivée que la population générale du pays d'accueil car seuls les individus en bonne santé migrent.
Biais de participation : les volontaires pour une étude sont différents des non-participants.

3.2 Les biais d'information (ou de mesure)

Ils surviennent quand l'information sur l'exposition ou la maladie est recueillie de façon différente ou imprécise.

Exemples :

Biais de mémorisation (recall bias) : les cas (malades) se souviennent mieux ou différemment de leurs expositions passées que les témoins (non-malades). Fréquent dans les études cas-témoins rétrospectives.
Biais de classement différentiel : l'exposition (ou la maladie) est mesurée avec une précision différente dans les deux groupes.
Biais de l'intervieweur : l'enquêteur, connaissant l'hypothèse, pose des questions de façon différente selon le groupe (réduit par le double aveugle).

3.3 Le facteur de confusion (biais de confusion)

Le facteur de confusion (ou confondu) est une variable qui :

est associée à l'exposition étudiée,
est associée à la maladie (indépendamment de l'exposition),
n'est pas sur le chemin causal entre exposition et maladie.

Exemple classique : une étude observe que les personnes qui portent des briquets ont plus de cancer du poumon. Le briquet est associé au tabagisme (exposition réelle), lui-même associé au cancer. Le briquet est un confondu, pas une cause.

Contrôle du facteur de confusion :

Étape	Méthode
Conception de l'étude	Randomisation (ECR), restriction, appariement des témoins
Analyse statistique	Stratification (méthode de Mantel-Haenszel), régression logistique, ajustement multivariable

4. Association et causalité

Établir une association statistique entre un facteur et une maladie ne suffit pas à conclure à une relation causale. Plusieurs critères, regroupés dans les critères de Bradford Hill (1965), permettent d'argumenter en faveur d'une causalité.

4.1 Les critères de Bradford Hill (1965)

Sir Austin Bradford Hill a formulé neuf critères, dont les principaux sont :

Critère	Description	Exemple (tabac et cancer du poumon)
Force de l'association	RR ou OR élevé	RR ~ 15 pour les fumeurs
Cohérence (reproductibilité)	Résultats similaires dans d'autres études, d'autres pays	Confirmé dans de nombreuses cohortes
Spécificité	Le facteur cause surtout cette maladie	Tabac associé principalement aux cancers épithéliaux
Relation temporelle	L'exposition précède la maladie	Tabagisme commencé avant le diagnostic
Relation dose-effet	Plus l'exposition est forte, plus le risque est élevé	Plus on fume (paquet-années), plus le risque est élevé
Plausibilité biologique	Mécanisme biologique connu ou plausible	Les carcinogènes du tabac mutent les cellules épithéliales bronchiques
Cohérence avec la connaissance	Ne contredit pas les connaissances biologiques établies	Cohérent avec la biologie des cancers
Preuve expérimentale	L'élimination du facteur réduit la maladie	Arrêt du tabac diminue le risque de cancer
Analogie	Relation similaire connue pour un facteur analogue	Autres carcinogènes inhalés (amiante) causent aussi des cancers pulmonaires

Aucun critère n'est à lui seul suffisant. C'est la convergence de plusieurs critères qui argue en faveur de la causalité.

En pratique : quand un média annonce « X cause Y », l'IDE vérifie : s'agit-il d'une association observationnelle ou d'un essai ? Le RR est-il élevé ? L'exposition précède-t-elle bien la maladie ?

4.2 La triangulation

La triangulation est l'utilisation de plusieurs designs d'études différents pour tester la même hypothèse causale. Si des études de cohortes, des études cas-témoins, des études de randomisation mendélienne et des essais randomisés convergent vers le même résultat, l'argument causal est beaucoup plus solide.

Vocabulaire essentiel

Risque relatif (RR) : rapport de l'incidence chez les exposés sur l'incidence chez les non-exposés ; utilisé dans les cohortes.
Odds ratio (OR) : rapport des cotes d'exposition chez les cas sur les cotes chez les témoins ; utilisé dans les cas-témoins.
Risque attribuable (RA) : différence absolue d'incidence entre exposés et non-exposés.
Intervalle de confiance à 95 % (IC 95 %) : plage contenant la vraie valeur dans 95 % des études similaires.
Biais : erreur systématique faussant l'estimation de l'association.
Biais de sélection : les participants ne sont pas représentatifs de la population cible.
Biais d'information : la mesure de l'exposition ou de la maladie est imprécise ou différentielle.
Biais de mémorisation (recall bias) : les cas se souviennent différemment de leur exposition passée.
Facteur de confusion : variable associée à la fois à l'exposition et à la maladie, masquant ou simulant une association.
Critères de Bradford Hill : neuf critères argumentant en faveur d'une relation causale (1965).

Points clés à retenir

Le RR est la mesure d'association des études de cohorte ; l'OR est celle des études cas-témoins. L'OR approche le RR quand la maladie est rare.
Un RR ou OR de 1 signifie aucune association ; supérieur à 1 = facteur de risque ; inférieur à 1 = facteur protecteur.
Un IC 95 % qui contient la valeur 1 indique que l'association n'est pas statistiquement significative.
Les biais sont des erreurs systématiques qui faussent les résultats ; ils ne sont pas réductibles par une plus grande taille d'échantillon.
Le facteur de confusion est une variable tierce qui peut simuler ou masquer une association.
Une association statistique ne prouve pas la causalité : les critères de Bradford Hill (notamment la temporalité, la dose-effet et la plausibilité biologique) sont nécessaires pour argumenter en faveur d'un lien causal.

Pièges fréquents

Confondre RR et OR : le RR est un rapport de risques (incidences), calculable uniquement quand on connaît les incidences dans les deux groupes (cohorte). L'OR est un rapport de cotes, utilisé dans les cas-témoins où l'on ne connaît pas l'incidence directement.
Interpréter une association comme une causalité : une corrélation statistique peut exister sans relation causale (exemple du briquet et du cancer). La temporalité (exposition avant la maladie) est le critère de Bradford Hill le plus difficile à contourner.
Ignorer les intervalles de confiance : un OR = 2,0 avec un IC 95 % [0,9 ; 4,5] n'est pas statistiquement significatif. Citer le point central sans l'IC est trompeur.
Confondre biais et variable de confusion : un biais est une erreur méthodologique ; une variable de confusion est une variable réelle qui perturbe l'estimation de l'association. Les deux ont des solutions différentes.
Croire qu'un RR élevé suffit à établir la causalité : la force de l'association est un argument, mais il doit être combiné avec les autres critères de Bradford Hill, notamment la relation temporelle et la plausibilité biologique.

Q&R pour le tuteur IA

Q : Comment interpréter un RR = 0,6 avec un IC 95 % [0,45 ; 0,80] dans une étude sur l'efficacité d'un médicament ? R : Un RR de 0,6 signifie que les patients traités ont 60 % du risque de survenue de l'événement comparé aux non-traités, soit une réduction du risque de 40 %. L'IC 95 % est [0,45 ; 0,80] : il ne contient pas la valeur 1, donc l'association est statistiquement significative au seuil de 5 %. On peut conclure que le traitement est associé à une réduction significative du risque, d'environ 20 à 55 % selon les bornes de l'IC. Un RR < 1 indique un facteur protecteur, ici le médicament.

Q : Qu'est-ce qu'un facteur de confusion et comment le contrôler ? R : Un facteur de confusion est une variable associée à la fois à l'exposition étudiée et à la maladie, indépendamment du lien que l'on cherche à étudier. Il peut créer une association apparente entre l'exposition et la maladie (confusion positive) ou masquer une vraie association (confusion négative). On le contrôle à deux niveaux : lors de la conception de l'étude par la randomisation (ECR), la restriction de l'étude à une strate, ou l'appariement des témoins sur les facteurs confondants connus ; lors de l'analyse statistique par la stratification ou les méthodes multivariables (régression logistique), qui permettent d'ajuster l'estimation de l'association sur les facteurs de confusion mesurés.

Q : Pourquoi la temporalité est-elle le critère de Bradford Hill le plus important ? R : Pour qu'une relation soit causale, la cause doit nécessairement précéder l'effet. Si l'on observe une association entre deux variables sans pouvoir démontrer que l'exposition précède la maladie, toute interprétation causale est impossible. Par exemple, une étude transversale pourrait montrer que les personnes déprimées ont un réseau social plus pauvre. Mais est-ce la dépression qui appauvrit le réseau social, ou l'isolement qui provoque la dépression ? Sans données longitudinales permettant d'établir la séquence temporelle, on ne peut pas trancher. C'est pour cette raison que les études de cohorte (qui suivent les exposés non malades dans le temps) offrent une preuve de temporalité bien plus solide que les études transversales.