IFSI Santé publique et épidémiologie

Mesures d'association, biais et causalité

Cadre programme : référentiel infirmier 2026 (arrêté du 20 février 2026), Domaine C, UE C.1 « Santé publique, promotion de la santé et éducation thérapeutique ». Correspond à l'ex-UE 1.2 (référentiel 2009).

Pourquoi c'est central pour l'IDE : comprendre les mesures d'association, les biais et les critères de causalité permet à l'infirmier de lire de façon critique les études épidémiologiques, de ne pas tirer de conclusions hâtives et de distinguer une corrélation statistique d'une relation de cause à effet.

1. Les mesures d'association

Une mesure d'association quantifie la force du lien statistique entre un facteur d'exposition et l'apparition d'une maladie. Les deux mesures principales sont le risque relatif et l'odds ratio.

1.1 Le risque relatif (RR)

Le risque relatif (RR) est utilisé dans les études de cohorte. Il compare le risque (incidence cumulée) de développer la maladie chez les exposés à celui chez les non-exposés.

RR = Incidence chez les exposés / Incidence chez les non-exposés

On construit un tableau de contingence 2×2 :

Maladie présenteMaladie absenteTotal
Exposésaba+b
Non-exposéscdc+d
Incidence chez les exposés = a / (a+b)
Incidence chez les non-exposés = c / (c+d)
RR = [a/(a+b)] / [c/(c+d)]

Interprétation :

Valeur de RRInterprétation
RR = 1Aucune association (même risque dans les deux groupes)
RR > 1Facteur de risque : les exposés ont un risque plus élevé
RR < 1Facteur protecteur : les exposés ont un risque plus faible

Exemple : si le RR du tabac pour le cancer du poumon est de 15, un fumeur a 15 fois plus de risque de développer un cancer du poumon qu'un non-fumeur.

1.2 L'odds ratio (OR)

L'odds ratio (OR) est utilisé dans les études cas-témoins (et souvent dans les régressions logistiques). Il compare les cotes (odds) d'exposition chez les malades (cas) et chez les non-malades (témoins).

OR = (a × d) / (b × c)

(avec le même tableau 2×2 que ci-dessus)

Interprétation :

L'OR s'interprète de la même façon que le RR :

  • OR = 1 : pas d'association.
  • OR > 1 : facteur de risque.
  • OR < 1 : facteur protecteur.

L'OR est une approximation du RR lorsque la maladie est rare (prévalence < 10 %). Quand la maladie est fréquente, l'OR surestime (ou sous-estime) le RR.

1.3 La différence de risque (risque attribuable)

Le risque attribuable (ou différence de risque) mesure l'excès de risque absolu lié à l'exposition :

RA = Incidence exposés - Incidence non-exposés

Il exprime la part du risque qui serait éliminée si l'exposition était supprimée. C'est un indicateur utile pour les décisions de santé publique (combien de cas évitables ?).

Exemple : si l'incidence de l'infarctus est de 5 % chez les fumeurs et de 1 % chez les non-fumeurs, le risque attribuable est de 4 % : sur 100 fumeurs, 4 infarctus sont directement attribuables au tabac.

Mnémo : RR = Rapport des Risques (cohorte) ; OR = Odds Ratio (cas-témoins). Le R de RR = R de Risque = R de cohoRte.

2. Les intervalles de confiance et la signification statistique

Un résultat épidémiologique est toujours accompagné d'un intervalle de confiance à 95 % (IC 95 %) : il indique la plage de valeurs dans laquelle on peut espérer que la vraie valeur du paramètre se trouve dans 95 % des études similaires.

  • Si l'IC 95 % du RR ou de l'OR ne contient pas la valeur 1 (ex. : IC [1,2 ; 3,5]), l'association est statistiquement significative au seuil de 5 %.
  • Si l'IC 95 % contient la valeur 1 (ex. : IC [0,8 ; 2,1]), on ne peut pas conclure à une association significative.

En pratique : face à une étude citant un RR = 1,8 [IC 95 % : 0,9 ; 3,6], ne pas conclure à un risque augmenté : l'IC contient 1 → résultat non significatif.

3. Les biais épidémiologiques

Un biais est une erreur systématique dans la conception, la réalisation ou l'analyse d'une étude qui aboutit à une estimation faussée de l'association. Les biais ne se corrigent pas par l'augmentation de la taille de l'échantillon (contrairement aux erreurs aléatoires).

3.1 Les biais de sélection

Ils surviennent quand les participants de l'étude ne sont pas représentatifs de la population cible, ou quand la comparabilité entre groupes est compromise.

Exemples :

  • Biais de Berkson : biais d'hospitalisation où les patients hospitalisés ont un profil différent de la population générale (comorbidités, accès aux soins).
  • Biais de l'immigrant en bonne santé : les migrants sont en meilleure santé à l'arrivée que la population générale du pays d'accueil car seuls les individus en bonne santé migrent.
  • Biais de participation : les volontaires pour une étude sont différents des non-participants.

3.2 Les biais d'information (ou de mesure)

Ils surviennent quand l'information sur l'exposition ou la maladie est recueillie de façon différente ou imprécise.

Exemples :

  • Biais de mémorisation (recall bias) : les cas (malades) se souviennent mieux ou différemment de leurs expositions passées que les témoins (non-malades). Fréquent dans les études cas-témoins rétrospectives.
  • Biais de classement différentiel : l'exposition (ou la maladie) est mesurée avec une précision différente dans les deux groupes.
  • Biais de l'intervieweur : l'enquêteur, connaissant l'hypothèse, pose des questions de façon différente selon le groupe (réduit par le double aveugle).

3.3 Le facteur de confusion (biais de confusion)

Le facteur de confusion (ou confondu) est une variable qui :

  1. est associée à l'exposition étudiée,
  2. est associée à la maladie (indépendamment de l'exposition),
  3. n'est pas sur le chemin causal entre exposition et maladie.

Exemple classique : une étude observe que les personnes qui portent des briquets ont plus de cancer du poumon. Le briquet est associé au tabagisme (exposition réelle), lui-même associé au cancer. Le briquet est un confondu, pas une cause.

Contrôle du facteur de confusion :

ÉtapeMéthode
Conception de l'étudeRandomisation (ECR), restriction, appariement des témoins
Analyse statistiqueStratification (méthode de Mantel-Haenszel), régression logistique, ajustement multivariable

4. Association et causalité

Établir une association statistique entre un facteur et une maladie ne suffit pas à conclure à une relation causale. Plusieurs critères, regroupés dans les critères de Bradford Hill (1965), permettent d'argumenter en faveur d'une causalité.

4.1 Les critères de Bradford Hill (1965)

Sir Austin Bradford Hill a formulé neuf critères, dont les principaux sont :

CritèreDescriptionExemple (tabac et cancer du poumon)
Force de l'associationRR ou OR élevéRR ~ 15 pour les fumeurs
Cohérence (reproductibilité)Résultats similaires dans d'autres études, d'autres paysConfirmé dans de nombreuses cohortes
SpécificitéLe facteur cause surtout cette maladieTabac associé principalement aux cancers épithéliaux
Relation temporelleL'exposition précède la maladieTabagisme commencé avant le diagnostic
Relation dose-effetPlus l'exposition est forte, plus le risque est élevéPlus on fume (paquet-années), plus le risque est élevé
Plausibilité biologiqueMécanisme biologique connu ou plausibleLes carcinogènes du tabac mutent les cellules épithéliales bronchiques
Cohérence avec la connaissanceNe contredit pas les connaissances biologiques établiesCohérent avec la biologie des cancers
Preuve expérimentaleL'élimination du facteur réduit la maladieArrêt du tabac diminue le risque de cancer
AnalogieRelation similaire connue pour un facteur analogueAutres carcinogènes inhalés (amiante) causent aussi des cancers pulmonaires

Aucun critère n'est à lui seul suffisant. C'est la convergence de plusieurs critères qui argue en faveur de la causalité.

En pratique : quand un média annonce « X cause Y », l'IDE vérifie : s'agit-il d'une association observationnelle ou d'un essai ? Le RR est-il élevé ? L'exposition précède-t-elle bien la maladie ?

4.2 La triangulation

La triangulation est l'utilisation de plusieurs designs d'études différents pour tester la même hypothèse causale. Si des études de cohortes, des études cas-témoins, des études de randomisation mendélienne et des essais randomisés convergent vers le même résultat, l'argument causal est beaucoup plus solide.

Vocabulaire essentiel

  • Risque relatif (RR) : rapport de l'incidence chez les exposés sur l'incidence chez les non-exposés ; utilisé dans les cohortes.
  • Odds ratio (OR) : rapport des cotes d'exposition chez les cas sur les cotes chez les témoins ; utilisé dans les cas-témoins.
  • Risque attribuable (RA) : différence absolue d'incidence entre exposés et non-exposés.
  • Intervalle de confiance à 95 % (IC 95 %) : plage contenant la vraie valeur dans 95 % des études similaires.
  • Biais : erreur systématique faussant l'estimation de l'association.
  • Biais de sélection : les participants ne sont pas représentatifs de la population cible.
  • Biais d'information : la mesure de l'exposition ou de la maladie est imprécise ou différentielle.
  • Biais de mémorisation (recall bias) : les cas se souviennent différemment de leur exposition passée.
  • Facteur de confusion : variable associée à la fois à l'exposition et à la maladie, masquant ou simulant une association.
  • Critères de Bradford Hill : neuf critères argumentant en faveur d'une relation causale (1965).

Points clés à retenir

  1. Le RR est la mesure d'association des études de cohorte ; l'OR est celle des études cas-témoins. L'OR approche le RR quand la maladie est rare.
  2. Un RR ou OR de 1 signifie aucune association ; supérieur à 1 = facteur de risque ; inférieur à 1 = facteur protecteur.
  3. Un IC 95 % qui contient la valeur 1 indique que l'association n'est pas statistiquement significative.
  4. Les biais sont des erreurs systématiques qui faussent les résultats ; ils ne sont pas réductibles par une plus grande taille d'échantillon.
  5. Le facteur de confusion est une variable tierce qui peut simuler ou masquer une association.
  6. Une association statistique ne prouve pas la causalité : les critères de Bradford Hill (notamment la temporalité, la dose-effet et la plausibilité biologique) sont nécessaires pour argumenter en faveur d'un lien causal.

Pièges fréquents

  1. Confondre RR et OR : le RR est un rapport de risques (incidences), calculable uniquement quand on connaît les incidences dans les deux groupes (cohorte). L'OR est un rapport de cotes, utilisé dans les cas-témoins où l'on ne connaît pas l'incidence directement.
  2. Interpréter une association comme une causalité : une corrélation statistique peut exister sans relation causale (exemple du briquet et du cancer). La temporalité (exposition avant la maladie) est le critère de Bradford Hill le plus difficile à contourner.
  3. Ignorer les intervalles de confiance : un OR = 2,0 avec un IC 95 % [0,9 ; 4,5] n'est pas statistiquement significatif. Citer le point central sans l'IC est trompeur.
  4. Confondre biais et variable de confusion : un biais est une erreur méthodologique ; une variable de confusion est une variable réelle qui perturbe l'estimation de l'association. Les deux ont des solutions différentes.
  5. Croire qu'un RR élevé suffit à établir la causalité : la force de l'association est un argument, mais il doit être combiné avec les autres critères de Bradford Hill, notamment la relation temporelle et la plausibilité biologique.

Q&R pour le tuteur IA

Q : Comment interpréter un RR = 0,6 avec un IC 95 % [0,45 ; 0,80] dans une étude sur l'efficacité d'un médicament ? R : Un RR de 0,6 signifie que les patients traités ont 60 % du risque de survenue de l'événement comparé aux non-traités, soit une réduction du risque de 40 %. L'IC 95 % est [0,45 ; 0,80] : il ne contient pas la valeur 1, donc l'association est statistiquement significative au seuil de 5 %. On peut conclure que le traitement est associé à une réduction significative du risque, d'environ 20 à 55 % selon les bornes de l'IC. Un RR < 1 indique un facteur protecteur, ici le médicament.

Q : Qu'est-ce qu'un facteur de confusion et comment le contrôler ? R : Un facteur de confusion est une variable associée à la fois à l'exposition étudiée et à la maladie, indépendamment du lien que l'on cherche à étudier. Il peut créer une association apparente entre l'exposition et la maladie (confusion positive) ou masquer une vraie association (confusion négative). On le contrôle à deux niveaux : lors de la conception de l'étude par la randomisation (ECR), la restriction de l'étude à une strate, ou l'appariement des témoins sur les facteurs confondants connus ; lors de l'analyse statistique par la stratification ou les méthodes multivariables (régression logistique), qui permettent d'ajuster l'estimation de l'association sur les facteurs de confusion mesurés.

Q : Pourquoi la temporalité est-elle le critère de Bradford Hill le plus important ? R : Pour qu'une relation soit causale, la cause doit nécessairement précéder l'effet. Si l'on observe une association entre deux variables sans pouvoir démontrer que l'exposition précède la maladie, toute interprétation causale est impossible. Par exemple, une étude transversale pourrait montrer que les personnes déprimées ont un réseau social plus pauvre. Mais est-ce la dépression qui appauvrit le réseau social, ou l'isolement qui provoque la dépression ? Sans données longitudinales permettant d'établir la séquence temporelle, on ne peut pas trancher. C'est pour cette raison que les études de cohorte (qui suivent les exposés non malades dans le temps) offrent une preuve de temporalité bien plus solide que les études transversales.

Cette fiche fait partie du kit

IFSI Santé publique et épidémiologie

Tu as lu la fiche. La science est claire : se tester multiplie par 3 ta rétention. Active le Kit pour générer quiz, flashcards et chatter avec le Tuteur IA sur cette fiche.

Réviser ce Kit · 15 jetons