Chapitre 3 — Inférence bayésienne, échantillonnage, temps d'attente
Programme officiel — Maths complémentaires, thèmes : "Inférence bayésienne", "Répétition d'expériences indépendantes et échantillonnage", "Temps d'attente".
Inférence bayésienne
Rappel — Formule de Bayes
Pour deux événements et avec et :
Vocabulaire bayésien :
- : probabilité a priori (avant d'observer ).
- : probabilité a posteriori (après avoir observé ).
- : vraisemblance ( sachant ).
- : évidence (probabilité d'observer , calculée par probabilités totales).
Exemple classique : test médical
Une maladie touche 1 % d'une population. Un test détecte la maladie avec sensibilité 95 % (vrai positif si malade) et spécificité 90 % (vrai négatif si non malade).
Quelle est la probabilité d'être réellement malade sachant qu'on a un test positif ?
Notations : = "malade", = "test positif".
- (a priori).
- (sensibilité).
- , donc (faux positifs).
Calcul de par probabilités totales :
Calcul de par Bayes :
Conclusion contre-intuitive : malgré un test positif, la probabilité d'être malade est seulement 8,8 %. La prévalence faible (1 %) écrase la sensibilité du test.
Mise à jour bayésienne
Si on refait un second test indépendant et qu'il est positif aussi :
- Nouvelle a priori : (la précédente a posteriori).
- Nouveau Bayes : .
La probabilité a posteriori se met à jour à chaque nouvelle observation. C'est le principe central de l'inférence bayésienne.
Échantillonnage et loi binomiale
Schéma de Bernoulli
Une épreuve de Bernoulli : expérience à deux issues, succès (proba ) ou échec ().
Un schéma de Bernoulli : répétition de épreuves indépendantes et identiques.
Loi binomiale
= nombre de succès dans le schéma. Alors :
Intervalle de fluctuation à 95 %
Pour avec grand (, , ), la fréquence empirique vérifie :
Usage : tester si une fréquence observée est compatible avec une proportion théorique.
Exemple : un fabricant annonce 10 % de pièces défectueuses. Sur un lot de 400 pièces, on en compte 50 défectueuses. Compatible avec l'annonce ?
- , . Intervalle : .
- Fréquence observée : . Compatible avec l'annonce du fabricant.
Temps d'attente — loi exponentielle
Définition
Une variable aléatoire suit une loi exponentielle de paramètre si sa densité est :
Fonction de répartition :
Espérance
C'est le temps moyen d'attente.
Propriété d'absence de mémoire
Interprétation : si on a déjà attendu minutes, la probabilité d'attendre encore minutes ne dépend pas de . C'est la spécificité de la loi exponentielle.
Applications
- File d'attente (entre deux clients dans un supermarché, deux appels dans un centre d'appels).
- Désintégration radioactive (temps avant désintégration d'un atome).
- Fiabilité (durée de vie sans panne d'un composant).
Exemple
Le temps d'attente entre deux clients dans une boutique suit une loi exponentielle d'espérance 5 minutes.
- .
- .
- .
- (absence de mémoire).
Exercice-type
Énoncé : Dans un labo, le temps d'attente entre deux émissions radioactives suit une loi exponentielle de paramètre (en secondes).
- Calculer l'espérance.
- Calculer et .
- Si on a déjà attendu 2 secondes sans émission, quelle est la probabilité d'attendre encore plus d'une seconde ?
Corrigé :
-
secondes.
-
. .
-
Par absence de mémoire : .
Pièges à éviter
- Confondre densité et probabilité ponctuelle. Pour une variable continue (loi exponentielle), pour tout . On parle uniquement de probabilités d'intervalles.
- Oublier l'absence de mémoire. Ne pas calculer , c'est qu'il faut pour le conditionnel.
- Mauvais paramètre . Si l'espérance est 5 min, alors (pas 5). Inverse de l'espérance.
Q&R pour le tuteur IA
Q : Pourquoi l'inférence bayésienne est-elle "contre-intuitive" pour les tests médicaux ? R : Parce que la prévalence (rareté de la maladie) écrase la sensibilité du test. Si la maladie est rare (1 %) et qu'un test a 10 % de faux positifs, alors la majorité des tests positifs viendront du grand groupe de non-malades (99 % de la population × 10 % de faux positifs = 9,9 %), beaucoup plus que les vrais positifs (1 % × 95 % = 0,95 %).
Q : Quelle différence entre intervalle de fluctuation et intervalle de confiance ? R : Intervalle de fluctuation : connaissant (vraie proportion), je prédis dans quel intervalle se trouvera la fréquence observée. Intervalle de confiance : connaissant la fréquence observée, j'estime dans quel intervalle se trouve la vraie proportion . Inverse l'un de l'autre.
Q : Quand utiliser la loi exponentielle plutôt qu'une autre loi continue ? R : Pour les phénomènes de temps d'attente sans mémoire : intervalle entre 2 émissions radioactives, 2 clients, 2 pannes. Si la situation a une "mémoire" (par exemple un client met d'autant plus de temps à arriver qu'on l'attend), une autre loi (normale, gamma...) serait plus adaptée.