Probabilites conditionnelles – Cours Maths Complementaires

Sommaire

1. Rappels sur les probabilites 2. Probabilite conditionnelle 3. Formule des probabilites totales 4. Arbres ponderes 5. Independance de deux evenements 6. Applications Bilan — Formules essentielles Pieges et contre-exemples

Un test medical et ses faux positifs

Une maladie rare touche 1 personne sur 1 000 dans la population. Un test de depistage existe : lorsqu’une personne est malade, le test est positif dans 99 % des cas. Mais lorsqu’une personne est saine, le test donne un faux positif dans 5 % des cas.

Si une personne obtient un résultat positif, quelle est la probabilite qu’elle soit reellement malade ? La reponse est surprenante…
→ Solution en fin de chapitre.

Le théorème de Bayes (1763)

Le reverend Thomas Bayes (1701–1761), pasteur et mathematicien anglais, a formule un résultat fondamental permettant d’inverser les probabilites conditionnelles. Son travail, publie a titre posthume en 1763 par son ami Richard Price, est reste longtemps meconnu.

Ce n’est qu’au XXe siecle que la statistique bayesienne a pris son essor, devenant un outil central en intelligence artificielle, en medecine (diagnostic), en criminalistique (preuves ADN) et en apprentissage automatique. Aujourd’hui, les filtres anti-spam de votre boite mail utilisent le théorème de Bayes.

Le problème de Monty Hall

Vous participez a un jeu televise. Devant vous, trois portes. Derriere l’une d’elles se trouve une voiture, derriere les deux autres des chevres. Vous choisissez la porte n°1. Le presentateur, qui sait ce qu’il y a derriere chaque porte, ouvre la porte n°3 et montre une chevre.

Devez-vous changer de porte ou garder votre choix initial ? Votre intuition pourrait vous tromper…

→ Solution complète en fin de chapitre

1. Rappels sur les probabilites

Definition — Experience aléatoire

Une experience aléatoire est une experience dont on ne peut pas prevoir le résultat avec certitude. L’ensemble de tous les résultats possibles est appele univers, note \(\Omega\).

Definition — Evenement

Un evenement est une partie (sous-ensemble) de l’univers \(\Omega\). Un evenement qui ne contient qu’un seul résultat est appele evenement elementaire.

Propriete — Axiomes des probabilites

Une probabilite \(P\) sur \(\Omega\) verifie :

Pour tout evenement \(A\) : \(0 \leqslant P(A) \leqslant 1\)
\(P(\Omega) = 1\) et \(P(\emptyset) = 0\)
Pour tout evenement \(A\) : \(P(\bar{A}) = 1 - P(A)\)
Si \(A\) et \(B\) sont incompatibles (\(A \cap B = \emptyset\)) : \(P(A \cup B) = P(A) + P(B)\)

Justification des axiomes

Définition (admise). En Maths Complémentaires, une probabilité est définie axiomatiquement par : \(P : \mathcal{P}(\Omega) \to [0,1]\), \(P(\Omega) = 1\), et \(P\) est additive sur les événements incompatibles (les deux premiers points ci-dessus). Les autres propriétés se déduisent.

\(P(\emptyset) = 0\). Comme \(\Omega = \Omega \cup \emptyset\) et \(\Omega \cap \emptyset = \emptyset\) (incompatibles), par additivité :

\(P(\Omega) = P(\Omega) + P(\emptyset) \Rightarrow P(\emptyset) = 0.\)

\(P(\bar{A}) = 1 - P(A)\). On a \(\Omega = A \cup \bar{A}\) avec \(A \cap \bar{A} = \emptyset\). Par additivité et \(P(\Omega) = 1\) :

\(1 = P(A) + P(\bar{A}) \Rightarrow P(\bar{A}) = 1 - P(A).\)

\(P(A) \leq 1\). D’après le point précédent et \(P(\bar{A}) \ge 0\) : \(P(A) = 1 - P(\bar{A}) \leq 1\). ∎

Propriete — Formule de la reunion

Pour deux evenements quelconques \(A\) et \(B\) : \[P(A \cup B) = P(A) + P(B) - P(A \cap B)\]

Justification

L’evenement \(A \cup B\) se decompose en trois parties disjointes : \(A \cap \bar{B}\), \(\bar{A} \cap B\) et \(A \cap B\). Donc \(P(A \cup B) = P(A \cap \bar{B}) + P(\bar{A} \cap B) + P(A \cap B)\). Or \(P(A) = P(A \cap \bar{B}) + P(A \cap B)\) et \(P(B) = P(\bar{A} \cap B) + P(A \cap B)\), d’ou \(P(A \cap \bar{B}) + P(\bar{A} \cap B) = P(A) + P(B) - 2P(A \cap B)\). En substituant : \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\).

Exemple

On lance un de equilibre a six faces. Soit \(A\) = « obtenir un nombre pair » et \(B\) = « obtenir un nombre superieur a 4 ».

\(A = \{2, 4, 6\}\), \(B = \{5, 6\}\), \(A \cap B = \{6\}\).
\(P(A \cup B) = \frac{3}{6} + \frac{2}{6} - \frac{1}{6} = \frac{4}{6} = \frac{2}{3}\).

2. Probabilite conditionnelle

Definition — Probabilite conditionnelle

Soit \(B\) un evenement de probabilite non nulle. La probabilite conditionnelle de \(A\) sachant \(B\) est : \[P_B(A) = P(A \mid B) = \frac{P(A \cap B)}{P(B)}\] Elle represente la probabilite que \(A\) se realise sachant que \(B\) est realise.

Remarque

Attention a l’ordre : \(P(A \mid B)\) et \(P(B \mid A)\) sont en général differents. Confondre les deux est une erreur frequente (appelee « inversion du conditionnel »).

Exemple

Dans un lycee, 60 % des élèves pratiquent un sport (\(S\)) et 25 % pratiquent un sport et jouent d’un instrument de musique (\(S \cap M\)). Quelle est la probabilite qu’un élève sportif joue aussi d’un instrument ?

\(P(M \mid S) = \frac{P(S \cap M)}{P(S)} = \frac{0{,}25}{0{,}60} = \frac{5}{12} \approx 0{,}417\)

Propriete — Probabilite de l’intersection

Pour deux evenements \(A\) et \(B\) avec \(P(B) > 0\) : \[P(A \cap B) = P(B) \times P(A \mid B) = P(A) \times P(B \mid A)\]

Démonstration

Par définition de la probabilité conditionnelle, si \(P(B) > 0\) :

\(P(A \mid B) = \dfrac{P(A \cap B)}{P(B)}.\)

En multipliant les deux côtés par \(P(B)\) :

\(P(A \cap B) = P(B) \times P(A \mid B).\)

De façon symétrique, si \(P(A) > 0\), en échangeant les rôles de \(A\) et \(B\) :

\(P(A \cap B) = P(B \cap A) = P(A) \times P(B \mid A).\) ∎

Théorème — Formule de Bayes

Si \(P(A) > 0\) et \(P(B) > 0\), alors : \[P(A \mid B) = \frac{P(B \mid A) \times P(A)}{P(B)}\] Cette formule permet d’inverser le conditionnement.

Justification

Par definition : \(P(A \mid B) = \frac{P(A \cap B)}{P(B)}\). Or \(P(A \cap B) = P(B \mid A) \times P(A)\) (propriété de l’intersection). En substituant : \(P(A \mid B) = \frac{P(B \mid A) \times P(A)}{P(B)}\).

3. Formule des probabilites totales

Definition — Partition de l’univers

Les evenements \(A_1, A_2, \ldots, A_n\) forment une partition de \(\Omega\) si :

Ils sont deux a deux incompatibles : \(A_i \cap A_j = \emptyset\) pour \(i \neq j\)
Leur reunion est l’univers : \(A_1 \cup A_2 \cup \cdots \cup A_n = \Omega\)
Chacun est de probabilite non nulle

Théorème — Formule des probabilites totales

Si \(A_1, A_2, \ldots, A_n\) forment une partition de \(\Omega\), alors pour tout evenement \(B\) : \[P(B) = \sum_{i=1}^{n} P(A_i) \times P(B \mid A_i)\]

Cas particulier avec \(A\) et \(\bar{A}\) :

\[P(B) = P(A) \times P(B \mid A) + P(\bar{A}) \times P(B \mid \bar{A})\]

Justification

Comme \(A_1, \ldots, A_n\) forment une partition de \(\Omega\), l’evenement \(B\) se decompose en : \(B = (B \cap A_1) \cup (B \cap A_2) \cup \cdots \cup (B \cap A_n)\).

Ces evenements sont deux a deux incompatibles (car les \(A_i\) le sont), donc : \(P(B) = \sum_{i=1}^{n} P(B \cap A_i) = \sum_{i=1}^{n} P(A_i) \times P(B \mid A_i)\).

Exemple

Une usine possede deux machines. La machine M1 produit 70 % des pieces et la machine M2 produit 30 %. Le taux de pieces defectueuses est de 2 % pour M1 et de 5 % pour M2. On prend une piece au hasard.

\(P(D) = P(\text{M1}) \times P(D \mid \text{M1}) + P(\text{M2}) \times P(D \mid \text{M2})\)

\(P(D) = 0{,}70 \times 0{,}02 + 0{,}30 \times 0{,}05 = 0{,}014 + 0{,}015 = 0{,}029\)

Soit 2,9 % de pieces defectueuses au total.

Méthode — Appliquer Bayes avec les probabilites totales

En reprenant l’exemple ci-dessus : si une piece est defectueuse, de quelle machine provient-elle le plus probablement ?

\(P(\text{M2} \mid D) = \frac{P(D \mid \text{M2}) \times P(\text{M2})}{P(D)} = \frac{0{,}05 \times 0{,}30}{0{,}029} = \frac{0{,}015}{0{,}029} \approx 0{,}517\)

Malgre sa plus faible production, la machine M2 est a l’origine de plus de la moitie des pieces defectueuses.

4. Arbres ponderes

Definition — Arbre pondere

Un arbre pondere est un arbre ou chaque branche porte une probabilite (conditionnelle). Il permet de representer des experiences successives ou des situations a plusieurs etapes.

Propriete — Règles de calcul dans un arbre

Règle du produit : la probabilite d’un chemin est le produit des probabilites le long de ses branches.
Règle de la somme : la probabilite d’un evenement est la somme des probabilites de tous les chemins y menant (c’est la formule des probabilites totales).
La somme des probabilites des branches issues d’un meme nœud vaut 1.

Démonstration

Règle du produit. Un chemin de l’arbre correspond à une suite d’événements \(A_1, A_2, \ldots, A_k\) successifs. Par application répétée de la formule \(P(A \cap B) = P(A) \cdot P(B \mid A)\) :

\(P(A_1 \cap A_2 \cap \cdots \cap A_k) = P(A_1) \cdot P(A_2 \mid A_1) \cdot P(A_3 \mid A_1 \cap A_2) \cdots.\)

Les probabilités le long des branches sont exactement \(P(A_1), P(A_2 \mid A_1), \ldots\). Donc la probabilité du chemin est le produit de ces pondérations.

Règle de la somme. Un événement \(E\) est la réunion de tous les chemins qui y mènent. Ces chemins correspondent à des événements incompatibles (un résultat suit un seul chemin). Par additivité de la probabilité :

\(P(E) = \sum_{\text{chemins} \to E} P(\text{chemin}).\)

C’est la formule des probabilités totales appliquée à la partition naturelle fournie par l’arbre.

Somme des branches = 1. En un nœud \(N\) correspondant à l’événement déjà réalisé \(A\), les branches sortantes représentent une partition \(B_1, \ldots, B_n\) de \(\Omega\) (événements exhaustifs et incompatibles). Les pondérations sont \(P(B_i \mid A)\), et :

\(\sum_i P(B_i \mid A) = P(\Omega \mid A) = 1.\) ∎

Exemple — Arbre de l’usine

Reprenons l’exemple des deux machines. L’arbre se lit ainsi :

Branche M1 (0,70) → D (0,02) : chemin M1 et D → \(0{,}70 \times 0{,}02 = 0{,}014\)
Branche M1 (0,70) → \(\bar{D}\) (0,98) : chemin M1 et \(\bar{D}\) → \(0{,}70 \times 0{,}98 = 0{,}686\)
Branche M2 (0,30) → D (0,05) : chemin M2 et D → \(0{,}30 \times 0{,}05 = 0{,}015\)
Branche M2 (0,30) → \(\bar{D}\) (0,95) : chemin M2 et \(\bar{D}\) → \(0{,}30 \times 0{,}95 = 0{,}285\)

Verification : \(0{,}014 + 0{,}686 + 0{,}015 + 0{,}285 = 1\). ✓

Méthode — Construire un arbre pondere

Identifier les etapes successives (le premier « embranchement », puis le second, etc.).
Placer les probabilites sur les branches du premier niveau.
Placer les probabilites conditionnelles sur les branches du second niveau.
Verifier que la somme des branches issues de chaque nœud vaut 1.
Calculer la probabilite de chaque chemin en multipliant le long des branches.

5. Independance de deux evenements

Definition — Evenements independants

Deux evenements \(A\) et \(B\) sont independants si et seulement si : \[P(A \cap B) = P(A) \times P(B)\]

Propriete — Caracterisation equivalente

Si \(P(B) > 0\), les evenements \(A\) et \(B\) sont independants si et seulement si : \[P(A \mid B) = P(A)\] Cela signifie que savoir que \(B\) est realise ne change pas la probabilite de \(A\).

Démonstration

Supposons \(P(B) > 0\).

Sens \(\Rightarrow\) Si \(A\) et \(B\) sont indépendants, alors \(P(A \cap B) = P(A) \times P(B)\). En divisant par \(P(B) > 0\) :

\(P(A \mid B) = \dfrac{P(A \cap B)}{P(B)} = \dfrac{P(A)\,P(B)}{P(B)} = P(A).\)

Sens \(\Leftarrow\) Réciproquement, si \(P(A \mid B) = P(A)\), alors par la formule \(P(A \cap B) = P(B) \cdot P(A \mid B)\) :

\(P(A \cap B) = P(B) \times P(A) = P(A) \times P(B).\)

C’est exactement la définition de l’indépendance. ∎

Remarque importante

Independant ≠ incompatible. Deux evenements incompatibles (\(A \cap B = \emptyset\)) de probabilites non nulles ne sont jamais independants, car \(P(A \cap B) = 0 \neq P(A) \times P(B)\).

Exemple

On lance deux des equilibres. Soit \(A\) = « le premier de donne 6 » et \(B\) = « la somme des deux des vaut 8 ».

\(P(A) = \frac{1}{6}\), \(P(B) = \frac{5}{36}\) (les couples donnant 8 : (2,6), (3,5), (4,4), (5,3), (6,2)).

\(A \cap B\) = « le premier de donne 6 et la somme vaut 8 » = {(6,2)}, donc \(P(A \cap B) = \frac{1}{36}\).

Or \(P(A) \times P(B) = \frac{1}{6} \times \frac{5}{36} = \frac{5}{216} \neq \frac{1}{36} = \frac{6}{216}\).

Donc \(A\) et \(B\) ne sont pas independants.

Propriete — Independance et complementaire

Si \(A\) et \(B\) sont independants, alors \(A\) et \(\bar{B}\) sont aussi independants (de meme \(\bar{A}\) et \(B\), et \(\bar{A}\) et \(\bar{B}\)).

Justification

Montrons que \(P(A \cap \bar{B}) = P(A) \times P(\bar{B})\). On sait que \(A = (A \cap B) \cup (A \cap \bar{B})\) (evenements incompatibles), donc \(P(A) = P(A \cap B) + P(A \cap \bar{B})\).

D’ou \(P(A \cap \bar{B}) = P(A) - P(A \cap B) = P(A) - P(A) \times P(B)\) (par independance de \(A\) et \(B\)).

Soit \(P(A \cap \bar{B}) = P(A)(1 - P(B)) = P(A) \times P(\bar{B})\). Les autres cas se traitent de meme.

6. Applications

6.1 Tests medicaux

Vocabulaire — Tests diagnostiques

Pour un test medical :

Sensibilite : \(P(\text{test +} \mid \text{malade})\) — capacite a detecter les malades
Specificite : \(P(\text{test -} \mid \text{sain})\) — capacite a identifier les sains
Valeur predictive positive (VPP) : \(P(\text{malade} \mid \text{test +})\)
Faux positif : test positif alors que la personne est saine
Faux négatif : test négatif alors que la personne est malade

Exemple — Depistage d’une maladie rare

Prevalence : \(P(M) = 0{,}001\). Sensibilite : \(P(+ \mid M) = 0{,}99\). Specificite : \(P(- \mid \bar{M}) = 0{,}95\).

Par la formule des probabilites totales :

\(P(+) = P(M) \times P(+ \mid M) + P(\bar{M}) \times P(+ \mid \bar{M})\)

\(P(+) = 0{,}001 \times 0{,}99 + 0{,}999 \times 0{,}05 = 0{,}00099 + 0{,}04995 = 0{,}05094\)

Par Bayes : \(P(M \mid +) = \frac{0{,}00099}{0{,}05094} \approx 0{,}019 = 1{,}9\,\%\)

Seulement 1,9 % des personnes testees positives sont reellement malades. Ce résultat contre-intuitif s’explique par la rarete de la maladie.

6.2 Fiabilite de systèmes

Méthode — Systemes en serie et en parallele

Pour des composants independants de fiabilites \(p_1, p_2, \ldots, p_n\) :

En serie (tous doivent fonctionner) : \(P(\text{système OK}) = p_1 \times p_2 \times \cdots \times p_n\)
En parallele (au moins un doit fonctionner) : \(P(\text{système OK}) = 1 - (1 - p_1)(1 - p_2) \cdots (1 - p_n)\)

Exemple

Un système comporte deux composants independants, chacun de fiabilite 0,9.

En serie : \(P = 0{,}9 \times 0{,}9 = 0{,}81\).

En parallele : \(P = 1 - (1 - 0{,}9)^2 = 1 - 0{,}01 = 0{,}99\).

Le montage en parallele (redondance) ameliore considerablement la fiabilite.

Bilan — Formules essentielles

Notion	Formule
Probabilite conditionnelle	\(P(A \mid B) = \frac{P(A \cap B)}{P(B)}\)
Intersection	\(P(A \cap B) = P(B) \times P(A \mid B)\)
Formule de Bayes	\(P(A \mid B) = \frac{P(B \mid A) \times P(A)}{P(B)}\)
Probabilites totales	\(P(B) = P(A) \cdot P(B \mid A) + P(\bar{A}) \cdot P(B \mid \bar{A})\)
Independance	\(P(A \cap B) = P(A) \times P(B)\)
Fiabilite en serie	\(P = p_1 \times p_2 \times \cdots \times p_n\)
Fiabilite en parallele	\(P = 1 - (1-p_1)(1-p_2)\cdots(1-p_n)\)

Solution du problème d’ouverture — Test medical et faux positifs

On note \(M\) = « etre malade » et \(+\) = « test positif ». On a : \(P(M) = 0{,}001\), \(P(+ \mid M) = 0{,}99\), \(P(+ \mid \bar{M}) = 0{,}05\).

Par les probabilites totales : \(P(+) = 0{,}001 \times 0{,}99 + 0{,}999 \times 0{,}05 = 0{,}05094\).

Par Bayes : \(P(M \mid +) = \frac{0{,}00099}{0{,}05094} \approx 1{,}9\,\%\).

Malgre un test fiable a 99 %, une personne testee positive n’a que 1,9 % de chances d’etre reellement malade. Ce paradoxe apparent vient du fait que les faux positifs parmi les 999 personnes saines sont beaucoup plus nombreux que les vrais positifs parmi la seule personne malade (sur 1 000).

Solution de l’énigme — Le problème de Monty Hall

Il faut changer de porte. En gardant votre choix, la probabilite de gagner est \(\frac{1}{3}\). En changeant, elle passe a \(\frac{2}{3}\).

Explication : au depart, la voiture est derriere votre porte avec une probabilite de \(\frac{1}{3}\), et derriere l’une des deux autres avec une probabilite de \(\frac{2}{3}\). Quand le presentateur ouvre une porte perdante, toute la probabilite \(\frac{2}{3}\) se concentre sur la porte restante.

C’est un exemple celebre ou la probabilite conditionnelle contredit notre intuition.

Pieges et contre-exemples

Probabilites conditionnelles : teste d’abord ton intuition.

Score : 0 / 6 pieges identifies

1 Confusion conditionnelle

« \(P(A \mid B) = P(B \mid A)\). »

Cette affirmation est-elle correcte ?

Explication

Faux. C’est l’erreur du procureur ! \(P(\text{malade} \mid \text{positif}) \neq P(\text{positif} \mid \text{malade})\). La formule de Bayes relie les deux.

Si 99 % des malades sont positifs, ca ne veut pas dire que 99 % des positifs sont malades.

Mini-test : 80 % des fumeurs toussent. 30 % de la population fume. P(fumeur | tousse) = 80 % ?

2 Independance et incompatibilite

« Si \(A\) et \(B\) sont independants, alors ils sont incompatibles. »

Cette affirmation est-elle correcte ?

Explication

Faux. Independance : \(P(A \cap B) = P(A) \times P(B)\). Incompatibilite : \(P(A \cap B) = 0\). Si \(P(A) > 0\) et \(P(B) > 0\), les deux notions s’excluent mutuellement !

Independants = « l’un n’influence pas l’autre ». Incompatibles = « les deux ne peuvent pas se produire en meme temps ».

Mini-test : pile et face au meme lancer sont :

3 Multiplication des probabilites

« \(P(A \cap B) = P(A) \times P(B)\) toujours. »

Cette affirmation est-elle correcte ?

Explication

Faux. Cette formule n’est valable que si \(A\) et \(B\) sont independants. En général, \(P(A \cap B) = P(A) \times P(B \mid A)\).

Toujours verifier l’independance avant de multiplier directement.

Mini-test : tirage de 2 cartes sans remise. P(2 as) = \(\frac{4}{52} \times \frac{4}{52}\) ?

4 Arbre et sens de lecture

« Dans un arbre de probabilites, on additionne les probabilites le long d’une branche. »

Cette affirmation est-elle correcte ?

Explication

Faux. Le long d’une branche, on multiplie. On additionne seulement les branches qui menent a un meme evenement (probabilites totales).

Branche = multiplication. Reunion de branches = addition.

Mini-test : branche M puis + avec \(P(M) = 0{,}01\) et \(P(+|M) = 0{,}99\). \(P(M \cap +) = ?\)

5 Addition des probabilites

« \(P(A \cup B) = P(A) + P(B)\). »

Cette affirmation est-elle correcte ?

Explication

Faux (en général). La formule correcte est \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\). L’egalite sans le \(-P(A \cap B)\) n’est valable que si \(A\) et \(B\) sont incompatibles.

Toujours retrancher l’intersection pour eviter de compter deux fois.

Mini-test : \(P(A) = 0{,}6\), \(P(B) = 0{,}5\), \(P(A \cap B) = 0{,}2\). \(P(A \cup B) = ?\)

6 Formule de Bayes

« \(P(A \mid B) = \dfrac{P(B \mid A) \cdot P(A)}{P(B)}\). »

Cette affirmation est-elle correcte ?

Explication

C’est vrai ! C’est la formule de Bayes, outil fondamental pour « inverser » les probabilites conditionnelles.

Bayes = « retourner l’arbre ». On passe de \(P(B|A)\) a \(P(A|B)\).

Mini-test : Bayes permet de calculer la probabilite qu’un patient soit malade sachant que son test est positif. C’est :

➡️ Pour la suite

Ch. 8 — Lois de probabilité — Tu formaliseras la loi binomiale et initieras aux lois continues.

Chapitre 7 — Probabilites conditionnelles

Un test medical et ses faux positifs

Le théorème de Bayes (1763)

Le problème de Monty Hall

1. Rappels sur les probabilites

2. Probabilite conditionnelle

3. Formule des probabilites totales

4. Arbres ponderes

5. Independance de deux evenements

6. Applications

6.1 Tests medicaux

6.2 Fiabilite de systèmes

Bilan — Formules essentielles

Pieges et contre-exemples