Terminale Maths Complementaires — Programme officiel · Math@mine
Une maladie rare touche 1 personne sur 1 000 dans la population. Un test de depistage existe : lorsqu’une personne est malade, le test est positif dans 99 % des cas. Mais lorsqu’une personne est saine, le test donne un faux positif dans 5 % des cas.
Le reverend Thomas Bayes (1701–1761), pasteur et mathematicien anglais, a formule un résultat fondamental permettant d’inverser les probabilites conditionnelles. Son travail, publie a titre posthume en 1763 par son ami Richard Price, est reste longtemps meconnu.
Ce n’est qu’au XXe siecle que la statistique bayesienne a pris son essor, devenant un outil central en intelligence artificielle, en medecine (diagnostic), en criminalistique (preuves ADN) et en apprentissage automatique. Aujourd’hui, les filtres anti-spam de votre boite mail utilisent le théorème de Bayes.
Vous participez a un jeu televise. Devant vous, trois portes. Derriere l’une d’elles se trouve une voiture, derriere les deux autres des chevres. Vous choisissez la porte n°1. Le presentateur, qui sait ce qu’il y a derriere chaque porte, ouvre la porte n°3 et montre une chevre.
Définition (admise). En Maths Complémentaires, une probabilité est définie axiomatiquement par : \(P : \mathcal{P}(\Omega) \to [0,1]\), \(P(\Omega) = 1\), et \(P\) est additive sur les événements incompatibles (les deux premiers points ci-dessus). Les autres propriétés se déduisent.
\(P(\emptyset) = 0\). Comme \(\Omega = \Omega \cup \emptyset\) et \(\Omega \cap \emptyset = \emptyset\) (incompatibles), par additivité :
\(P(\Omega) = P(\Omega) + P(\emptyset) \Rightarrow P(\emptyset) = 0.\)
\(P(\bar{A}) = 1 - P(A)\). On a \(\Omega = A \cup \bar{A}\) avec \(A \cap \bar{A} = \emptyset\). Par additivité et \(P(\Omega) = 1\) :
\(1 = P(A) + P(\bar{A}) \Rightarrow P(\bar{A}) = 1 - P(A).\)
\(P(A) \leq 1\). D’après le point précédent et \(P(\bar{A}) \ge 0\) : \(P(A) = 1 - P(\bar{A}) \leq 1\). ∎
L’evenement \(A \cup B\) se decompose en trois parties disjointes : \(A \cap \bar{B}\), \(\bar{A} \cap B\) et \(A \cap B\). Donc \(P(A \cup B) = P(A \cap \bar{B}) + P(\bar{A} \cap B) + P(A \cap B)\). Or \(P(A) = P(A \cap \bar{B}) + P(A \cap B)\) et \(P(B) = P(\bar{A} \cap B) + P(A \cap B)\), d’ou \(P(A \cap \bar{B}) + P(\bar{A} \cap B) = P(A) + P(B) - 2P(A \cap B)\). En substituant : \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\).
Dans un lycee, 60 % des élèves pratiquent un sport (\(S\)) et 25 % pratiquent un sport et jouent d’un instrument de musique (\(S \cap M\)). Quelle est la probabilite qu’un élève sportif joue aussi d’un instrument ?
\(P(M \mid S) = \frac{P(S \cap M)}{P(S)} = \frac{0{,}25}{0{,}60} = \frac{5}{12} \approx 0{,}417\)
Par définition de la probabilité conditionnelle, si \(P(B) > 0\) :
\(P(A \mid B) = \dfrac{P(A \cap B)}{P(B)}.\)
En multipliant les deux côtés par \(P(B)\) :
\(P(A \cap B) = P(B) \times P(A \mid B).\)
De façon symétrique, si \(P(A) > 0\), en échangeant les rôles de \(A\) et \(B\) :
\(P(A \cap B) = P(B \cap A) = P(A) \times P(B \mid A).\) ∎
Par definition : \(P(A \mid B) = \frac{P(A \cap B)}{P(B)}\). Or \(P(A \cap B) = P(B \mid A) \times P(A)\) (propriété de l’intersection). En substituant : \(P(A \mid B) = \frac{P(B \mid A) \times P(A)}{P(B)}\).
Cas particulier avec \(A\) et \(\bar{A}\) :
\[P(B) = P(A) \times P(B \mid A) + P(\bar{A}) \times P(B \mid \bar{A})\]Comme \(A_1, \ldots, A_n\) forment une partition de \(\Omega\), l’evenement \(B\) se decompose en : \(B = (B \cap A_1) \cup (B \cap A_2) \cup \cdots \cup (B \cap A_n)\).
Ces evenements sont deux a deux incompatibles (car les \(A_i\) le sont), donc : \(P(B) = \sum_{i=1}^{n} P(B \cap A_i) = \sum_{i=1}^{n} P(A_i) \times P(B \mid A_i)\).
Une usine possede deux machines. La machine M1 produit 70 % des pieces et la machine M2 produit 30 %. Le taux de pieces defectueuses est de 2 % pour M1 et de 5 % pour M2. On prend une piece au hasard.
\(P(D) = P(\text{M1}) \times P(D \mid \text{M1}) + P(\text{M2}) \times P(D \mid \text{M2})\)
\(P(D) = 0{,}70 \times 0{,}02 + 0{,}30 \times 0{,}05 = 0{,}014 + 0{,}015 = 0{,}029\)
Soit 2,9 % de pieces defectueuses au total.
En reprenant l’exemple ci-dessus : si une piece est defectueuse, de quelle machine provient-elle le plus probablement ?
\(P(\text{M2} \mid D) = \frac{P(D \mid \text{M2}) \times P(\text{M2})}{P(D)} = \frac{0{,}05 \times 0{,}30}{0{,}029} = \frac{0{,}015}{0{,}029} \approx 0{,}517\)
Malgre sa plus faible production, la machine M2 est a l’origine de plus de la moitie des pieces defectueuses.
Règle du produit. Un chemin de l’arbre correspond à une suite d’événements \(A_1, A_2, \ldots, A_k\) successifs. Par application répétée de la formule \(P(A \cap B) = P(A) \cdot P(B \mid A)\) :
\(P(A_1 \cap A_2 \cap \cdots \cap A_k) = P(A_1) \cdot P(A_2 \mid A_1) \cdot P(A_3 \mid A_1 \cap A_2) \cdots.\)
Les probabilités le long des branches sont exactement \(P(A_1), P(A_2 \mid A_1), \ldots\). Donc la probabilité du chemin est le produit de ces pondérations.
Règle de la somme. Un événement \(E\) est la réunion de tous les chemins qui y mènent. Ces chemins correspondent à des événements incompatibles (un résultat suit un seul chemin). Par additivité de la probabilité :
\(P(E) = \sum_{\text{chemins} \to E} P(\text{chemin}).\)
C’est la formule des probabilités totales appliquée à la partition naturelle fournie par l’arbre.
Somme des branches = 1. En un nœud \(N\) correspondant à l’événement déjà réalisé \(A\), les branches sortantes représentent une partition \(B_1, \ldots, B_n\) de \(\Omega\) (événements exhaustifs et incompatibles). Les pondérations sont \(P(B_i \mid A)\), et :
\(\sum_i P(B_i \mid A) = P(\Omega \mid A) = 1.\) ∎
Reprenons l’exemple des deux machines. L’arbre se lit ainsi :
Verification : \(0{,}014 + 0{,}686 + 0{,}015 + 0{,}285 = 1\). ✓
Supposons \(P(B) > 0\).
Sens \(\Rightarrow\) Si \(A\) et \(B\) sont indépendants, alors \(P(A \cap B) = P(A) \times P(B)\). En divisant par \(P(B) > 0\) :
\(P(A \mid B) = \dfrac{P(A \cap B)}{P(B)} = \dfrac{P(A)\,P(B)}{P(B)} = P(A).\)
Sens \(\Leftarrow\) Réciproquement, si \(P(A \mid B) = P(A)\), alors par la formule \(P(A \cap B) = P(B) \cdot P(A \mid B)\) :
\(P(A \cap B) = P(B) \times P(A) = P(A) \times P(B).\)
C’est exactement la définition de l’indépendance. ∎
On lance deux des equilibres. Soit \(A\) = « le premier de donne 6 » et \(B\) = « la somme des deux des vaut 8 ».
\(P(A) = \frac{1}{6}\), \(P(B) = \frac{5}{36}\) (les couples donnant 8 : (2,6), (3,5), (4,4), (5,3), (6,2)).
\(A \cap B\) = « le premier de donne 6 et la somme vaut 8 » = {(6,2)}, donc \(P(A \cap B) = \frac{1}{36}\).
Or \(P(A) \times P(B) = \frac{1}{6} \times \frac{5}{36} = \frac{5}{216} \neq \frac{1}{36} = \frac{6}{216}\).
Donc \(A\) et \(B\) ne sont pas independants.
Montrons que \(P(A \cap \bar{B}) = P(A) \times P(\bar{B})\). On sait que \(A = (A \cap B) \cup (A \cap \bar{B})\) (evenements incompatibles), donc \(P(A) = P(A \cap B) + P(A \cap \bar{B})\).
D’ou \(P(A \cap \bar{B}) = P(A) - P(A \cap B) = P(A) - P(A) \times P(B)\) (par independance de \(A\) et \(B\)).
Soit \(P(A \cap \bar{B}) = P(A)(1 - P(B)) = P(A) \times P(\bar{B})\). Les autres cas se traitent de meme.
Prevalence : \(P(M) = 0{,}001\). Sensibilite : \(P(+ \mid M) = 0{,}99\). Specificite : \(P(- \mid \bar{M}) = 0{,}95\).
Par la formule des probabilites totales :
\(P(+) = P(M) \times P(+ \mid M) + P(\bar{M}) \times P(+ \mid \bar{M})\)
\(P(+) = 0{,}001 \times 0{,}99 + 0{,}999 \times 0{,}05 = 0{,}00099 + 0{,}04995 = 0{,}05094\)
Par Bayes : \(P(M \mid +) = \frac{0{,}00099}{0{,}05094} \approx 0{,}019 = 1{,}9\,\%\)
Seulement 1,9 % des personnes testees positives sont reellement malades. Ce résultat contre-intuitif s’explique par la rarete de la maladie.
Pour des composants independants de fiabilites \(p_1, p_2, \ldots, p_n\) :
Un système comporte deux composants independants, chacun de fiabilite 0,9.
En serie : \(P = 0{,}9 \times 0{,}9 = 0{,}81\).
En parallele : \(P = 1 - (1 - 0{,}9)^2 = 1 - 0{,}01 = 0{,}99\).
Le montage en parallele (redondance) ameliore considerablement la fiabilite.
| Notion | Formule |
|---|---|
| Probabilite conditionnelle | \(P(A \mid B) = \frac{P(A \cap B)}{P(B)}\) |
| Intersection | \(P(A \cap B) = P(B) \times P(A \mid B)\) |
| Formule de Bayes | \(P(A \mid B) = \frac{P(B \mid A) \times P(A)}{P(B)}\) |
| Probabilites totales | \(P(B) = P(A) \cdot P(B \mid A) + P(\bar{A}) \cdot P(B \mid \bar{A})\) |
| Independance | \(P(A \cap B) = P(A) \times P(B)\) |
| Fiabilite en serie | \(P = p_1 \times p_2 \times \cdots \times p_n\) |
| Fiabilite en parallele | \(P = 1 - (1-p_1)(1-p_2)\cdots(1-p_n)\) |
On note \(M\) = « etre malade » et \(+\) = « test positif ». On a : \(P(M) = 0{,}001\), \(P(+ \mid M) = 0{,}99\), \(P(+ \mid \bar{M}) = 0{,}05\).
Par les probabilites totales : \(P(+) = 0{,}001 \times 0{,}99 + 0{,}999 \times 0{,}05 = 0{,}05094\).
Par Bayes : \(P(M \mid +) = \frac{0{,}00099}{0{,}05094} \approx 1{,}9\,\%\).
Malgre un test fiable a 99 %, une personne testee positive n’a que 1,9 % de chances d’etre reellement malade. Ce paradoxe apparent vient du fait que les faux positifs parmi les 999 personnes saines sont beaucoup plus nombreux que les vrais positifs parmi la seule personne malade (sur 1 000).
Il faut changer de porte. En gardant votre choix, la probabilite de gagner est \(\frac{1}{3}\). En changeant, elle passe a \(\frac{2}{3}\).
Explication : au depart, la voiture est derriere votre porte avec une probabilite de \(\frac{1}{3}\), et derriere l’une des deux autres avec une probabilite de \(\frac{2}{3}\). Quand le presentateur ouvre une porte perdante, toute la probabilite \(\frac{2}{3}\) se concentre sur la porte restante.
C’est un exemple celebre ou la probabilite conditionnelle contredit notre intuition.
Probabilites conditionnelles : teste d’abord ton intuition.
« \(P(A \mid B) = P(B \mid A)\). »
Cette affirmation est-elle correcte ?
Faux. C’est l’erreur du procureur ! \(P(\text{malade} \mid \text{positif}) \neq P(\text{positif} \mid \text{malade})\). La formule de Bayes relie les deux.
Mini-test : 80 % des fumeurs toussent. 30 % de la population fume. P(fumeur | tousse) = 80 % ?
« Si \(A\) et \(B\) sont independants, alors ils sont incompatibles. »
Cette affirmation est-elle correcte ?
Faux. Independance : \(P(A \cap B) = P(A) \times P(B)\). Incompatibilite : \(P(A \cap B) = 0\). Si \(P(A) > 0\) et \(P(B) > 0\), les deux notions s’excluent mutuellement !
Mini-test : pile et face au meme lancer sont :
« \(P(A \cap B) = P(A) \times P(B)\) toujours. »
Cette affirmation est-elle correcte ?
Faux. Cette formule n’est valable que si \(A\) et \(B\) sont independants. En général, \(P(A \cap B) = P(A) \times P(B \mid A)\).
Mini-test : tirage de 2 cartes sans remise. P(2 as) = \(\frac{4}{52} \times \frac{4}{52}\) ?
« Dans un arbre de probabilites, on additionne les probabilites le long d’une branche. »
Cette affirmation est-elle correcte ?
Faux. Le long d’une branche, on multiplie. On additionne seulement les branches qui menent a un meme evenement (probabilites totales).
Mini-test : branche M puis + avec \(P(M) = 0{,}01\) et \(P(+|M) = 0{,}99\). \(P(M \cap +) = ?\)
« \(P(A \cup B) = P(A) + P(B)\). »
Cette affirmation est-elle correcte ?
Faux (en général). La formule correcte est \(P(A \cup B) = P(A) + P(B) - P(A \cap B)\). L’egalite sans le \(-P(A \cap B)\) n’est valable que si \(A\) et \(B\) sont incompatibles.
Mini-test : \(P(A) = 0{,}6\), \(P(B) = 0{,}5\), \(P(A \cap B) = 0{,}2\). \(P(A \cup B) = ?\)
« \(P(A \mid B) = \dfrac{P(B \mid A) \cdot P(A)}{P(B)}\). »
Cette affirmation est-elle correcte ?
C’est vrai ! C’est la formule de Bayes, outil fondamental pour « inverser » les probabilites conditionnelles.
Mini-test : Bayes permet de calculer la probabilite qu’un patient soit malade sachant que son test est positif. C’est :