Terminale — Programme officiel (BO 2019) · Math@mine
Une usine fabrique des composants dont 5 % sont defectueux. On preleve un échantillon de 100 pieces. Combien de pieces defectueuses peut-on « raisonnablement » s’attendre a trouver, et avec quelle marge d’erreur ? La loi binomiale repond exactement a la premiere question ; l’inégalité de concentration borne l’ecart a la moyenne.
Jacob Bernoulli démontre en 1713 (dans Ars Conjectandi, publié à titre posthume) la premiere version rigoureuse de la loi des grands nombres : la fréquence de succes dans \(n\) épreuves indépendantes converge vers la probabilité théorique quand \(n \to \infty\). C’est la pierre angulaire des statistiques modernes.
Pafnouti Tchebychev (1867) donne une inégalité universelle qui borne la probabilité qu’une variable s’écarte de son espérance, à partir de la seule variance. Appliquée à la fréquence \(X/n\), elle donne directement la version faible de la loi des grands nombres — c’est la démarche suivie dans ce chapitre.
On lance une piece equilibree 100 fois. Majorer la probabilité que la fréquence observée de piles s’écarte de 0,5 de plus de 0,1.
Un QCM de 10 questions a 4 choix chacune. Un élève repond au hasard. Soit \(X \sim \mathcal{B}(10; 0{,}25)\). Calculer \(P(X = 3)\).
\(P(X = 3) = \binom{10}{3}(0{,}25)^3(0{,}75)^7 = 120 \times 0{,}0156 \times 0{,}1335 \approx 0{,}250\).
Vérifier que l’experience vérifie les trois conditions :
Pour toutes variables aléatoires discrètes \(X\) et \(Y\) (finies) et tout réel \(a\) :
\(E(X + Y) = E(X) + E(Y)\) \quad\text{et}\quad \(E(aX) = a\,E(X).\)
Par récurrence, pour toute somme finie : \(E(X_1 + X_2 + \cdots + X_n) = E(X_1) + E(X_2) + \cdots + E(X_n).\)
Important : la linéarité de l'espérance est valable toujours, même lorsque \(X\) et \(Y\) ne sont pas indépendantes.
Notons \(\{x_i\}\) les valeurs possibles de \(X\) et \(\{y_j\}\) celles de \(Y\). Par définition de l'espérance de la somme :
\(E(X + Y) = \displaystyle\sum_{i,j} (x_i + y_j)\,P(X = x_i \cap Y = y_j).\)
On développe et on sépare les deux sommes :
\(= \sum_{i,j} x_i\,P(X = x_i \cap Y = y_j) + \sum_{i,j} y_j\,P(X = x_i \cap Y = y_j).\)
Dans la première somme, on factorise par \(x_i\) et on utilise la loi marginale \(P(X = x_i) = \sum_j P(X = x_i \cap Y = y_j)\) :
\(\sum_{i,j} x_i\,P(X = x_i \cap Y = y_j) = \sum_i x_i\,P(X = x_i) = E(X).\)
Symétriquement, la deuxième somme vaut \(E(Y)\). Donc \(E(X + Y) = E(X) + E(Y)\). ∎
Pour \(E(aX) = a\,E(X)\) : \(E(aX) = \sum_i (a x_i)\,P(X = x_i) = a \sum_i x_i\,P(X = x_i) = a\,E(X)\). ∎
Par définition et par linéarité de l'espérance :
\(V(aX) = E((aX - E(aX))^2) = E((aX - a\,E(X))^2) = E(a^2(X - E(X))^2) = a^2\,E((X - E(X))^2) = a^2\,V(X).\) ∎
Contrairement à l'espérance, la variance n'est pas linéaire en général :
\(V(X + Y) = V(X) + V(Y) + 2\,\text{Cov}(X, Y).\)
En revanche, si \(X\) et \(Y\) sont indépendantes, alors \(\text{Cov}(X, Y) = 0\) et donc \(V(X + Y) = V(X) + V(Y).\)
On decompose \(X = X_1 + X_2 + \cdots + X_n\) ou \(X_i\) vaut 1 si la \(i\)-eme épreuve est un succes, 0 sinon. Chaque \(X_i\) suit une loi de Bernoulli : \(E(X_i) = 1 \cdot p + 0 \cdot (1 - p) = p.\)
Par linéarité de l'espérance (théorème précédent) :
\(E(X) = E(X_1) + \cdots + E(X_n) = p + p + \cdots + p = np.\) ∎
Chaque \(X_i\) vérifie \(V(X_i) = E(X_i^2) - [E(X_i)]^2 = p - p^2 = p(1-p)\).
Comme les \(X_i\) sont indépendantes, la variance de la somme est la somme des variances :
\(V(X) = V(X_1) + \cdots + V(X_n) = np(1-p)\). ∎
L’écart type suit : \(\sigma(X) = \sqrt{V(X)} = \sqrt{np(1-p)}\).
Pour \(X \sim \mathcal{B}(100; 0{,}3)\) :
\(E(X) = 30\), \(V(X) = 21\), \(\sigma(X) = \sqrt{21} \approx 4{,}58\).
On s’attend a environ 30 succes, avec un écart type d’environ 4,6.
On applique l’inégalité de Bienaymé-Tchebychev à \(Y = \dfrac{X}{n}\). On a \(E(Y) = p\) et \(V(Y) = \dfrac{V(X)}{n^2} = \dfrac{p(1-p)}{n}\).
Donc \(P\!\left(\left|\dfrac{X}{n} - p\right| \geq \varepsilon\right) \leq \dfrac{p(1-p)}{n\varepsilon^2}\).
Enfin, \(p(1-p) \leq \dfrac{1}{4}\) pour tout \(p \in [0;1]\) (maximum atteint en \(p = \frac{1}{2}\)), d’où le majorant \(\dfrac{1}{4n\varepsilon^2}\). ∎
C’est une conséquence directe du majorant précédent :
\(P\!\left(\left|\dfrac{X}{n} - p\right| \geq \varepsilon\right) \leq \dfrac{1}{4n\varepsilon^2} \xrightarrow[n \to +\infty]{} 0\). ∎
On tire au hasard \(n = 10\,000\) pièces avec \(p = 0{,}05\). Majorer la probabilité que la fréquence observée \(f = X/n\) s’écarte de \(p\) de plus de 1 point (\(\varepsilon = 0{,}01\)) :
\(P(|f - 0{,}05| \geq 0{,}01) \leq \dfrac{0{,}05 \times 0{,}95}{10\,000 \times 0{,}01^2} = \dfrac{0{,}0475}{1} = 0{,}0475\).
Moins de 5 % des échantillons s’écartent de plus d’un point.
Si l'expérience consiste à observer un caractère de proportion \(p\) dans une population, alors le nombre \(X\) d'individus de l'échantillon ayant ce caractère suit la loi binomiale \(\mathcal{B}(n, p)\), et la fréquence observée \(F = X/n\) est une estimation de \(p\).
Avec l'inégalité de concentration démontrée plus haut, on obtient un intervalle explicite : pour \(\alpha = 0{,}05\), la probabilité que \(F\) soit dans \(\left[p - \dfrac{1}{\sqrt{\alpha n}} \cdot \dfrac{1}{2}\,;\,p + \dfrac{1}{\sqrt{\alpha n}} \cdot \dfrac{1}{2}\right]\) est au moins \(0{,}95\) (en exploitant \(p(1-p) \leq 1/4\)).
On souhaite tester si une hypothèse « proportion théorique = \(p_0\) » est compatible avec un échantillon observé.
Exemple : \(p_0 = 0{,}5\) (pile ou face équilibré), \(n = 100\). L'intervalle de fluctuation à 95 % contient \([0{,}4\,;\,0{,}6]\) (voir énigme ci-dessous). Si on observe \(f_{\text{obs}} = 0{,}65\), on est hors intervalle : la pièce est probablement truquée.
Soit \(X\) le nombre de pièces défectueuses dans un échantillon de \(n = 100\) pièces, avec \(p = 0{,}05\). Alors \(X \sim \mathcal{B}(100; 0{,}05)\).
\(E(X) = np = 5\) et \(V(X) = np(1-p) = 4{,}75\), donc \(\sigma(X) = \sqrt{4{,}75} \approx 2{,}18\).
L’inégalité de Bienaymé-Tchebychev appliquée à \(X\) donne, pour tout \(\varepsilon > 0\) :
\(P(|X - 5| \geq \varepsilon) \leq \dfrac{4{,}75}{\varepsilon^2}\).
Pour \(\varepsilon = 5\) : \(P(|X - 5| \geq 5) \leq \dfrac{4{,}75}{25} = 0{,}19\). Donc \(P(0 < X < 10) \geq 0{,}81\).
Conclusion : dans au moins 81 % des cas, on trouvera entre 1 et 9 pièces défectueuses. Si l’on en trouve 10 ou plus, on peut raisonnablement suspecter un problème de qualité. (La probabilité exacte, calculée directement avec la loi binomiale, est encore plus élevée — Bienaymé-Tchebychev ne donne qu’un majorant grossier.)
Soit \(X \sim \mathcal{B}(100; 0{,}5)\) le nombre de piles obtenus. On veut majorer \(P(|X/100 - 0{,}5| \geq 0{,}1)\).
L’inégalité de concentration (section 3) donne, avec \(n = 100\), \(p = 0{,}5\) et \(\varepsilon = 0{,}1\) :
\(P\!\left(\left|\dfrac{X}{100} - 0{,}5\right| \geq 0{,}1\right) \leq \dfrac{1}{4 \times 100 \times 0{,}1^2} = \dfrac{1}{4} = 0{,}25\).
Conclusion : au moins 75 % des séries de 100 lancers donnent une fréquence de piles comprise entre 40 % et 60 %. (Le majorant est grossier : la vraie probabilité, calculée avec la loi binomiale, est de l’ordre de 4 %.)
L'intervalle de fluctuation (section 3) suppose la proportion théorique \(p\) connue et encadre la fréquence observée \(F = X/n\). L'intervalle de confiance fait le chemin inverse : on observe une fréquence \(f_{\text{obs}}\) et on cherche à encadrer la proportion \(p\), inconnue, à un niveau de confiance donné.
Soit \(F = X/n\) la fréquence observée pour \(X \sim \mathcal{B}(n, p)\). Un intervalle de confiance de la proportion \(p\) au niveau de confiance \(1 - \alpha\) est un intervalle aléatoire \([F - r\,;\,F + r]\) tel que :
\(P\big(\,p \in [F - r\,;\,F + r]\,\big) \geq 1 - \alpha.\)
Soit \(X \sim \mathcal{B}(n, p)\) et \(F = X/n\). L'intervalle :
\(\left[\,F - \dfrac{1}{\sqrt{n}}\,;\;F + \dfrac{1}{\sqrt{n}}\,\right]\)
contient \(p\) avec une probabilité d'au moins 75 % (\(= 3/4\)).
Plus généralement, pour \(\varepsilon = \dfrac{k}{2\sqrt{n}}\) (avec \(k \geq 1\)), l'intervalle \([F - \varepsilon\,;\,F + \varepsilon]\) contient \(p\) avec une probabilité d'au moins \(1 - \dfrac{1}{k^2}\).
L'inégalité de Bienaymé-Tchebychev appliquée à \(F = X/n\), avec \(E(F) = p\) et \(V(F) = \dfrac{p(1-p)}{n} \leq \dfrac{1}{4n}\), donne pour tout \(\varepsilon > 0\) :
\(P\!\left(|F - p| \geq \varepsilon\right) \leq \dfrac{V(F)}{\varepsilon^2} \leq \dfrac{1}{4n\varepsilon^2}\)
Avec \(\varepsilon = \dfrac{1}{\sqrt{n}}\) : le majorant vaut \(\dfrac{1}{4n \times 1/n} = \dfrac{1}{4}\). D'où \(P\!\left(|F - p| < \dfrac{1}{\sqrt n}\right) \geq 1 - \dfrac{1}{4} = \dfrac{3}{4} = 75\,\%\). ∎
Pour \(n\) suffisamment grand (en pratique \(n \geq 30\), \(np \geq 5\) et \(n(1-p) \geq 5\)), la fréquence \(F = X/n\) suit approximativement une loi normale d'espérance \(p\) et d'écart-type \(\sqrt{\dfrac{p(1-p)}{n}}\). Il en résulte que l'intervalle :
\(\left[\,F - \dfrac{1}{\sqrt{n}}\,;\;F + \dfrac{1}{\sqrt{n}}\,\right]\)
contient \(p\) avec une probabilité asymptotique d'environ 95 %. Cet IC simplifié est utilisé dans la suite du chapitre pour les sondages.
Remarque. Le rayon précis du TCL est \(1{,}96 \times \sqrt{p(1-p)/n}\) ; en majorant \(p(1-p) \leq 1/4\), on obtient \(\dfrac{1{,}96}{2\sqrt n} = \dfrac{0{,}98}{\sqrt n} \leq \dfrac{1}{\sqrt n}\), d'où la version pratique. La justification rigoureuse repose sur le théorème central limite, qui dépasse le programme de Terminale.
Dans un sondage sur \(n = 1000\) personnes, \(k = 520\) déclarent voter pour le candidat A. Estimer la proportion \(p\) d'électeurs du candidat A dans la population.
Fréquence observée : \(f_{\text{obs}} = 520/1000 = 0{,}52\).
Rayon : \(r = 1/\sqrt{1000} \approx 0{,}032\).
Intervalle de confiance à 95 % : \([0{,}52 - 0{,}032\,;\,0{,}52 + 0{,}032] = [0{,}488\,;\,0{,}552].\)
Conclusion : on estime que la proportion d'électeurs de A est comprise entre 48,8 % et 55,2 %, avec une confiance d'au moins 95 %. On ne peut pas conclure avec certitude que \(p > 0{,}5\) (l'intervalle traverse 0,5).
La largeur de l'intervalle est \(\dfrac{2}{\sqrt{n}}\). Pour diviser la largeur par 2, il faut multiplier \(n\) par 4. Passer d'un sondage de 1000 à 4000 personnes réduit la marge d'erreur de moitié.
Jusqu'ici toutes les variables aléatoires manipulées étaient discrètes : elles prenaient leurs valeurs dans un ensemble fini. De nombreuses situations font intervenir des variables continues (temps d'attente, taille, durée de vie, etc.) pour lesquelles \(P(X = x) = 0\) pour tout \(x\) fixé. L'outil pour les décrire n'est plus une loi de probabilité ponctuelle mais une densité.
On a alors : \(P(c \leq X \leq d) = \dfrac{d - c}{b - a}\) pour \([c; d] \subset [a; b].\)
Espérance : \(E(X) = \dfrac{a + b}{2}.\)
Un bus passe toutes les 10 minutes. Si on arrive à un instant totalement aléatoire à l'arrêt, le temps d'attente \(X\) suit la loi \(\mathcal{U}([0; 10])\).
Probabilité d'attendre moins de 3 minutes : \(P(X \leq 3) = \dfrac{3}{10} = 0{,}3.\)
Temps d'attente moyen : \(E(X) = 5\) min.
Propriétés : \(P(X \leq t) = 1 - e^{-\lambda t}\) ; \(E(X) = \dfrac{1}{\lambda}\).
Caractéristique « sans mémoire » : \(P(X > t + s \mid X > t) = P(X > s)\). La loi exponentielle modélise la durée de vie d'un composant dont la défaillance est « sans vieillissement ».
La durée de vie d'une ampoule LED est modélisée par une loi exponentielle de paramètre \(\lambda = 10^{-4}\) (en heures).
Durée de vie moyenne : \(E(X) = 1/\lambda = 10\,000\) heures.
Probabilité que l'ampoule dure plus de 5000 h : \(P(X > 5000) = e^{-5000 \times 10^{-4}} = e^{-0{,}5} \approx 0{,}61.\)
Une autre loi continue fondamentale est la loi normale \(\mathcal{N}(\mu, \sigma^2)\), à densité en cloche. Elle n'est pas au programme strict de Terminale Spé mais apparaît dans Maths Complémentaires et dans toutes les études supérieures (statistiques, finance, erreurs de mesure).
Le théorème central limite affirme que la somme (ou la moyenne) d'un grand nombre de variables aléatoires indépendantes et identiquement distribuées suit approximativement une loi normale — ce qui explique son omniprésence.
Pour approfondir, d'autres applets s'ouvrent en plein écran dans un nouvel onglet :
Banque complète (1245 applets) — voir le catalogue GeoGebra.
| Notion | Formule |
|---|---|
| Loi binomiale \(\mathcal{B}(n,p)\) | \(P(X=k) = \binom{n}{k}p^k(1-p)^{n-k}\) |
| Espérance | \(E(X) = np\) |
| Variance / écart type | \(V(X) = np(1-p)\) ; \(\sigma(X) = \sqrt{np(1-p)}\) |
| Bienaymé-Tchebychev | \(P(|Y - \mu| \geq \varepsilon) \leq \dfrac{\sigma^2}{\varepsilon^2}\) |
| Inégalité de concentration | \(P\!\left(\left|\dfrac{X}{n} - p\right| \geq \varepsilon\right) \leq \dfrac{1}{4n\varepsilon^2}\) |
| Loi faible des grands nombres | \(\dfrac{X}{n} \xrightarrow[n \to +\infty]{\text{probabilité}} p\) |
Lois de probabilité : teste d’abord ton intuition.
« \(E(X^2) = \bigl(E(X)\bigr)^2\). »
Cette affirmation est-elle correcte ?
Faux. En général, \(E(X^2) \geq \bigl(E(X)\bigr)^2\) (inégalité de Jensen). La différence est justement la variance : \(V(X) = E(X^2) - \bigl(E(X)\bigr)^2\). L’égalité n’a lieu que si \(V(X) = 0\), c’est-à-dire si \(X\) est constante.
Mini-test : \(X\) uniforme sur \(\{1;2;3\}\). \(E(X) = 2\), \(E(X^2) = ?\)
« \(\sigma(aX) = a\,\sigma(X)\) pour tout réel \(a\). »
Cette affirmation est-elle correcte ?
Faux. On a \(\sigma(aX) = |a|\,\sigma(X)\), avec la valeur absolue. L’écart type est toujours positif. Si \(a = -3\), alors \(\sigma(-3X) = 3\,\sigma(X)\), pas \(-3\,\sigma(X)\). Pour la variance : \(V(aX) = a^2\,V(X)\).
Mini-test : si \(\sigma(X) = 4\), que vaut \(\sigma(-2X)\) ?
« Si on lance une pièce équilibrée un très grand nombre de fois \(n\), on obtient exactement \(X = n/2\) piles. »
Cette affirmation est-elle correcte ?
Faux. La loi faible des grands nombres affirme que la fréquence \(X/n\) se rapproche de \(p = 1/2\) en probabilité, pas que \(X\) vaut exactement \(n/2\). L’écart type \(\sigma(X) = \sqrt{n/4}\) croît comme \(\sqrt{n}\), donc \(X\) fluctue typiquement de \(\pm\sqrt{n}/2\) autour de \(n/2\).
Mini-test : \(n = 10\,000\) lancers, \(p = 0{,}5\). Écart type de \(X\) ?
« L’inégalité de Bienaymé-Tchebychev \(P(|Y - \mu| \geq \varepsilon) \leq \sigma^2/\varepsilon^2\) donne la valeur exacte de la probabilité. »
Cette affirmation est-elle correcte ?
Faux. C’est un majorant, souvent très grossier. Par exemple pour \(X \sim \mathcal{B}(100; 0{,}5)\), \(\sigma^2 = 25\). Bienaymé donne \(P(|X - 50| \geq 10) \leq 25/100 = 0{,}25\), alors que la vraie probabilité calculée avec la binomiale est d’environ 0,036. Le majorant est juste mais lâche.
Mini-test : que garantit l’inégalité \(P(|Y-\mu| \geq \varepsilon) \leq \sigma^2/\varepsilon^2\) ?
« \(V(X + Y) = V(X) + V(Y)\) toujours. »
Cette affirmation est-elle correcte ?
Faux. \(V(X + Y) = V(X) + V(Y)\) n’est vrai que si \(X\) et \(Y\) sont indépendantes. En général, \(V(X+Y) = V(X) + V(Y) + 2\,\text{Cov}(X,Y)\). L’espérance, elle, est toujours lineaire : \(E(X+Y) = E(X) + E(Y)\).
Mini-test : \(V(X + X) = ?\)
« Pour \(X \sim \mathcal{B}(n;p)\) et tout \(\varepsilon > 0\), on a \(P\!\left(\left|\dfrac{X}{n} - p\right| \geq \varepsilon\right) \leq \dfrac{1}{4n\varepsilon^2}\). »
Cette affirmation est-elle correcte ?
C’est vrai ! C’est l’inégalité de concentration, conséquence de Bienaymé-Tchebychev appliquée à \(X/n\). On obtient d’abord \(P(|X/n - p| \geq \varepsilon) \leq p(1-p)/(n\varepsilon^2)\), puis on majore \(p(1-p) \leq 1/4\).
Mini-test : \(n = 2500\), \(\varepsilon = 0{,}05\). Majorant de \(P(|X/n - p| \geq 0{,}05)\) ?