Math@mine / Terminale / Ch11

Chapitre 11 — Lois de probabilité

📋 Prérequis & 🎯 Objectifs du chapitre déplier
📋 Prérequis
  • Ch. 10 — probabilités conditionnelles
  • 1re Spé — variables aléatoires discrètes
🎯 Objectifs — à la fin du chapitre, je saurai…
  • Calculer \(P(X=k)\) pour une loi binomiale \(\mathcal{B}(n,p)\)
  • Calculer l'espérance \(np\) et la variance \(np(1-p)\) d'une binomiale
  • Comprendre l'échantillonnage et l'intervalle de fluctuation
  • Prendre une décision à partir d'un échantillon

Terminale — Programme officiel (BO 2019) · Math@mine

Sommaire
1. Loi binomiale 2. Somme de v. a. — espérance et écart type de la binomiale 3. Inégalité de concentration et loi faible des grands nombres 4. Intervalle de confiance 5. Lois continues (ouverture) Solution du problème d’ouverture Bilan — Formules essentielles

Le contrôle qualite

Une usine fabrique des composants dont 5 % sont defectueux. On preleve un échantillon de 100 pieces. Combien de pieces defectueuses peut-on « raisonnablement » s’attendre a trouver, et avec quelle marge d’erreur ? La loi binomiale repond exactement a la premiere question ; l’inégalité de concentration borne l’ecart a la moyenne.

En quoi la loi faible des grands nombres justifie-t-elle l’affirmation « la fréquence observée se rapproche de la probabilité théorique quand \(n\) grandit » ?

→ Solution complete en fin de chapitre

Bernoulli, Tchebychev et la loi des grands nombres

Jacob Bernoulli démontre en 1713 (dans Ars Conjectandi, publié à titre posthume) la premiere version rigoureuse de la loi des grands nombres : la fréquence de succes dans \(n\) épreuves indépendantes converge vers la probabilité théorique quand \(n \to \infty\). C’est la pierre angulaire des statistiques modernes.

Pafnouti Tchebychev (1867) donne une inégalité universelle qui borne la probabilité qu’une variable s’écarte de son espérance, à partir de la seule variance. Appliquée à la fréquence \(X/n\), elle donne directement la version faible de la loi des grands nombres — c’est la démarche suivie dans ce chapitre.

Pile ou face 100 fois

On lance une piece equilibree 100 fois. Majorer la probabilité que la fréquence observée de piles s’écarte de 0,5 de plus de 0,1.

→ Solution complète en fin de chapitre

1. Loi binomiale

Définition — Loi binomiale
Soit \(X\) le nombre de succes dans un schema de Bernoulli à \(n\) epreuves independantes, chacune avec probabilite de succes \(p\). On dit que \(X\) suit la loi binomiale de parametres \(n\) et \(p\), notee \(X \sim \mathcal{B}(n, p)\). Pour tout entier \(k\) de 0 à \(n\) : $$P(X = k) = \binom{n}{k} p^k (1-p)^{n-k}$$
Exemple

Un QCM de 10 questions a 4 choix chacune. Un élève repond au hasard. Soit \(X \sim \mathcal{B}(10; 0{,}25)\). Calculer \(P(X = 3)\).



\(P(X = 3) = \binom{10}{3}(0{,}25)^3(0{,}75)^7 = 120 \times 0{,}0156 \times 0{,}1335 \approx 0{,}250\).

Méthode — Reconnaitre une loi binomiale

Vérifier que l’experience vérifie les trois conditions :

  1. Les épreuves sont indépendantes.
  2. Chaque épreuve a exactement deux issues (succes/echec).
  3. La probabilité de succes \(p\) est constante.

2. Somme de variables aléatoires — espérance et écart type de la loi binomiale

Théorème — Linéarité de l'espérance

Pour toutes variables aléatoires discrètes \(X\) et \(Y\) (finies) et tout réel \(a\) :

\(E(X + Y) = E(X) + E(Y)\) \quad\text{et}\quad \(E(aX) = a\,E(X).\)

Par récurrence, pour toute somme finie : \(E(X_1 + X_2 + \cdots + X_n) = E(X_1) + E(X_2) + \cdots + E(X_n).\)

Important : la linéarité de l'espérance est valable toujours, même lorsque \(X\) et \(Y\) ne sont pas indépendantes.

Démonstration (cas discret fini)

Notons \(\{x_i\}\) les valeurs possibles de \(X\) et \(\{y_j\}\) celles de \(Y\). Par définition de l'espérance de la somme :

\(E(X + Y) = \displaystyle\sum_{i,j} (x_i + y_j)\,P(X = x_i \cap Y = y_j).\)

On développe et on sépare les deux sommes :

\(= \sum_{i,j} x_i\,P(X = x_i \cap Y = y_j) + \sum_{i,j} y_j\,P(X = x_i \cap Y = y_j).\)

Dans la première somme, on factorise par \(x_i\) et on utilise la loi marginale \(P(X = x_i) = \sum_j P(X = x_i \cap Y = y_j)\) :

\(\sum_{i,j} x_i\,P(X = x_i \cap Y = y_j) = \sum_i x_i\,P(X = x_i) = E(X).\)

Symétriquement, la deuxième somme vaut \(E(Y)\). Donc \(E(X + Y) = E(X) + E(Y)\). ∎

Pour \(E(aX) = a\,E(X)\) : \(E(aX) = \sum_i (a x_i)\,P(X = x_i) = a \sum_i x_i\,P(X = x_i) = a\,E(X)\). ∎

Propriété — Relation \(V(aX) = a^2\,V(X)\)
Pour toute variable aléatoire \(X\) et tout réel \(a\) : \(V(aX) = a^2\,V(X)\) et \(\sigma(aX) = |a|\,\sigma(X).\)
Démonstration

Par définition et par linéarité de l'espérance :

\(V(aX) = E((aX - E(aX))^2) = E((aX - a\,E(X))^2) = E(a^2(X - E(X))^2) = a^2\,E((X - E(X))^2) = a^2\,V(X).\) ∎

Attention — Variance d'une somme

Contrairement à l'espérance, la variance n'est pas linéaire en général :

\(V(X + Y) = V(X) + V(Y) + 2\,\text{Cov}(X, Y).\)

En revanche, si \(X\) et \(Y\) sont indépendantes, alors \(\text{Cov}(X, Y) = 0\) et donc \(V(X + Y) = V(X) + V(Y).\)

Application : espérance et écart type de la loi binomiale

Propriété — Loi binomiale \(\mathcal{B}(n, p)\)
Si \(X \sim \mathcal{B}(n, p)\) :
  • Espérance : \(E(X) = np\)
  • Variance : \(V(X) = np(1-p)\)
  • Écart type : \(\sigma(X) = \sqrt{np(1-p)}\)
Démonstration de E(X) = np

On decompose \(X = X_1 + X_2 + \cdots + X_n\) ou \(X_i\) vaut 1 si la \(i\)-eme épreuve est un succes, 0 sinon. Chaque \(X_i\) suit une loi de Bernoulli : \(E(X_i) = 1 \cdot p + 0 \cdot (1 - p) = p.\)

Par linéarité de l'espérance (théorème précédent) :

\(E(X) = E(X_1) + \cdots + E(X_n) = p + p + \cdots + p = np.\) ∎

Démonstration de V(X) = np(1-p)

Chaque \(X_i\) vérifie \(V(X_i) = E(X_i^2) - [E(X_i)]^2 = p - p^2 = p(1-p)\).

Comme les \(X_i\) sont indépendantes, la variance de la somme est la somme des variances :

\(V(X) = V(X_1) + \cdots + V(X_n) = np(1-p)\). ∎

L’écart type suit : \(\sigma(X) = \sqrt{V(X)} = \sqrt{np(1-p)}\).

Exemple

Pour \(X \sim \mathcal{B}(100; 0{,}3)\) :

\(E(X) = 30\), \(V(X) = 21\), \(\sigma(X) = \sqrt{21} \approx 4{,}58\).

On s’attend a environ 30 succes, avec un écart type d’environ 4,6.

Remarque — Interprétation de l’écart type
L’ecart type mesure la « dispersion » autour de la moyenne. Plus \(n\) est grand, plus l’ecart type est grand en valeur absolue, mais la fréquence \(X/n\) se concentre de plus en plus autour de \(p\) (loi des grands nombres).

3. Inégalité de concentration et loi faible des grands nombres

Propriété — Inégalité de Bienaymé-Tchebychev (admise)
Pour toute variable aléatoire \(Y\) d’espérance \(\mu\) et de variance \(\sigma^2\), et pour tout \(\varepsilon > 0\) : $$P(|Y - \mu| \geq \varepsilon) \leq \frac{\sigma^2}{\varepsilon^2}$$
Propriété — Inégalité de concentration
Soit \(X \sim \mathcal{B}(n, p)\). Pour tout \(\varepsilon > 0\) : $$P\!\left(\left|\frac{X}{n} - p\right| \geq \varepsilon\right) \leq \frac{p(1-p)}{n\varepsilon^2} \leq \frac{1}{4n\varepsilon^2}$$
Démonstration

On applique l’inégalité de Bienaymé-Tchebychev à \(Y = \dfrac{X}{n}\). On a \(E(Y) = p\) et \(V(Y) = \dfrac{V(X)}{n^2} = \dfrac{p(1-p)}{n}\).

Donc \(P\!\left(\left|\dfrac{X}{n} - p\right| \geq \varepsilon\right) \leq \dfrac{p(1-p)}{n\varepsilon^2}\).

Enfin, \(p(1-p) \leq \dfrac{1}{4}\) pour tout \(p \in [0;1]\) (maximum atteint en \(p = \frac{1}{2}\)), d’où le majorant \(\dfrac{1}{4n\varepsilon^2}\). ∎

Théorème — Loi faible des grands nombres
Soit \(X \sim \mathcal{B}(n, p)\). Pour tout \(\varepsilon > 0\) : $$P\!\left(\left|\frac{X}{n} - p\right| \geq \varepsilon\right) \to 0 \quad \text{quand } n \to +\infty$$ La fréquence observée \(X/n\) converge en probabilité vers la probabilité théorique \(p\).
Démonstration (à partir de l’inégalité de concentration)

C’est une conséquence directe du majorant précédent :

\(P\!\left(\left|\dfrac{X}{n} - p\right| \geq \varepsilon\right) \leq \dfrac{1}{4n\varepsilon^2} \xrightarrow[n \to +\infty]{} 0\). ∎

Exemple — Contrôle qualité

On tire au hasard \(n = 10\,000\) pièces avec \(p = 0{,}05\). Majorer la probabilité que la fréquence observée \(f = X/n\) s’écarte de \(p\) de plus de 1 point (\(\varepsilon = 0{,}01\)) :

\(P(|f - 0{,}05| \geq 0{,}01) \leq \dfrac{0{,}05 \times 0{,}95}{10\,000 \times 0{,}01^2} = \dfrac{0{,}0475}{1} = 0{,}0475\).

Moins de 5 % des échantillons s’écartent de plus d’un point.

Remarque — Interprétation fréquentiste
La loi faible des grands nombres justifie l’approche fréquentiste des probabilités : en répétant une expérience un grand nombre de fois, la fréquence observée se stabilise autour de la probabilité théorique.
Définition — Échantillonnage
On appelle échantillon de taille \(n\) le résultat de \(n\) répétitions indépendantes et identiquement distribuées d'une même expérience aléatoire.

Si l'expérience consiste à observer un caractère de proportion \(p\) dans une population, alors le nombre \(X\) d'individus de l'échantillon ayant ce caractère suit la loi binomiale \(\mathcal{B}(n, p)\), et la fréquence observée \(F = X/n\) est une estimation de \(p\).

Définition — Intervalle de fluctuation
Soit \(F = X/n\) la fréquence observée sur un échantillon de taille \(n\) avec \(X \sim \mathcal{B}(n, p)\). Un intervalle de fluctuation au seuil \(1 - \alpha\) (typiquement \(\alpha = 0{,}05\), donc seuil 95 %) est un intervalle \([a\,;\,b]\) tel que : \[P(F \in [a\,;\,b]) \geq 1 - \alpha.\]

Avec l'inégalité de concentration démontrée plus haut, on obtient un intervalle explicite : pour \(\alpha = 0{,}05\), la probabilité que \(F\) soit dans \(\left[p - \dfrac{1}{\sqrt{\alpha n}} \cdot \dfrac{1}{2}\,;\,p + \dfrac{1}{\sqrt{\alpha n}} \cdot \dfrac{1}{2}\right]\) est au moins \(0{,}95\) (en exploitant \(p(1-p) \leq 1/4\)).

Méthode — Prendre une décision à partir d'un échantillon

On souhaite tester si une hypothèse « proportion théorique = \(p_0\) » est compatible avec un échantillon observé.

  1. Sous l'hypothèse \(p = p_0\), construire un intervalle de fluctuation à 95 % pour \(F = X/n\).
  2. Calculer la fréquence observée \(f_{\text{obs}}\) sur l'échantillon réel.
  3. Si \(f_{\text{obs}}\) est dans l'intervalle : l'écart est compatible avec le hasard, on ne rejette pas l'hypothèse.
  4. Si \(f_{\text{obs}}\) est hors de l'intervalle : on rejette l'hypothèse au risque 5 %.

Exemple : \(p_0 = 0{,}5\) (pile ou face équilibré), \(n = 100\). L'intervalle de fluctuation à 95 % contient \([0{,}4\,;\,0{,}6]\) (voir énigme ci-dessous). Si on observe \(f_{\text{obs}} = 0{,}65\), on est hors intervalle : la pièce est probablement truquée.

Solution du problème d’ouverture — Le contrôle qualité

Soit \(X\) le nombre de pièces défectueuses dans un échantillon de \(n = 100\) pièces, avec \(p = 0{,}05\). Alors \(X \sim \mathcal{B}(100; 0{,}05)\).

\(E(X) = np = 5\) et \(V(X) = np(1-p) = 4{,}75\), donc \(\sigma(X) = \sqrt{4{,}75} \approx 2{,}18\).

L’inégalité de Bienaymé-Tchebychev appliquée à \(X\) donne, pour tout \(\varepsilon > 0\) :

\(P(|X - 5| \geq \varepsilon) \leq \dfrac{4{,}75}{\varepsilon^2}\).

Pour \(\varepsilon = 5\) : \(P(|X - 5| \geq 5) \leq \dfrac{4{,}75}{25} = 0{,}19\). Donc \(P(0 < X < 10) \geq 0{,}81\).

Conclusion : dans au moins 81 % des cas, on trouvera entre 1 et 9 pièces défectueuses. Si l’on en trouve 10 ou plus, on peut raisonnablement suspecter un problème de qualité. (La probabilité exacte, calculée directement avec la loi binomiale, est encore plus élevée — Bienaymé-Tchebychev ne donne qu’un majorant grossier.)

Solution de l’énigme — Pile ou face 100 fois

Soit \(X \sim \mathcal{B}(100; 0{,}5)\) le nombre de piles obtenus. On veut majorer \(P(|X/100 - 0{,}5| \geq 0{,}1)\).

L’inégalité de concentration (section 3) donne, avec \(n = 100\), \(p = 0{,}5\) et \(\varepsilon = 0{,}1\) :

\(P\!\left(\left|\dfrac{X}{100} - 0{,}5\right| \geq 0{,}1\right) \leq \dfrac{1}{4 \times 100 \times 0{,}1^2} = \dfrac{1}{4} = 0{,}25\).

Conclusion : au moins 75 % des séries de 100 lancers donnent une fréquence de piles comprise entre 40 % et 60 %. (Le majorant est grossier : la vraie probabilité, calculée avec la loi binomiale, est de l’ordre de 4 %.)

4. Intervalle de confiance

L'intervalle de fluctuation (section 3) suppose la proportion théorique \(p\) connue et encadre la fréquence observée \(F = X/n\). L'intervalle de confiance fait le chemin inverse : on observe une fréquence \(f_{\text{obs}}\) et on cherche à encadrer la proportion \(p\), inconnue, à un niveau de confiance donné.

Définition — Intervalle de confiance pour une proportion

Soit \(F = X/n\) la fréquence observée pour \(X \sim \mathcal{B}(n, p)\). Un intervalle de confiance de la proportion \(p\) au niveau de confiance \(1 - \alpha\) est un intervalle aléatoire \([F - r\,;\,F + r]\) tel que :

\(P\big(\,p \in [F - r\,;\,F + r]\,\big) \geq 1 - \alpha.\)

Théorème — Intervalle de confiance via Bienaymé-Tchebychev (démontrable)

Soit \(X \sim \mathcal{B}(n, p)\) et \(F = X/n\). L'intervalle :

\(\left[\,F - \dfrac{1}{\sqrt{n}}\,;\;F + \dfrac{1}{\sqrt{n}}\,\right]\)

contient \(p\) avec une probabilité d'au moins 75 % (\(= 3/4\)).

Plus généralement, pour \(\varepsilon = \dfrac{k}{2\sqrt{n}}\) (avec \(k \geq 1\)), l'intervalle \([F - \varepsilon\,;\,F + \varepsilon]\) contient \(p\) avec une probabilité d'au moins \(1 - \dfrac{1}{k^2}\).

Démonstration (Bienaymé-Tchebychev)

L'inégalité de Bienaymé-Tchebychev appliquée à \(F = X/n\), avec \(E(F) = p\) et \(V(F) = \dfrac{p(1-p)}{n} \leq \dfrac{1}{4n}\), donne pour tout \(\varepsilon > 0\) :

\(P\!\left(|F - p| \geq \varepsilon\right) \leq \dfrac{V(F)}{\varepsilon^2} \leq \dfrac{1}{4n\varepsilon^2}\)

Avec \(\varepsilon = \dfrac{1}{\sqrt{n}}\) : le majorant vaut \(\dfrac{1}{4n \times 1/n} = \dfrac{1}{4}\). D'où \(P\!\left(|F - p| < \dfrac{1}{\sqrt n}\right) \geq 1 - \dfrac{1}{4} = \dfrac{3}{4} = 75\,\%\). ∎

Propriété — Intervalle de confiance asymptotique à 95 % (admis)

Pour \(n\) suffisamment grand (en pratique \(n \geq 30\), \(np \geq 5\) et \(n(1-p) \geq 5\)), la fréquence \(F = X/n\) suit approximativement une loi normale d'espérance \(p\) et d'écart-type \(\sqrt{\dfrac{p(1-p)}{n}}\). Il en résulte que l'intervalle :

\(\left[\,F - \dfrac{1}{\sqrt{n}}\,;\;F + \dfrac{1}{\sqrt{n}}\,\right]\)

contient \(p\) avec une probabilité asymptotique d'environ 95 %. Cet IC simplifié est utilisé dans la suite du chapitre pour les sondages.

Remarque. Le rayon précis du TCL est \(1{,}96 \times \sqrt{p(1-p)/n}\) ; en majorant \(p(1-p) \leq 1/4\), on obtient \(\dfrac{1{,}96}{2\sqrt n} = \dfrac{0{,}98}{\sqrt n} \leq \dfrac{1}{\sqrt n}\), d'où la version pratique. La justification rigoureuse repose sur le théorème central limite, qui dépasse le programme de Terminale.

Méthode — Estimer une proportion à partir d'un échantillon
  1. Calculer la fréquence observée \(f_{\text{obs}} = k/n\) (où \(k\) est le nombre de succès dans l'échantillon de taille \(n\)).
  2. Calculer le rayon \(r = \dfrac{1}{\sqrt{n}}\).
  3. Donner l'intervalle de confiance à 95 % : \(\big[\,f_{\text{obs}} - r\,;\;f_{\text{obs}} + r\,\big].\)
  4. Conclure : « Avec un niveau de confiance d'au moins 95 %, la proportion \(p\) est dans cet intervalle. »
Exemple — Sondage électoral

Dans un sondage sur \(n = 1000\) personnes, \(k = 520\) déclarent voter pour le candidat A. Estimer la proportion \(p\) d'électeurs du candidat A dans la population.

Fréquence observée : \(f_{\text{obs}} = 520/1000 = 0{,}52\).

Rayon : \(r = 1/\sqrt{1000} \approx 0{,}032\).

Intervalle de confiance à 95 % : \([0{,}52 - 0{,}032\,;\,0{,}52 + 0{,}032] = [0{,}488\,;\,0{,}552].\)

Conclusion : on estime que la proportion d'électeurs de A est comprise entre 48,8 % et 55,2 %, avec une confiance d'au moins 95 %. On ne peut pas conclure avec certitude que \(p > 0{,}5\) (l'intervalle traverse 0,5).

Remarque — Taille d'échantillon et précision

La largeur de l'intervalle est \(\dfrac{2}{\sqrt{n}}\). Pour diviser la largeur par 2, il faut multiplier \(n\) par 4. Passer d'un sondage de 1000 à 4000 personnes réduit la marge d'erreur de moitié.

5. Lois continues (ouverture)

Jusqu'ici toutes les variables aléatoires manipulées étaient discrètes : elles prenaient leurs valeurs dans un ensemble fini. De nombreuses situations font intervenir des variables continues (temps d'attente, taille, durée de vie, etc.) pour lesquelles \(P(X = x) = 0\) pour tout \(x\) fixé. L'outil pour les décrire n'est plus une loi de probabilité ponctuelle mais une densité.

Définition — Variable aléatoire à densité
Une variable aléatoire \(X\) est dite continue (ou à densité) s'il existe une fonction \(f : \mathbb{R} \to \mathbb{R}_+\) continue par morceaux, d'intégrale totale 1, telle que pour tous réels \(a \leq b\) : \[P(a \leq X \leq b) = \int_a^b f(x)\,dx.\] La fonction \(f\) est la densité de \(X\).
Définition — Loi uniforme continue \(\mathcal{U}([a; b])\)
La variable \(X\) suit la loi uniforme sur \([a; b]\) si sa densité est constante sur \([a; b]\) et nulle en dehors : \[f(x) = \begin{cases} \dfrac{1}{b - a} & \text{si } x \in [a; b] \\ 0 & \text{sinon} \end{cases}\]

On a alors : \(P(c \leq X \leq d) = \dfrac{d - c}{b - a}\) pour \([c; d] \subset [a; b].\)

Espérance : \(E(X) = \dfrac{a + b}{2}.\)

Exemple — Temps d'attente d'un bus

Un bus passe toutes les 10 minutes. Si on arrive à un instant totalement aléatoire à l'arrêt, le temps d'attente \(X\) suit la loi \(\mathcal{U}([0; 10])\).

Probabilité d'attendre moins de 3 minutes : \(P(X \leq 3) = \dfrac{3}{10} = 0{,}3.\)

Temps d'attente moyen : \(E(X) = 5\) min.

Définition — Loi exponentielle \(\mathcal{E}(\lambda)\)
La variable \(X \geq 0\) suit la loi exponentielle de paramètre \(\lambda > 0\) si sa densité est : \[f(x) = \begin{cases} \lambda\,e^{-\lambda x} & \text{si } x \geq 0 \\ 0 & \text{si } x < 0 \end{cases}\]

Propriétés : \(P(X \leq t) = 1 - e^{-\lambda t}\) ; \(E(X) = \dfrac{1}{\lambda}\).

Caractéristique « sans mémoire » : \(P(X > t + s \mid X > t) = P(X > s)\). La loi exponentielle modélise la durée de vie d'un composant dont la défaillance est « sans vieillissement ».

Exemple — Durée de vie d'une ampoule

La durée de vie d'une ampoule LED est modélisée par une loi exponentielle de paramètre \(\lambda = 10^{-4}\) (en heures).

Durée de vie moyenne : \(E(X) = 1/\lambda = 10\,000\) heures.

Probabilité que l'ampoule dure plus de 5000 h : \(P(X > 5000) = e^{-5000 \times 10^{-4}} = e^{-0{,}5} \approx 0{,}61.\)

Ouverture — Loi normale

Une autre loi continue fondamentale est la loi normale \(\mathcal{N}(\mu, \sigma^2)\), à densité en cloche. Elle n'est pas au programme strict de Terminale Spé mais apparaît dans Maths Complémentaires et dans toutes les études supérieures (statistiques, finance, erreurs de mesure).

Le théorème central limite affirme que la somme (ou la moyenne) d'un grand nombre de variables aléatoires indépendantes et identiquement distribuées suit approximativement une loi normale — ce qui explique son omniprésence.

📐 Applets GeoGebra — lois de probabilité

🎯 Applet interactif — Loi Binomiale — visualiser la distribution

Fais varier \(n\) et \(p\) et observe la forme de la loi \(\mathcal{B}(n, p)\). · ↗ Ouvrir en plein écran

Pour approfondir, d'autres applets s'ouvrent en plein écran dans un nouvel onglet :

Banque complète (1245 applets) — voir le catalogue GeoGebra.

Bilan — Formules essentielles

NotionFormule
Loi binomiale \(\mathcal{B}(n,p)\)\(P(X=k) = \binom{n}{k}p^k(1-p)^{n-k}\)
Espérance\(E(X) = np\)
Variance / écart type\(V(X) = np(1-p)\) ; \(\sigma(X) = \sqrt{np(1-p)}\)
Bienaymé-Tchebychev\(P(|Y - \mu| \geq \varepsilon) \leq \dfrac{\sigma^2}{\varepsilon^2}\)
Inégalité de concentration\(P\!\left(\left|\dfrac{X}{n} - p\right| \geq \varepsilon\right) \leq \dfrac{1}{4n\varepsilon^2}\)
Loi faible des grands nombres\(\dfrac{X}{n} \xrightarrow[n \to +\infty]{\text{probabilité}} p\)

Pieges et contre-exemples

Lois de probabilité : teste d’abord ton intuition.

Score : 0 / 6 pieges identifies
1 Espérance du carré

« \(E(X^2) = \bigl(E(X)\bigr)^2\). »

Cette affirmation est-elle correcte ?

Explication

Faux. En général, \(E(X^2) \geq \bigl(E(X)\bigr)^2\) (inégalité de Jensen). La différence est justement la variance : \(V(X) = E(X^2) - \bigl(E(X)\bigr)^2\). L’égalité n’a lieu que si \(V(X) = 0\), c’est-à-dire si \(X\) est constante.

\(E(X^2) \neq E(X)^2\) sauf si la variance est nulle. La formule \(V(X) = E(X^2) - E(X)^2\) le rappelle.

Mini-test : \(X\) uniforme sur \(\{1;2;3\}\). \(E(X) = 2\), \(E(X^2) = ?\)

2 Écart type et coefficient

« \(\sigma(aX) = a\,\sigma(X)\) pour tout réel \(a\). »

Cette affirmation est-elle correcte ?

Explication

Faux. On a \(\sigma(aX) = |a|\,\sigma(X)\), avec la valeur absolue. L’écart type est toujours positif. Si \(a = -3\), alors \(\sigma(-3X) = 3\,\sigma(X)\), pas \(-3\,\sigma(X)\). Pour la variance : \(V(aX) = a^2\,V(X)\).

\(V(aX) = a^2 V(X)\) donc \(\sigma(aX) = |a|\,\sigma(X)\). Ne pas oublier la valeur absolue !

Mini-test : si \(\sigma(X) = 4\), que vaut \(\sigma(-2X)\) ?

3 Loi des grands nombres

« Si on lance une pièce équilibrée un très grand nombre de fois \(n\), on obtient exactement \(X = n/2\) piles. »

Cette affirmation est-elle correcte ?

Explication

Faux. La loi faible des grands nombres affirme que la fréquence \(X/n\) se rapproche de \(p = 1/2\) en probabilité, pas que \(X\) vaut exactement \(n/2\). L’écart type \(\sigma(X) = \sqrt{n/4}\) croît comme \(\sqrt{n}\), donc \(X\) fluctue typiquement de \(\pm\sqrt{n}/2\) autour de \(n/2\).

Ce qui converge, c’est \(X/n \to p\) (fréquence), pas \(X \to np\) (effectif).

Mini-test : \(n = 10\,000\) lancers, \(p = 0{,}5\). Écart type de \(X\) ?

4 Optimalité de Bienaymé-Tchebychev

« L’inégalité de Bienaymé-Tchebychev \(P(|Y - \mu| \geq \varepsilon) \leq \sigma^2/\varepsilon^2\) donne la valeur exacte de la probabilité. »

Cette affirmation est-elle correcte ?

Explication

Faux. C’est un majorant, souvent très grossier. Par exemple pour \(X \sim \mathcal{B}(100; 0{,}5)\), \(\sigma^2 = 25\). Bienaymé donne \(P(|X - 50| \geq 10) \leq 25/100 = 0{,}25\), alors que la vraie probabilité calculée avec la binomiale est d’environ 0,036. Le majorant est juste mais lâche.

Bienaymé borne la probabilité sans la calculer. Pour la valeur exacte : loi binomiale ou simulation.

Mini-test : que garantit l’inégalité \(P(|Y-\mu| \geq \varepsilon) \leq \sigma^2/\varepsilon^2\) ?

5 Linéarité de la variance

« \(V(X + Y) = V(X) + V(Y)\) toujours. »

Cette affirmation est-elle correcte ?

Explication

Faux. \(V(X + Y) = V(X) + V(Y)\) n’est vrai que si \(X\) et \(Y\) sont indépendantes. En général, \(V(X+Y) = V(X) + V(Y) + 2\,\text{Cov}(X,Y)\). L’espérance, elle, est toujours lineaire : \(E(X+Y) = E(X) + E(Y)\).

Espérance : toujours lineaire. Variance : additive seulement si les variables sont indépendantes.

Mini-test : \(V(X + X) = ?\)

6 Concentration de la fréquence

« Pour \(X \sim \mathcal{B}(n;p)\) et tout \(\varepsilon > 0\), on a \(P\!\left(\left|\dfrac{X}{n} - p\right| \geq \varepsilon\right) \leq \dfrac{1}{4n\varepsilon^2}\). »

Cette affirmation est-elle correcte ?

Explication

C’est vrai ! C’est l’inégalité de concentration, conséquence de Bienaymé-Tchebychev appliquée à \(X/n\). On obtient d’abord \(P(|X/n - p| \geq \varepsilon) \leq p(1-p)/(n\varepsilon^2)\), puis on majore \(p(1-p) \leq 1/4\).

C’est ce majorant qui garantit que la fréquence se concentre autour de \(p\) quand \(n \to +\infty\) (loi faible des grands nombres).

Mini-test : \(n = 2500\), \(\varepsilon = 0{,}05\). Majorant de \(P(|X/n - p| \geq 0{,}05)\) ?

➡️ Pour la suite
Ch. 12 — Algorithmique et programmation — Clôture du programme par les aspects computationnels : simulation, méthodes numériques.