Maths Complementaires — Terminale · Math@mine
A la veille d’une election, un institut de sondage interroge 1 000 personnes. Le résultat annonce : 52 % des personnes interrogees ont l’intention de voter pour le candidat A, avec une marge d’erreur de 3 points.
Le candidat A peut-il etre confiant dans sa victoire ? Que signifie exactement cette « marge d’erreur » ? Et si l’on avait interroge seulement 100 personnes, le résultat serait-il aussi fiable ?
Ronald Fisher (1890–1962), biologiste et statisticien britannique, a pose les bases de l’estimation statistique dans les annees 1920 en travaillant a la station agronomique de Rothamsted. Il y a développé la méthode du maximum de vraisemblance pour estimer les parametres d’une population a partir d’un échantillon.
C’est ensuite Jerzy Neyman (1894–1981), mathematicien polonais, qui a formalise en 1937 la notion d'intervalle de confiance : plutot que donner une valeur unique, on fournit un intervalle qui « capture » le vrai parametre avec une probabilite controlee. Cette idee revolutionnaire est aujourd’hui au coeur de tous les sondages, essais cliniques et controles qualite.
Un fabricant de billes affirme que 5 % de sa production est defectueuse. Un controleur preleve un échantillon de 200 billes et en trouve 18 defectueuses, soit 9 %.
Soit \(X\) le nombre d’individus présentant le caractère dans un échantillon de taille \(n\). Alors \(X\) suit la loi binomiale \(\mathcal{B}(n, p)\), et la fréquence observée est \(f = X/n\).
Espérance et variance. Par les propriétés de la loi binomiale :
\(E(f) = \dfrac{E(X)}{n} = \dfrac{np}{n} = p, \qquad V(f) = \dfrac{V(X)}{n^2} = \dfrac{np(1-p)}{n^2} = \dfrac{p(1-p)}{n}.\)
L’écart-type \(\sigma(f) = \sqrt{p(1-p)/n}\) décroît en \(1/\sqrt{n}\) : quand \(n\) augmente, la fréquence se concentre autour de \(p\).
Loi des grands nombres (admise). Formellement, pour tout \(\varepsilon > 0\) :
\(P\bigl(|f - p| < \varepsilon\bigr) \xrightarrow[n\to+\infty]{} 1.\)
C’est la loi faible des grands nombres, admise en Maths Complémentaires. Elle se démontre rigoureusement à partir de l’inégalité de Bienaymé-Tchebychev (hors programme). ∎
On lance une piece equilibree 50 fois. La proportion theorique de « pile » est \(p = 0{,}5\). Si l’on obtient 28 « pile », la frequence observee est \(f = \frac{28}{50} = 0{,}56\). Un autre échantillon de 50 lancers pourrait donner \(f = 0{,}44\). Cette variabilite est normale.
On considere un échantillon de taille \(n\) preleve dans une population ou la proportion du caractere etudie est \(p\). On suppose que \(n\) est assez grand et que \(n p \geq 5\) et \(n(1-p) \geq 5\).
La frequence observee \(f = X/n\), ou \(X \sim \mathcal{B}(n, p)\). Par l’approximation normale (chapitre 8), \(X \approx \mathcal{N}(np, np(1-p))\), donc \(f \approx \mathcal{N}\!\left(p, \frac{p(1-p)}{n}\right)\).
En centrant-reduisant : \(Z = \frac{f - p}{\sqrt{p(1-p)/n}} \approx \mathcal{N}(0,1)\). Or \(P(-1{,}96 \leq Z \leq 1{,}96) \approx 0{,}95\), ce qui donne l’intervalle annonce.
Un laboratoire affirme que son traitement guerit 80 % des patients. Sur un essai de 400 patients, 300 sont gueris, soit \(f = 0{,}75\).
Intervalle de fluctuation pour \(p_0 = 0{,}80\) et \(n = 400\) :
\[I_f = \left[0{,}80 - 1{,}96\sqrt{\frac{0{,}80 \times 0{,}20}{400}} \;;\; 0{,}80 + 1{,}96\sqrt{\frac{0{,}80 \times 0{,}20}{400}}\right] = [0{,}761 \;;\; 0{,}839]\]
Comme \(0{,}75 \notin [0{,}761 ; 0{,}839]\), on rejette l’hypothese du laboratoire au seuil de 5 %.
Notons \(X\) le nombre d’individus du caractère dans un échantillon de taille \(n\). Chaque individu est un tirage de Bernoulli de paramètre \(p\) (probabilité \(p\) d’avoir le caractère, \(1-p\) sinon), indépendants entre eux. Donc \(X \sim \mathcal{B}(n, p)\) et \(E(X) = np\).
La fréquence observée est \(f = X/n\). Par linéarité de l’espérance :
\(E(f) = E\!\left(\dfrac{X}{n}\right) = \dfrac{E(X)}{n} = \dfrac{np}{n} = p.\)
Comme \(E(f) = p\), on dit que \(f\) est un estimateur sans biais de \(p\) : en moyenne (sur tous les échantillons possibles), la fréquence observée donne la bonne valeur. ∎
Notons \(X_1, X_2, \ldots, X_n\) les variables aléatoires correspondant aux \(n\) individus de l’échantillon. Chacune a pour espérance \(E(X_i) = \mu\) (moyenne de la population).
La moyenne empirique est \(\bar{X} = \dfrac{1}{n}\sum_{i=1}^{n} X_i\). Par linéarité de l’espérance :
\(E(\bar{X}) = \dfrac{1}{n}\sum_{i=1}^{n} E(X_i) = \dfrac{1}{n}\cdot n\mu = \mu.\)
Donc \(\bar{X}\) est un estimateur sans biais de \(\mu\). ∎
On mesure la taille de 50 élèves d’un lycee. La moyenne de l’échantillon est \(\bar{x} = 1{,}72\) m. C’est une estimation ponctuelle de la taille moyenne de tous les élèves du lycee. On ne connait pas la valeur exacte de \(\mu\), mais \(\bar{x}\) en donne une approximation.
Contrairement a l’intervalle de fluctuation (ou \(p\) est connu et on encadre \(f\)), l’intervalle de confiance part de la situation inverse : on observe \(f\) et on cherche a encadrer \(p\) inconnu.
Dans l’intervalle de fluctuation, on remplace \(p\) (inconnu) par \(f\) (observe). La demi-largeur est \(1{,}96\sqrt{\frac{f(1-f)}{n}}\). Or le produit \(f(1-f)\) est maximal pour \(f = 0{,}5\), valant \(0{,}25\). Donc \(1{,}96\sqrt{\frac{f(1-f)}{n}} \leq 1{,}96 \times \frac{0{,}5}{\sqrt{n}} = \frac{0{,}98}{\sqrt{n}} \approx \frac{1}{\sqrt{n}}\).
Un sondage sur 625 personnes donne \(f = 0{,}48\) en faveur d’un projet de loi.
Intervalle de confiance simplifie : \(\left[0{,}48 - \frac{1}{\sqrt{625}} \;;\; 0{,}48 + \frac{1}{\sqrt{625}}\right] = [0{,}44 \;;\; 0{,}52]\).
On estime avec 95 % de confiance que la proportion réelle est comprise entre 44 % et 52 %. Le projet n’est donc pas assure de recueillir la majorite.
Si l’on remplace \(n\) par \(4n\), la marge devient \(\frac{1}{\sqrt{4n}} = \frac{1}{2\sqrt{n}}\), soit la moitie de la marge initiale \(\frac{1}{\sqrt{n}}\). C’est une consequence directe de la formule \(\frac{1}{\sqrt{n}}\) et de la propriété \(\sqrt{4n} = 2\sqrt{n}\).
| Taille \(n\) | Marge d’erreur \(\frac{1}{\sqrt{n}}\) | Largeur de l’intervalle |
|---|---|---|
| 100 | 0,10 (10 %) | 20 points |
| 400 | 0,05 (5 %) | 10 points |
| 1 000 | 0,032 (3,2 %) | 6,4 points |
| 10 000 | 0,01 (1 %) | 2 points |
Exemple : Pour une marge d’erreur de 2 %, on a besoin de \(n \geq \frac{1}{0{,}02^2} = 2\,500\) personnes.
Erreur de première espèce (\(\alpha\)). Par construction de l’intervalle de fluctuation au seuil de 95 %, si \(H_0 : p = p_0\) est vraie, alors \(P(f \in I_f) \ge 0{,}95\). Le risque de rejeter \(H_0\) à tort est :
\(\alpha = P(f \notin I_f \mid H_0\text{ vraie}) \le 0{,}05.\)
Ce risque est choisi par le statisticien : prendre un seuil 99 % à la place de 95 % ramènerait \(\alpha\) à 1 %.
Erreur de deuxième espèce (\(\beta\)). Si la vraie proportion est \(p \neq p_0\), la fréquence observée se distribue autour de \(p\) (et non de \(p_0\)). Le risque de ne pas rejeter \(H_0\) à tort est :
\(\beta = P(f \in I_f \mid p \neq p_0).\)
Quand \(n\) augmente, l’écart-type \(\sigma(f) = \sqrt{p(1-p)/n}\) diminue : la fréquence \(f\) est plus concentrée autour de \(p\), donc la probabilité qu’elle tombe dans l’intervalle centré sur \(p_0\) diminue. D’où \(\beta \to 0\) lorsque \(n \to +\infty\).
Compromis. À \(n\) fixé, diminuer \(\alpha\) (intervalle plus large) augmente \(\beta\) (on rejette moins, y compris à tort). Le choix \(\alpha = 5\%\) est un compromis usuel. ∎
Un fabricant annonce que 3 % de ses ampoules sont defectueuses (\(H_0 : p_0 = 0{,}03\)). Un magasin contrôle un lot de 500 ampoules et en trouve 24 defectueuses, soit \(f = 0{,}048\).
Intervalle de fluctuation : \(I_f = \left[0{,}03 - 1{,}96\sqrt{\frac{0{,}03 \times 0{,}97}{500}} \;;\; 0{,}03 + 1{,}96\sqrt{\frac{0{,}03 \times 0{,}97}{500}}\right] \approx [0{,}015 \;;\; 0{,}045]\).
Comme \(0{,}048 \notin [0{,}015 ; 0{,}045]\), le magasin rejette l’hypothese du fabricant : le lot semble contenir plus de 3 % de defauts.
Un institut interroge 1 000 electeurs. Le candidat A obtient \(f = 0{,}52\).
Intervalle de confiance : \(\left[0{,}52 - \frac{1}{\sqrt{1000}} \;;\; 0{,}52 + \frac{1}{\sqrt{1000}}\right] \approx [0{,}488 \;;\; 0{,}552]\).
L’intervalle contient des valeurs inferieures a 0,50. On ne peut donc pas affirmer avec 95 % de confiance que le candidat A sera elu. La course reste ouverte.
Un nouveau médicament est teste sur 200 patients. Le taux de guerison observe est \(f = 0{,}68\). Le traitement de reference guerit 60 % des patients (\(p_0 = 0{,}60\)).
Intervalle de fluctuation pour \(p_0 = 0{,}60\) : \(\left[0{,}60 - 1{,}96\sqrt{\frac{0{,}60 \times 0{,}40}{200}} \;;\; 0{,}60 + 1{,}96\sqrt{\frac{0{,}60 \times 0{,}40}{200}}\right] \approx [0{,}532 \;;\; 0{,}668]\).
Comme \(0{,}68 \notin [0{,}532 ; 0{,}668]\), on rejette l’hypothese \(p = 0{,}60\). Le nouveau médicament semble significativement plus efficace que le traitement de reference.
En physique, chimie ou biologie, l’estimation par intervalle de confiance permet de rendre compte de l’incertitude de mesure. Lorsque l’on repete \(n\) fois une mesure et que l’on obtient une moyenne \(\bar{x}\) et un ecart type \(s\), l’intervalle de confiance pour la vraie valeur est :
\[\left[\bar{x} - 1{,}96 \frac{s}{\sqrt{n}} \;;\; \bar{x} + 1{,}96 \frac{s}{\sqrt{n}}\right]\]
Cette demarche est a la base de l’expression des résultats dans les publications scientifiques.
| Notion | Formule |
|---|---|
| Intervalle de fluctuation (95 %) | \(\left[ p - 1{,}96\sqrt{\dfrac{p(1-p)}{n}} \;;\; p + 1{,}96\sqrt{\dfrac{p(1-p)}{n}} \right]\) |
| Intervalle de confiance simplifie (95 %) | \(\left[ f - \dfrac{1}{\sqrt{n}} \;;\; f + \dfrac{1}{\sqrt{n}} \right]\) |
| Intervalle de confiance precis (95 %) | \(\left[ f - 1{,}96\sqrt{\dfrac{f(1-f)}{n}} \;;\; f + 1{,}96\sqrt{\dfrac{f(1-f)}{n}} \right]\) |
| Marge d’erreur simplifiee | \(\dfrac{1}{\sqrt{n}}\) |
| Taille minimale pour marge \(\varepsilon\) | \(n \geq \dfrac{1}{\varepsilon^2}\) |
| Conditions d’utilisation | \(n \geq 30\), \(np \geq 5\), \(n(1-p) \geq 5\) |
Avec 1 000 personnes interrogees et \(f = 0{,}52\), l’intervalle de confiance simplifie est \([0{,}52 - \frac{1}{\sqrt{1000}} ; 0{,}52 + \frac{1}{\sqrt{1000}}] \approx [0{,}488 ; 0{,}552]\).
Cet intervalle contient 0,50, donc on ne peut pas conclure avec 95 % de confiance que le candidat A obtiendra la majorite.
Avec seulement 100 personnes, la marge serait de 10 points, rendant le sondage encore moins informatif. La precision depend de \(\frac{1}{\sqrt{n}}\).
Sous l’hypothese \(p = 0{,}05\) avec \(n = 200\), l’intervalle de fluctuation asymptotique au seuil 95 % est :
\[I = \left[0{,}05 - 1{,}96\sqrt{\frac{0{,}05 \times 0{,}95}{200}} \;;\; 0{,}05 + 1{,}96\sqrt{\frac{0{,}05 \times 0{,}95}{200}}\right] \approx [0{,}020 \;;\; 0{,}080]\]
La frequence observee \(f = \frac{18}{200} = 0{,}09\) est en dehors de cet intervalle.
Au seuil de 5 %, on rejette l’hypothese du fabricant : la proportion réelle de billes defectueuses semble superieure a 5 %.
Échantillonnage et estimation : teste d’abord ton intuition.
« Pour un sondage national, il faut interroger au moins 1 % de la population. »
Cette affirmation est-elle correcte ?
Faux. La precision depend de la taille de l’échantillon \(n\), pas du ratio \(n/N\). Un échantillon de 1 000 personnes donne la meme precision que la population fasse 1 million ou 100 millions.
Mini-test : pour diviser la marge d’erreur par 2, il faut multiplier \(n\) par :
« L’intervalle de confiance a 95 % contient la vraie proportion avec une probabilite de 95 %. »
Cette affirmation est-elle correcte ?
Faux (nuance subtile). La vraie proportion est fixe. L’intervalle, lui, est aléatoire. La bonne interprétation : si on repete l’experience, 95 % des intervalles construits contiendront la vraie proportion.
Mini-test : sur 100 sondages independants, combien donneront un IC contenant la vraie proportion ?
« Un échantillon de grande taille est toujours representatif. »
Cette affirmation est-elle correcte ?
Faux. Un échantillon biaise reste biaise meme s’il est grand. Exemple celebre : le sondage du Literary Digest (1936) interrogeait 2,4 millions de personnes, mais par telephone — a une epoque ou seuls les riches avaient le telephone. Résultat : prediction fausse.
Mini-test : sonder 10 000 clients d’un magasin de luxe pour estimer le revenu moyen des Francais. Fiable ?
« Si la frequence observee est \(f = 0{,}6\), alors la probabilite est 0,6. »
Cette affirmation est-elle correcte ?
Faux. La frequence est une estimation de la probabilite, entachee d’une incertitude. La vraie probabilite \(p\) est dans l’intervalle de confiance autour de \(f\), pas exactement egale a \(f\).
Mini-test : on lance 100 fois une piece et on obtient 60 faces. La piece est-elle truquee ?
« On peut construire un intervalle de confiance a 100 %. »
Cette affirmation est-elle correcte ?
Faux (en pratique). Un intervalle a 100 % serait \([0 ; 1]\) pour une proportion, ce qui ne donne aucune information. Plus le niveau de confiance est élève, plus l’intervalle est large et moins il est informatif.
Mini-test : pour un IC plus precis (plus etroit), faut-il augmenter ou diminuer le niveau de confiance ?
« Plus \(n\) est grand, plus la frequence observee \(f\) se rapproche de la probabilite theorique \(p\). »
Cette affirmation est-elle correcte ?
C’est vrai ! C’est la loi des grands nombres : la frequence converge vers la probabilite quand le nombre d’experiences augmente.
Mini-test : la frequence de « face » apres 1 000 000 de lancers d’une piece equilibree sera :