Devoir de Philosophie

td inference

Publié le 03/12/2024

Extrait du document

« 1/4 2/4 3/4 4/4 10.

Estimation MTH2302D S.

Le Digabel, École Polytechnique de Montréal A2017 (v2) MTH2302D: estimation 1/50 1/4 2/4 3/4 4/4 Plan 1.

Introduction 2.

Estimation ponctuelle 3.

Estimation par intervalles de confiance 4.

Autres problèmes d’estimation par intervalle de confiance MTH2302D: estimation 2/50 1/4 2/4 3/4 4/4 1.

Introduction 2.

Estimation ponctuelle 3.

Estimation par intervalles de confiance 4.

Autres problèmes d’estimation par intervalle de confiance MTH2302D: estimation 3/50 1/4 2/4 3/4 4/4 Introduction L’inférence statistique consiste à tirer des conclusions sur une population à partir d’un échantillon. Deux parties : I Estimation de paramètres. I Tests d’hypothèses. Estimation de paramètres : deux méthodes : I Estimation ponctuelle. I Estimation par intervalles de confiance. MTH2302D: estimation 4/50 1/4 2/4 3/4 4/4 1.

Introduction 2.

Estimation ponctuelle 3.

Estimation par intervalles de confiance 4.

Autres problèmes d’estimation par intervalle de confiance MTH2302D: estimation 5/50 1/4 2/4 3/4 4/4 Estimation ponctuelle But : estimer un paramètre d’une population à l’aide d’une statistique. Définition Soit X une variable aléatoire dont la distribution dépend d’un paramètre θ.

Soit X1 , .

.

.

, Xn un échantillon aléatoire de X de taille n. Un estimateur ponctuel de θ est une statistique θ̂ de la forme θ̂ = h(X1 , .

.

.

, Xn ) et vérifiant certains critères. MTH2302D: estimation 6/50 1/4 2/4 3/4 4/4 Exemple 1 Soit X une variable aléatoire et X1 , .

.

.

, Xn un échantillon de taille n.

Alors n 1X I θ̂1 = X = Xi n i=1 I θ̂2 = Xi (une valeur individuelle) sont des estimateurs de la moyenne θ = µ = E(X). MTH2302D: estimation 7/50 1/4 2/4 3/4 4/4 Exemple 2 Soit X une variable aléatoire et X1 , .

.

.

, Xn un échantillon de taille n.

Alors n 1 X I θ̂1 = S 2 = (Xi − X)2 n−1 i=1 I n 1X 2 (Xi − X)2 θ̂2 = Sn = n i=1 sont des estimateurs de la variance θ = σ 2 = V(X). MTH2302D: estimation 8/50 1/4 2/4 3/4 4/4 Trois critères pour la qualité d’un estimateur Critère 1 : le biais Le biais d’un estimateur θ̂ du paramètre θ est Biais(θ̂) = E(θ̂) − θ. On dit que θ̂ est sans biais ou non-biaisé si Biais(θ̂) = 0. Le biais est une mesure de l’erreur systématique faite en approximant θ par θ̂. Exemple 3 Prouver que E(X) = µ et E(S 2 ) = σ 2 et donc que X et S 2 sont des estimateurs sans biais de µ et σ 2 . MTH2302D: estimation 9/50 1/4 2/4 3/4 4/4 Trois critères pour la qualité d’un estimateur (suite) Critère 2 : Erreur quadratique moyenne Définition L’erreur quadratique moyenne (EQM) d’un estimateur θ̂ du paramètre θ est h i EQM(θ̂) = E (θ̂ − θ)2 . L’EQM est une mesure de la précision d’un estimateur. Théorème Si θ̂ est un estimateur du paramètre θ alors h i2 EQM(θ̂) = V(θ̂) + Biais(θ̂) . MTH2302D: estimation 10/50 1/4 2/4 3/4 4/4 Trois critères pour la qualité d’un estimateur (suite) Critère 2 : Erreur quadratique moyenne (suite) Le meilleur de deux estimateur θ̂1 et θ̂2 , c’est-à-dire le plus efficace, est celui qui a la plus petite EQM : θ̂1 est plus efficace que θ̂2 si EQM(θ̂1 ) < EQM(θ̂2 ) ⇔ EQM(θ̂1 ) EQM(θ̂2 ) < 1. Lorsque deux estimateurs son non biaisés, ceci revient à dire que le plus efficace est celui dont la variance est la plus petite. MTH2302D: estimation 11/50 1/4 2/4 3/4 4/4 Exemple 4 Soit X1 , X2 , .

.

.

, X5 un échantillon aléatoire d’une v.a.

X telle que E(X) = µ et V(X) = σ 2 .

Pour estimer µ, on considère X1 + .

.

.

+ X5 2X1 − X2 + X4 θˆ1 = et θˆ2 = . 5 2 1.

Ces deux estimateurs sont-ils non-biaisés ? 2.

Quel est le meilleur des deux ? MTH2302D: estimation 12/50 1/4 2/4 3/4 4/4 Trois critères pour la qualité d’un estimateur (suite) Critère 3 : Convergence Dénotons par θ̂n un estimateur du paramètre θ calculé à partir d’un échantillon de taille n. Définition Un estimateur θ̂n est convergent si pour tout ε > 0   lim P |θ̂n − θ| < ε = 1. n→∞ Ceci signifie : si la taille de l’échantillon est assez grande alors on est (presque) certain que l’estimateur θ̂n est très proche de θ. Théorème Si EQM(θ̂n ) converge vers 0 lorsque n → ∞ alors θ̂n est convergent. MTH2302D: estimation 13/50 1/4 2/4 3/4 4/4 Méthode des moments I La plupart des lois que nous avons vues sont déterminées par un ou deux paramètres généralement liés aux deux premiers moments de la v.a., µ01 = µ et µ02 = σ 2 . I Soit X ∼ Loi(θ1 , θ2 ) avec θ1 et θ2 inconnus mais dépendants des deux premiers moments.

Si X1 , X2 , .

.

.

, Xn est un échantillon de taille n des valeurs de X, on peut définir les deux premiers moments de l’échantillon par rapport à l’origine : n 1X k 0 Xi avec k ∈ {1, 2} . mk = n i=1 Ainsi on peut estimer µ par µ̂ = m01 et σ 2 par σ̂ 2 = m02 − (m01 )2 , et donc θ1 et θ2 . MTH2302D: estimation 14/50 1/4 2/4 3/4 4/4 Exemple 5 Soit X ∼ Unif(0, a).

Quel est l’estimateur â du paramètre a par la méthode des moments ? MTH2302D: estimation 15/50 1/4 2/4 3/4 4/4 Méthode du maximum de vraisemblance Soit X une variable aléatoire dont la distribution est donnée par f (x, θ), où θ est un paramètre inconnu. Soit x1 , .

.

.

, xn une réalisation (valeurs observées) d’un échantillon aléatoire de taille n de X. Définition La fonction de vraisemblance de cet échantillon est L(θ) = f (x1 , θ)f (x2 , θ) · · · f (xn , θ). Intuitivement, L(θ) est la probabilité d’observer les x1 , x2 , .

.

.

, xn : P (X1 = x1 ∩ X2 = x2 ∩ .

.

.

∩ Xn = xn ). Définition L’estimateur de vraisemblance maximale de θ est la valeur θ̂ pour laquelle L(θ) atteint son maximum. MTH2302D: estimation 16/50 1/4 2/4 3/4 4/4 Exemple 6 Soit X ∼ Bern(p).

Quel est l’estimateur p̂ du paramètre p par la méthode du maximum de vraisemblance ? Voir exemple 10.5 page 235 (2ème édition) / exemple 9.5 page 248 (3ème édition) pour la loi normale. MTH2302D: estimation 17/50 1/4 2/4 3/4 4/4 1.

Introduction 2.

Estimation ponctuelle 3.

Estimation par intervalles de confiance 4.

Autres problèmes d’estimation par intervalle de confiance MTH2302D: estimation 18/50 1/4 2/4 3/4 4/4 Intervalles de confiance (IC) Idée : Soit θ un paramètre de la distribution d’une variable aléatoire X. À partir d’un échantillon, on cherche à déterminer un intervalle [L, U ] qui contient θ avec une probabilité donnée. Sur ce dessin, par ex.

: P (L ≤ µ ≤ U ) ' 87%. MTH2302D: estimation µ 19/50 1/4 2/4 3/4 4/4 Intervalles de confiance (suite) Définition Soit X une variable aléatoire et θ un paramètre de sa distribution. Soit X1 , .

.

.

, Xn un échantillon de taille n de X. Si L ≡ L(X1 , .

.

.

, Xn ) et U ≡ U (X1 , .

.

.

, Xn ) sont deux statistiques telles que P (L ≤ θ ≤ U ) = 1 − α alors on dit que [L, U ] est un intervalle de confiance pour θ de niveau de confiance 1 − α. MTH2302D: estimation 20/50 1/4 2/4 3/4 4/4 IC pour la moyenne µ : cas où σ 2 est connue Rappel : si X ∼ N(µ, σ 2 ) ou si la taille n de l’échantillon est grand alors X −µ √ ∼ N(0, 1). σ/ n Théorème Dans ce cas, l’intervalle de confiance à 100(1 − α)% pour µ est σ σ X − zα/2 √ ≤ µ ≤ X + zα/2 √ n n où zα/2 est un nombre tel que Φ(zα/2 ) = 1 − α/2. Exemple 7 Prouver le théorème. MTH2302D: estimation 21/50 1/4 2/4 3/4 4/4 IC pour la moyenne µ : cas où σ 2 est connue (suite) Remarques : 1.

La valeur de zα/2 dépend du niveau de confiance voulu : par exemple, avec la table du site du cours, on a : I I I Si 1 − α = 0.90, alors zα/2 ' 1.645. Si 1 − α = 0.95, alors zα/2 ' 1.960. Si 1 − α = 0.99, alors zα/2 ' 2.576. 2.

On peut aussi considérer un intervalle unilatéral, de la forme [L, ∞[ ou ] − ∞, U ] correspondant à P (µ ≥ L) = 1 − α ou P (µ ≤ U ) = 1 − α. Dans ce.... »

↓↓↓ APERÇU DU DOCUMENT ↓↓↓