Exemples d’intervalles de confiance pour les moyens

L’une des parties principales des statistiques inférentielles est le développement de méthodes de calcul des intervalles de confiance. Les intervalles de confiance nous fournissent un moyen d’estimer un paramètre de la population. Plutôt que de dire que le paramètre est égal à une valeur exacte, nous disons que le paramètre se situe dans une fourchette de valeurs. Cette plage de valeurs est généralement une estimation, avec une marge d’erreur que nous ajoutons et soustrayons de l’estimation.

À chaque intervalle est associé un niveau de confiance. Le niveau de confiance donne une mesure de la fréquence à laquelle, à long terme, la méthode utilisée pour obtenir notre intervalle de confiance saisit le véritable paramètre de la population.

Il est utile, lorsque l’on apprend à connaître les statistiques, de voir quelques exemples élaborés. Ci-dessous, nous allons examiner plusieurs exemples d’intervalles de confiance concernant une moyenne de population. Nous verrons que la méthode que nous utilisons pour construire un intervalle de confiance sur une moyenne dépend d’informations complémentaires sur notre population. Plus précisément, l’approche que nous adoptons dépend du fait que nous connaissons ou non l’écart type de la population.

Énoncé des problèmes

Nous commençons par un simple échantillon aléatoire de 25 tritons d’une espèce particulière et nous mesurons leur queue. La longueur moyenne de la queue de notre échantillon est de 5 cm.

  1. Si nous savons que 0,2 cm est l’écart-type de la longueur de la queue de tous les tritons de la population, quel est alors l’intervalle de confiance à 90 % de la longueur moyenne de la queue de tous les tritons de la population ?
  2. Si nous savons que 0,2 cm est l’écart-type de la longueur de la queue de tous les tritons de la population, quel est l’intervalle de confiance à 95% de la longueur moyenne de la queue de tous les tritons de la population ?
  3. Si nous constatons que 0,2 cm est l’écart-type de la longueur de la queue des tritons dans notre échantillon de la population, quel est alors l’intervalle de confiance à 90 % pour la longueur moyenne de la queue de tous les tritons de la population ?
  4. Si nous constatons que 0,2 cm est l’écart-type de la longueur de la queue des tritons dans notre échantillon de la population, quel est alors l’intervalle de confiance à 95% pour la longueur moyenne de la queue de tous les tritons de la population ?
A lire  Exemple de calcul d'ANOVA

Discussion des problèmes

Nous commençons par analyser chacun de ces problèmes. Dans les deux premiers problèmes, nous connaissons la valeur de l’écart-type de la population. La différence entre ces deux problèmes est que le niveau de confiance est plus élevé en #2 qu’en #1.

Pour les deux autres problèmes, l’écart-type de la population est inconnu. Pour ces deux problèmes, nous estimerons ce paramètre avec l’écart-type de l’échantillon. Comme nous l’avons vu dans les deux premiers problèmes, nous avons ici aussi différents niveaux de confiance.

Solutions

Nous calculerons des solutions pour chacun des problèmes ci-dessus.

  1. Comme nous connaissons l’écart-type de la population, nous utiliserons un tableau de z-scores. La valeur de z qui correspond à un intervalle de confiance de 90 % est de 1,645. En utilisant la formule pour la marge d’erreur, nous avons un intervalle de confiance de 5 – 1,645(0,2/5) à 5 + 1,645(0,2/5). (Le 5 au dénominateur est ici dû au fait que nous avons pris la racine carrée de 25). Après avoir effectué le calcul, nous avons 4,934 cm à 5,066 cm comme intervalle de confiance pour la moyenne de la population.
  2. Comme nous connaissons l’écart-type de la population, nous utiliserons un tableau de z-scores. La valeur de z qui correspond à un intervalle de confiance de 95% est de 1,96. En utilisant la formule pour la marge d’erreur, nous avons un intervalle de confiance de 5 – 1,96(0,2/5) à 5 + 1,96(0,2/5). Après avoir effectué le calcul, nous avons un intervalle de confiance de 4,922 cm à 5,078 cm pour la moyenne de la population.
  3. Ici, nous ne connaissons pas l’écart type de la population, mais seulement l’écart type de l’échantillon. Nous utiliserons donc un tableau de t-scores. Lorsque nous utilisons un tableau de t-scores, nous devons savoir de combien de degrés de liberté nous disposons. Dans ce cas, il y a 24 degrés de liberté, soit un de moins que la taille de l’échantillon qui est de 25. La valeur de t qui correspond à un intervalle de confiance de 90 % est de 1,71. En utilisant la formule pour la marge d’erreur, nous avons un intervalle de confiance de 5 – 1,71(0,2/5) à 5 + 1,71(0,2/5). Après avoir effectué le calcul, nous avons un intervalle de confiance de 4,932 cm à 5,068 cm pour la moyenne de la population.
  4. Ici, nous ne connaissons pas l’écart type de la population, mais seulement l’écart type de l’échantillon. Nous utiliserons donc à nouveau un tableau de t-scores. Il y a 24 degrés de liberté, soit un de moins que la taille de l’échantillon qui est de 25. La valeur de t qui correspond à un intervalle de confiance de 95% est de 2,06. En utilisant la formule pour la marge d’erreur, nous avons un intervalle de confiance de 5 – 2,06(0,2/5) à 5 + 2,06(0,2/5). Après avoir effectué le calcul, nous avons un intervalle de confiance de 4,912 cm à 5,082 cm pour la moyenne de la population.
A lire  Répartition des probabilités dans les statistiques

Discussion des solutions

Il y a quelques éléments à noter dans la comparaison de ces solutions. La première est que, dans chaque cas, plus notre niveau de confiance augmente, plus la valeur de z ou t que nous avons obtenue est élevée. La raison en est que pour être plus sûr que nous avons bien saisi la moyenne de la population dans notre intervalle de confiance, nous avons besoin d’un intervalle plus large.

L’autre caractéristique à noter est que pour un intervalle de confiance particulier, ceux qui utilisent t sont plus larges que ceux qui utilisent z. La raison en est qu’une distribution t a une plus grande variabilité dans ses queues qu’une distribution normale standard.

La clé pour résoudre correctement ce type de problèmes est que si nous connaissons l’écart type de la population, nous utilisons un tableau de scores z. Si nous ne connaissons pas l’écart-type de la population, nous utilisons un tableau de t scores.

Bouton retour en haut de la page