Qu’est-ce qu’une distribution d’échantillons ?

L’échantillonnage statistique est assez souvent utilisé en statistique. Dans ce processus, nous cherchons à déterminer quelque chose sur une population. Comme les populations sont généralement de grande taille, nous formons un échantillon statistique en sélectionnant un sous-ensemble de la population qui est d’une taille prédéterminée. En étudiant l’échantillon, nous pouvons utiliser des statistiques inférentielles pour déterminer quelque chose sur la population.

Un échantillon statistique de taille n implique un seul groupe de n individus ou sujets qui ont été choisis au hasard dans la population. La distribution de l’échantillon est étroitement liée au concept d’échantillon statistique.

Origine des distributions d’échantillons

Une distribution d’échantillonnage se produit lorsque nous formons plus d’un échantillon aléatoire simple de même taille à partir d’une population donnée. Ces échantillons sont considérés comme indépendants les uns des autres. Ainsi, si un individu fait partie d’un échantillon, il a la même probabilité d’être dans l’échantillon suivant qui est prélevé.

Nous calculons une statistique particulière pour chaque échantillon. Il peut s’agir d’une moyenne d’échantillon, d’une variance d’échantillon ou d’une proportion d’échantillon. Comme une statistique dépend de l’échantillon dont nous disposons, chaque échantillon produira généralement une valeur différente pour la statistique en question. La fourchette des valeurs produites est ce qui nous donne notre distribution d’échantillonnage.

Répartition de l’échantillon pour les moyens

Pour un exemple, nous allons considérer la distribution de l’échantillonnage pour la moyenne. La moyenne d’une population est un paramètre qui est généralement inconnu. Si nous sélectionnons un échantillon de taille 100, alors la moyenne de cet échantillon est facilement calculée en additionnant toutes les valeurs et en les divisant ensuite par le nombre total de points de données, dans ce cas, 100. Un échantillon de taille 100 peut nous donner une moyenne de 50. Un autre échantillon de ce type peut avoir une moyenne de 49. Un autre échantillon de 51 et un autre encore peuvent avoir une moyenne de 50,5.

A lire  Qu'est-ce que la règle de l'écart interquartile ?

La distribution de ces moyens d’échantillonnage nous donne une distribution d’échantillonnage. Nous voudrions considérer plus que quatre moyennes d’échantillon comme nous l’avons fait ci-dessus. Avec plusieurs moyens d’échantillonnage supplémentaires, nous aurions une bonne idée de la forme de la distribution de l’échantillonnage.

Pourquoi nous en soucions-nous ?

Les distributions d’échantillons peuvent sembler assez abstraites et théoriques. Cependant, leur utilisation a des conséquences très importantes. L’un des principaux avantages est que nous éliminons la variabilité présente dans les statistiques.

Par exemple, supposons que nous commencions avec une population dont la moyenne est de μ et l’écart type de σ. L’écart-type nous donne une mesure de l’étendue de la distribution. Nous le comparerons à une distribution d’échantillonnage obtenue en formant des échantillons aléatoires simples de taille n. La distribution d’échantillonnage de la moyenne aura toujours une moyenne de μ, mais l’écart-type est différent. L’écart-type pour une distribution d’échantillonnage devient σ / √ n.

Nous avons donc les éléments suivants

  • Une taille d’échantillon de 4 nous permet d’avoir une distribution d’échantillonnage avec un écart-type de σ/2.
  • Une taille d’échantillon de 9 nous permet d’avoir une distribution d’échantillonnage avec un écart-type de σ/3.
  • Une taille d’échantillon de 25 nous permet d’avoir une distribution d’échantillonnage avec un écart-type de σ/5.
  • Une taille d’échantillon de 100 nous permet d’avoir une distribution d’échantillon avec un écart type de σ/10.

En pratique

Dans la pratique des statistiques, nous formons rarement des distributions d’échantillons. Nous traitons plutôt les statistiques dérivées d’un simple échantillon aléatoire de taille n comme si elles se trouvaient à un point d’une distribution d’échantillonnage correspondante. Cela souligne une fois de plus pourquoi nous souhaitons avoir des échantillons de taille relativement importante. Plus la taille de l’échantillon est importante, moins nous obtiendrons de variation dans nos statistiques.

A lire  Calcul de l'écart moyen absolu

Notez que, à part le centre et la propagation, nous ne pouvons rien dire sur la forme de notre distribution d’échantillonnage. Il s’avère que dans certaines conditions assez larges, le Théorème de la limite centrale peut être appliqué pour nous dire quelque chose d’assez étonnant sur la forme d’une distribution d’échantillonnage.

Bouton retour en haut de la page