Qu’est-ce que la règle de l’écart interquartile ?

Contents

La règle de l’écart interquartile est utile pour détecter la présence de valeurs aberrantes. Les valeurs aberrantes sont des valeurs individuelles qui se situent en dehors du schéma global d’un ensemble de données. Cette définition est quelque peu vague et subjective, il est donc utile de disposer d’une règle à appliquer pour déterminer si un point de données est vraiment une valeur aberrante – c’est là qu’intervient la règle de l’écart interquartile.

Qu’est-ce que l’écart interquartile ?

Tout ensemble de données peut être décrit par son résumé en cinq chiffres. Ces cinq chiffres, qui vous donnent les informations dont vous avez besoin pour trouver des modèles et des aberrations, sont les suivants (par ordre croissant)

  • La valeur minimale ou la plus faible de l’ensemble de données
  • Le premier quartile Q1, qui représente un quart de la liste de toutes les données
  • La médiane de l’ensemble des données, qui représente le point médian de toute la liste des données
  • Le troisième quartile Q3, qui représente les trois quarts de la liste de toutes les données
  • La valeur maximale ou la plus élevée de l’ensemble de données.

Ces cinq chiffres en disent plus sur les données d’une personne que le fait de regarder les chiffres d’un seul coup pourrait, ou du moins rendrait la chose beaucoup plus facile. Par exemple, la fourchette, qui est le minimum soustrait du maximum, est un indicateur de la répartition des données dans un ensemble (remarque : la fourchette est très sensible aux valeurs aberrantes – si une valeur aberrante est également un minimum ou un maximum, la fourchette ne sera pas une représentation exacte de l’étendue d’un ensemble de données).

A lire :  Construction, utilisations et exemples de graphiques de séries chronologiques

La portée serait difficile à extrapoler autrement. L’écart interquartile est similaire à la fourchette mais moins sensible aux valeurs aberrantes. L’écart interquartile est calculé de la même manière que l’écart. Tout ce que vous faites pour le trouver est de soustraire le premier quartile du troisième quartile :

IQR = Q3 – Q1.

L’écart interquartile montre comment les données sont réparties autour de la médiane. Il est moins sensible que l’intervalle aux valeurs aberrantes et peut, par conséquent, être plus utile.

Utilisation de la règle interquartile pour déterminer les valeurs aberrantes

Bien qu’il n’en soit pas souvent affecté, l’écart interquartile peut être utilisé pour détecter les valeurs aberrantes. Pour ce faire, il convient de suivre les étapes suivantes :

  1. Calculer l’intervalle interquartile des données.
  2. Multipliez l’écart interquartile (IQR) par 1,5 (une constante utilisée pour discerner les valeurs aberrantes).
  3. Ajouter 1,5 x (IQR) au troisième quartile. Tout nombre supérieur à cette valeur est une valeur aberrante suspectée.
  4. Soustrayez 1,5 x (IQR) du premier quartile. Tout nombre inférieur à cette valeur est une valeur aberrante suspectée.

N’oubliez pas que la règle interquartile n’est qu’une règle empirique qui est généralement valable mais qui ne s’applique pas à tous les cas. En général, vous devez toujours suivre votre analyse des valeurs aberrantes en étudiant les valeurs aberrantes résultantes pour voir si elles ont un sens. Toute valeur aberrante potentielle obtenue par la méthode interquartile doit être examinée dans le contexte de l’ensemble des données.

Exemple de problème de la règle interquartile

Voir la règle de l’écart interquartile à l’œuvre avec un exemple. Supposons que vous ayez l’ensemble de données suivant : 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Le résumé en cinq chiffres de cet ensemble de données est le suivant : minimum = 1, premier quartile = 4, médiane = 7, troisième quartile = 10 et maximum = 17. Vous pouvez regarder les données et dire automatiquement que 17 est une valeur aberrante, mais que dit la règle de l’intervalle interquartile ?

A lire :  Exemple d'un test de permutation

Si vous deviez calculer l’intervalle interquartile pour ces données, vous constateriez qu’il est de

Q3 – Q1 = 10 – 4 = 6

Multipliez maintenant votre réponse par 1,5 pour obtenir 1,5 x 6 = 9. Neuf de moins que le premier quartile est 4 – 9 = -5. Aucune donnée n’est inférieure à cette valeur. Neuf de plus que le troisième quartile est 10 + 9 = 19. Aucune donnée n’est supérieure à cette valeur. Bien que la valeur maximale soit de cinq de plus que le point de données le plus proche, la règle de l’intervalle interquartile montre qu’elle ne devrait probablement pas être considérée comme une valeur aberrante pour cet ensemble de données.

Bouton retour en haut de la page

Adblock détecté

Veuillez désactiver votre bloqueur de publicités pour pouvoir visualiser le contenu de la page. Pour un site indépendant avec du contenu gratuit, c’est une question de vie ou de mort d’avoir de la publicité. Merci de votre compréhension!