7 Graphiques couramment utilisés en statistique

Contents

L’un des objectifs des statistiques est de présenter les données de manière significative. Souvent, les ensembles de données comportent des millions (voire des milliards) de valeurs. C’est beaucoup trop pour être imprimé dans un article de journal ou dans l’encadré d’un magazine. C’est là que les graphiques peuvent être d’une valeur inestimable, permettant aux statisticiens de fournir une interprétation visuelle d’histoires numériques complexes. Sept types de graphiques sont couramment utilisés en statistique.

Les bons graphiques transmettent l’information rapidement et facilement à l’utilisateur. Les graphiques mettent en évidence les principales caractéristiques des données. Ils peuvent montrer des relations qui ne sont pas évidentes à l’étude d’une liste de chiffres. Ils peuvent également fournir un moyen pratique de comparer différents ensembles de données.

Différentes situations nécessitent différents types de graphiques, et il est utile de bien connaître les types disponibles. Le type de données détermine souvent le graphique qu’il convient d’utiliser. Les données qualitatives, les données quantitatives et les données appariées utilisent chacune des types de graphiques différents.

Diagramme de Pareto ou graphique à barres

Un diagramme de Pareto ou un graphique à barres est un moyen de représenter visuellement des données qualitatives. Les données sont affichées horizontalement ou verticalement et permettent de comparer des éléments tels que les quantités, les caractéristiques, les temps et la fréquence. Les barres sont disposées par ordre de fréquence, ce qui permet de mettre l’accent sur les catégories les plus importantes. En regardant toutes les barres, il est facile de dire en un coup d’œil quelles catégories d’un ensemble de données dominent les autres. Les diagrammes à barres peuvent être soit simples, soit empilés, soit groupés.

Vilfredo Pareto (1848-1923) a développé le graphique en barres lorsqu’il a cherché à donner un visage plus « humain » à la prise de décision économique en traçant des données sur du papier graphique, avec le revenu sur un axe et le nombre de personnes à différents niveaux de revenu sur l’autre. Les résultats ont été frappants : Ils ont montré de façon spectaculaire la disparité entre riches et pauvres à chaque époque au cours des siècles.

A lire :  Utiliser la probabilité conditionnelle pour calculer les intersections

Graphique circulaire ou circulaire

Une autre façon courante de représenter les données graphiquement est le diagramme circulaire. Il tire son nom de son aspect, comme une tarte circulaire qui a été coupée en plusieurs tranches. Ce type de graphique est utile pour représenter graphiquement des données qualitatives, où l’information décrit un trait ou un attribut et n’est pas numérique. Chaque tranche de tarte représente une catégorie différente, et chaque trait correspond à une tranche différente de la tarte ; certaines tranches sont généralement sensiblement plus grandes que d’autres. En examinant tous les morceaux de tarte, vous pouvez comparer la quantité de données qui correspondent à chaque catégorie ou tranche.

Histogramme

Un histogramme dans un autre type de graphique qui utilise des barres dans son affichage. Ce type de graphique est utilisé avec des données quantitatives. Les plages de valeurs, appelées classes, sont énumérées en bas, et les classes avec les plus grandes fréquences ont des barres plus hautes.

Un histogramme ressemble souvent à un graphique à barres, mais ils sont différents en raison du niveau de mesure des données. Les diagrammes à barres mesurent la fréquence des données catégorielles. Une variable catégorielle est une variable qui a deux ou plusieurs catégories, comme le sexe ou la couleur des cheveux. Les histogrammes, par contre, sont utilisés pour les données qui impliquent des variables ordinales, ou des choses qui ne sont pas facilement quantifiables, comme les sentiments ou les opinions.

Plot à tiges et à feuilles

Un diagramme à tiges et à feuilles divise chaque valeur d’un ensemble de données quantitatives en deux parties : une tige, généralement pour la valeur de lieu la plus élevée, et une feuille pour les autres valeurs de lieu. Il permet de dresser une liste de toutes les valeurs de données sous une forme compacte. Par exemple, si vous utilisez ce graphique pour examiner les résultats des élèves aux tests de 84, 65, 78, 75, 89, 90, 88, 83, 72, 91 et 90, les tiges seraient 6, 7, 8 et 9, ce qui correspond à la place des dizaines de données. Les feuilles – les chiffres à droite d’une ligne continue – seraient 0, 0, 1 à côté du 9 ; 3, 4, 8, 9 à côté du 8 ; 2, 5, 8 à côté du 7 ; et 2 à côté du 6.

A lire :  Statistiques sur la journée de la marmotte

Cela vous montrerait que quatre élèves ont obtenu un score dans le 90e percentile, trois dans le 80e percentile, deux dans le 70e et un seul dans le 60e. Vous pouvez même voir les performances des élèves de chaque percentile, ce qui en fait un bon graphique pour comprendre à quel point les élèves comprennent la matière.

Plot Dot

Un pointillé est un hybride entre un histogramme et un diagramme à tiges et à feuilles. Chaque valeur de données quantitatives devient un point ou un point qui est placé au-dessus des valeurs de classe appropriées. Lorsque les histogrammes utilisent des rectangles – ou des barres – ces graphiques utilisent des points, qui sont ensuite reliés par une simple ligne, explique statisticshowto.com. Les graphiques en points sont un bon moyen de comparer le temps qu’il faut à un groupe de six ou sept personnes pour préparer le petit déjeuner, par exemple, ou de montrer le pourcentage de personnes qui, dans différents pays, ont accès à l’électricité, selon MathIsFun.

Scatterplots

Un nuage de points affiche des données qui sont appariées en utilisant un axe horizontal (l’axe x) et un axe vertical (l’axe y). Les outils statistiques de corrélation et de régression sont ensuite utilisés pour montrer les tendances sur le nuage de points. Un nuage de points ressemble généralement à une ligne ou une courbe qui se déplace de gauche à droite le long du graphique, avec des points « dispersés » le long de la ligne. Le nuage de points vous aide à découvrir plus d’informations sur n’importe quel ensemble de données, y compris :

  • La tendance générale parmi les variables (Vous pouvez rapidement voir si la tendance est à la hausse ou à la baisse.)
  • Toute valeur aberrante par rapport à la tendance générale.
  • La forme de toute tendance.
  • La force de toute tendance.
A lire :  Comment les combinaisons et les permutations diffèrent

Graphiques de séries chronologiques

Un graphique de séries chronologiques affiche des données à différents moments dans le temps, il s’agit donc d’un autre type de graphique à utiliser pour certains types de données appariées. Comme son nom l’indique, ce type de graphique mesure les tendances dans le temps, mais la période peut être de quelques minutes, heures, jours, mois, années, décennies ou siècles. Par exemple, vous pouvez utiliser ce type de graphique pour représenter la population des États-Unis au cours d’un siècle. L’axe des y indique la croissance de la population, tandis que l’axe des x indique les années, par exemple 1900, 1950, 2000.

Bouton retour en haut de la page

Adblock détecté

Veuillez désactiver votre bloqueur de publicités pour pouvoir visualiser le contenu de la page. Pour un site indépendant avec du contenu gratuit, c’est une question de vie ou de mort d’avoir de la publicité. Merci de votre compréhension!