Mesures de variabilité

Mesures de variabilité
Figure 1.- Les mesures de variabilité les plus connues. Source: F. Zapata.

Quelles sont les mesures de variabilité?

Le Mesures de variabilité, Également appelés mesures de dispersion, ce sont des indicateurs statistiques qui indiquent à quel point les données de leur moyenne arithmétique sont étroites ou éloignées. Si les données sont proches de la moyenne, la distribution est concentrée, et si elles sont loin, c'est alors une distribution dispersée.

Il existe de nombreuses mesures de variabilité, parmi les plus connues:

  • Gamme
  • Déviation moyenne
  • Variance
  • Écart-type

Ces mesures complètent les mesures de tendance centrale et sont nécessaires pour comprendre la distribution des données obtenues et extraire autant d'informations que possible.

Gamme

La plage ou l'itinéraire mesure l'amplitude d'un ensemble de données. Pour déterminer sa valeur, la différence entre la valeur la plus élevée x est trouvéemax Et le moins de valeur xmin:

R = xmax - Xmin

Si les données ne sont pas lâches mais regroupées par intervalle, la plage est calculée par la différence entre la limite supérieure du dernier intervalle et la limite inférieure du premier intervalle.

Lorsque la plage est une petite valeur, cela signifie que toutes les données sont assez proches les unes des autres, mais une grande plage indique qu'il y a beaucoup de variabilité. Il est évident que, en dehors de la limite supérieure et de la limite inférieure des données, la plage ne prend pas en compte les valeurs entre elles, il n'est donc pas conseillé de l'utiliser lorsque le numéro de données est important.

Cependant, c'est une mesure immédiate à calculer et a les mêmes unités de données, il est donc facile de l'interpréter.

Exemple de rang

Ensuite, la liste est disponible avec le nombre de buts marqués pendant le week-end, dans les ligues de football de neuf pays:

Peut vous servir: quels sont les diviseurs de 30? (Explication)

40, 32, 35, 36, 37, 31, 37, 29, 39

C'est un ensemble de données sans regrouper. Pour trouver la gamme, ils procèdent à les commander du moins au plus grand:

29, 31, 32, 35, 36, 37, 37, 39, 40

Les données avec la valeur la plus élevée sont de 40 buts et celle avec la valeur la plus basse est de 29 buts, donc la plage est:

R = 40−29 = 11 buts.

On peut considérer que la plage est petite par rapport aux données de valeur minimale, qui sont de 29 objectifs, il peut donc être supposé que les données n'ont pas une grande variabilité.

Déviation moyenne

Cette mesure de variabilité est calculée par la moyenne des valeurs absolues des écarts par rapport à la moyenne. Dénotant l'écart moyen comme dM, Pour les données non groupées, l'écart moyen est calculé par la formule suivante:

Où n est le nombre de données disponibles, xToi Il représente chaque données et X̄ est la moyenne, qui est déterminée en ajoutant toutes les données et en divisant entre n:

L'écart moyen permet de savoir, en moyenne, le nombre d'unités que les données s'écartent de la moyenne arithmétique et ont l'avantage d'avoir les mêmes unités que les données avec lesquelles elle fonctionne.

Exemple d'écart moyen

Selon les données de la gamme, le nombre d'objectifs marqués est:

40, 32, 35, 36, 37, 31, 37, 29, 39

Si vous voulez trouver la déviation moyenne DM De ces données, il est nécessaire de calculer d'abord la moyenne arithmétique x̄:

Et maintenant que la valeur de X̄ est connue, nous procédons à la déviation moyenneM:

= 2.99 ≈ 3 buts

Par conséquent, on peut dire qu'en moyenne, les données s'éloignent approximativement de 3 buts moyens qui sont de 35 buts, et comme indiqué, c'est une mesure beaucoup plus précise que la plage.

Peut vous servir: hyperbole

Variance

L'écart moyen est une mesure de variabilité beaucoup plus mince que la plage, mais comme calculé par la valeur absolue des différences entre chaque données et la moyenne, elle n'offre pas une plus grande polyvalence du point de vue algébrique.

Par conséquent, la variance est préférée, ce qui correspond à la moyenne de la différence quadratique de chaque données avec la moyenne et est calculée à l'aide de la formule:

Dans cette expression, s2 indique la variance, et comme toujours xToi représente chacune des données, x̄ est la moyenne et n les données totales.

Lorsque vous travaillez avec un échantillon au lieu de la population, il est préféré de calculer la variance comme celle-ci:

La différence avec la formule précédente est que dans le dénominateur il y a n - 1 au lieu de n. Il arrive qu'en divisant par N, la variance de l'échantillon sous-estime la variance de la population à partir de laquelle il a été extrait, mais pas lorsqu'il est divisé par N - 1. Dans certains textes, cette expression apparaît avec le nom de quasi-variza.

Dans tous les cas, la variance est caractérisée par le fait d'être toujours une quantité positive, mais étant la moyenne des différences quadratiques, il est important d'observer qu'il n'a pas les mêmes unités que celles des données.

Exemple de variance

Pour calculer la variance des données des exemples de plage et d'écart moyen, les valeurs correspondantes sont remplacées et la somme indiquée. Dans ce cas, il est choisi pour diviser entre N-1:

= 13.86

Écart-type

La variance n'a pas la même unité que celle de la variable à l'étude, par exemple, si les données sont disponibles en mètres, la variance entraîne des mètres carrés. Ou dans l'exemple des objectifs qu'il serait dans les buts au carré, ce qui n'a aucun sens.

Peut vous servir: quels sont les éléments de la parabole? (Les pièces)

Par conséquent, l'écart type est défini, également appelé déviation typique, Comme la racine carrée de la variance:

S = √s2

De cette façon, une mesure de variabilité des données est obtenue dans les mêmes unités que celles-ci, et plus la valeur de S est faible, plus les données sont groupées autour de la moyenne.

La variance et l'écart type sont les mesures de variabilité à choisir lorsque la moyenne arithmétique est la mesure de la tendance centrale qui décrit le mieux le comportement des données.

Et c'est que l'écart type a une propriété importante, connue sous le nom de théorème de Chebyshev: au moins 75% des observations sont dans l'intervalle défini par X ± 2s. En d'autres termes, 75% des données sont, au plus, à une distance égale à 2.

De même, au moins 89% des valeurs sont à une distance de 3 s par rapport à la moyenne, un pourcentage qui peut être élargi, à condition que de nombreuses données soient disponibles et celles-ci suivent une distribution normale.

Figure 2.- Si les données suivent une distribution normale, 95.4 d'entre eux sont deux écarts-types des deux côtés de la moyenne. Source: Wikimedia Commons.

Exemple d'écart type

L'écart type des données présentées dans les exemples précédents est:

S = √s2 = √13.86 = 3.7 ≈ 4 buts