Quelle est la gamme statistique? (Avec des exemples)

Quelle est la gamme statistique? (Avec des exemples)

Il gamme, La visite ou l'amplitude, en statistiques, est la différence (soustraction) entre la valeur maximale et la valeur minimale d'un ensemble de données d'un échantillon ou d'une population. Si la plage avec la lettre R et les données sont représentées par X, La formule de la gamme est simplement:

R = xmax - Xmin

 Où xmax C'est la valeur maximale des données et xmin C'est le minimum.

Figure 1. Éventail de données correspondant à la population de Cadiz au cours des deux derniers siècles. Source: Wikimedia Commons.

Le concept est très utile comme une simple mesure de dispersion pour apprécier rapidement la variabilité des données, car elle indique l'extension ou la longueur de l'intervalle où elles sont trouvées.

Par exemple, supposons que la stature d'un groupe de 25 étudiants masculins de la première année d'ingénierie dans une université. L'élève le plus élevé du groupe mesure 1.93 m et le plus bas 1.67 m. Ce sont les valeurs extrêmes des données de l'échantillon, donc la route d'entre elles est:

R = 1.93 - 1.67 m = 0.26 m ou 26 cm.

La stature des étudiants de ce groupe est distribuée tout au long de cette gamme.

[TOC]

Avantages et inconvénients

La gamme est, comme nous l'avons dit précédemment, une mesure de la dispersion des données. Une petite plage indique que les données sont plus ou moins proches et que la dispersion est petite. D'un autre côté, une plus grande portée indique que les données sont plus dispersées.

Les avantages du calcul de la gamme sont évidents: il est très simple et rapide à trouver, car c'est une simple différence.

Il a également les mêmes unités que les données avec lesquelles elle fonctionne et le concept est très facile à interpréter pour tout observateur.

Dans l'exemple de la stature des étudiants en génie, si la gamme avait été de 5 cm, nous dirions que les étudiants ont tous la même taille. Mais avec une fourchette de 26 cm, nous supposons immédiatement que dans l'échantillon, il y a des étudiants de toutes les statistiques intermédiaires. Cette hypothèse est-elle toujours correcte?

Il peut vous servir: différence entre cercle et circonférence (avec des exemples)

Inconvénients de la gamme en tant que mesure de dispersion

Si nous regardons attentivement, dans notre échantillon de 25 étudiants en génie, une seule des mesures 1.93 et ​​les 24 autres ont des statistiques proches de 1.67 m.

Et pourtant, la gamme reste la même, bien qu'il soit parfaitement possible que l'inverse se produise: que la stature de la majorité oscille autour de 1.90 m et une seule mesure 1.67 m.

Dans tous les cas, la distribution des données est très différente.

Les inconvénients de la plage en tant que mesure de dispersion sont dus au fait qu'il n'utilise que des valeurs extrêmes et ignore tous les autres. Comme la plupart des informations sont perdues, il n'y a aucune idée de la façon dont les données d'échantillons sont distribuées.

Une autre caractéristique importante est que la plage de l'échantillon ne diminue jamais. Si nous ajoutons plus d'informations, c'est-à-dire que nous considérons plus de données, la plage augmente ou reste la même.

Et en tout cas, il n'est utile que lorsque vous travaillez avec de petits échantillons, son utilisation unique n'est pas recommandée comme mesure de la dispersion dans de grands échantillons.

Ce qui doit être fait, c'est compléter le calcul d'autres mesures de dispersion qui prennent en compte les informations fournies par les données totales: route Interquartilique, variance, écart-type et coefficient de variation.

Voie interquile, quartiles et exemple résolu

Nous avons réalisé que la faiblesse de la plage en tant que mesure de dispersion est qu'elle utilise uniquement les valeurs extrêmes de la distribution des données, omettant les autres.

Pour éviter cet inconvénient, le quartiles: trois valeurs appelées mesures de position.

Ils distribuent les données non regroupées en quatre parties (d'autres mesures de position largement utilisées sont les Déciles et les centiles). Ce sont ses caractéristiques:

-Le premier quartile Q1 C'est la valeur des données de telle sorte que 25% de tous sont inférieurs à Q1.

Peut vous servir: Constructions de proportionnalité: ce qui est, calcul, exercices

-Le deuxième quartile Q2 C'est le médian de la distribution, ce qui signifie que la moitié (50%) des données sont inférieures à cette valeur.

-Enfin le troisième quartile Q3 souligne que 75% des données sont inférieures à Q3.

Ensuite, la plage interquotitile ou la route interquartile est définie comme la différence entre le troisième quartile Q3 et le premier quartile Q1 des données:

Journey interquotitaire = RQ = Q3 - Q1

De cette façon, la valeur du rang rQ Il n'est pas si affecté par des valeurs extrêmes. Par conséquent, il est conseillé de l'utiliser en ce qui concerne les distributions biaisées, telles que les étudiants très élevés ou très bas décrits ci-dessus.

- Calcul de Cuartyles

Il existe plusieurs façons de les calculer, ici nous en proposerons un, mais en tout cas il est nécessaire de connaître le numéro de commande "Nsoit», Qui est l'endroit qui occupe le quartile respectif dans la distribution.

C'est-à-dire, si par exemple le terme correspondant à q1 est le deuxième, troisième ou quatrième et ainsi de suite.

Premier quartile

Nsoit (Q1) = (N + 1) / 4

Deuxième quartile ou médian

Nsoit (Q2) = (N + 1) / 2

Troisième quartile

Nsoit (Q3) = 3 (n + 1) / 4

Où n est le numéro de données.

La médiane est la valeur qui est juste au milieu de la distribution. Si le numéro de données est étrange, il n'y a aucun problème à le trouver, mais s'il est uniforme, les deux valeurs centrales sont moyennées pour les transformer en une.

Une fois le numéro de commande calculé, l'une de ces trois règles est suivie:

-Si vous n'avez pas de décimales, les données indiquées dans la distribution sont recherchées et ce sera la quatrième recherche.

-Lorsque le numéro de commande est à mi-chemin entre deux, les données indiquées par la partie entière avec le fait suivant sont moyennées, et le résultat est le quartile correspondant.

-Dans tout autre cas, l'entier le plus proche est arrondis et ce sera la quatrième place.

Peut vous servir: principe additif

Exemple résolu

Sur une échelle de 0 à 20, un groupe de 16 étudiants en mathématiques, j'ai obtenu les notes (points) suivantes à un examen partiel:

16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14

Trouver:

a) la route des données ou des données.

b) Les valeurs des quartiles q1 et alors3

c) la gamme interquartil.

Figure 2. Les qualifications de cet examen de mathématiques font-elles tellement de variabilité? Source: Pixabay.

Solution à

La première chose à faire pour trouver l'itinéraire est d'ordonner les données augmentant ou diminuant. Par exemple, dans l'ordre croissant, vous avez:

1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20

À travers la formule donnée au début: r = xmax - Xmin

R = 20 - 1 point = 19 points.

Selon le résultat, ces notes ont une grande dispersion.

Solution B

N = 16

Nsoit (Q1) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4.25

C'est un nombre avec des décimales, dont la partie entière est 4. Ensuite, nous allons à la distribution, les données qui occupent la quatrième place sont recherchées et sa valeur est moyenne avec celle de la cinquième position. Comme les deux sont 9, la moyenne est également 9 puis:

Q1 = 9

Maintenant, nous répétons la procédure pour trouver Q3:

Nsoit (Q3) = 3 (n +1) / 4 = 3 (16 +1) / 4 = 12.75

Encore une fois, c'est une décimale, mais comme il n'est pas à mi-chemin, il est arrondi à 13. Le quartile recherché occupe la position de treize ans et est:

Q3 = 16

Solution C

RQ = Q3 - Q1 = 16 - 9 = 7 points.

Comme nous le voyons, c'est beaucoup moins que la plage de données calculée dans la section A), car la notation minimale était de 1 point, une valeur bien plus loin du reste.

Les références

  1. Berenson, M. 1985. Statistiques pour l'administration et l'économie. Inter-américain s.POUR.
  2. Canavos, g. 1988. Probabilité et statistiques: applications et méthodes. McGraw Hill.
  3. Devore, J. 2012. Probabilité et statistiques pour l'ingénierie et la science. 8e. Édition. Cengage.
  4. Exemples de quartiles. Récupéré de: Mathematics10.filet.
  5. Levin, R. 1988. Statistiques pour les administrateurs. 2e. Édition. Prentice Hall.
  6. Walpole, R. 2007. Probabilité et statistiques pour l'ingénierie et la science. Pearson.