Mesures de la tendance centrale aux formules de données groupées, exercices

Mesures de la tendance centrale aux formules de données groupées, exercices

Le mesures de tendance central Ils indiquent la valeur autour de laquelle les données d'une distribution sont. Le plus connu est la moyenne moyenne ou arithmétique, qui consiste à ajouter toutes les valeurs et à diviser le résultat par le nombre total de données.

Cependant, si la distribution se compose d'un grand nombre de valeurs et ne sont pas présentées de manière ordonnée, il n'est pas facile d'effectuer les calculs nécessaires pour extraire les informations précieuses qu'ils contiennent.

Figure 1. Les mesures de tendance centrale pour les données groupées sont un bon indicatif du comportement des données générales

C'est pourquoi ils sont regroupés en classes ou catégories, pour élaborer un distribution de Fréquences. Effectuer cet ordre précédent des données, il est alors plus facile de calculer les mesures de tendance centrale, parmi lesquelles sont:

-Moitié

-Médian

-Mode

-Moyenne géométrique

-Moyenne harmonique

Formules

Ci-dessous, nous avons les formules des mesures de tendance centrale pour les données groupées:

Moyenne arithmétique

La moyenne est la plus utilisée pour caractériser les données quantitatives (valeurs numériques), bien qu'elle soit assez sensible aux valeurs de distribution extrêmes. Il est calculé par:

Avec:

-X: arithmétique moyenne ou moyenne

-FToi: fréquence de classe

-mToi: La marque de classe

-G: numéro de classes

-N: données totales

Médian

Pour le calculer, il est nécessaire de trouver l'intervalle qui contient l'observation N / 2 et interpolaire pour déterminer la valeur numérique de ladite observation, au moyen de la formule suivante:

Où:

-C: Largeur d'intervalle à laquelle appartient la médiane

-BM: Bordure inférieure dudit intervalle

-Fm: Nombre d'observations contenues dans l'intervalle

-N / 2: données totales divisées par 2.

-FBM: nombre d'observations avant l'intervalle contenant la médiane.

Par conséquent, la médiane est une mesure de position, c'est-à-dire divise l'ensemble de données en deux parties. Ils peuvent également être définis quartiles, Déciles et centiles, qui divisent la distribution en quatre, dix et cent parties respectivement.

Peut vous servir: Fourier Transform: propriétés, applications, exemples

Mode

Dans les données groupées, la classe ou la catégorie contenant la plupart des observations est recherchée. C'est le Classe modale. Une distribution peut avoir deux modes ou plus, auquel cas il est appelé bimodal et Multimodal, respectivement.

Vous pouvez également calculer la mode dans les données groupées après l'équation:

Avec:

-L1: Limite inférieure de la classe où est la mode

1: Il reste entre la fréquence de la classe modale et la fréquence de la classe qui la précède.

2: soustraire entre la fréquence de la classe modale et la fréquence de la classe qui le suit.

-C: Largeur d'intervalle contenant la mode

Moyenne harmonique

La moyenne harmonique est notée par h. Lorsque vous avez un ensemble de n valeurs x1, X2, X3…, La moyenne harmonieuse est l'inverse ou réciproque de la moyenne arithmétique de l'inverse des valeurs.

Il est plus facile de le voir à travers la formule:

Et lorsque vous avez les données groupées, l'expression est transformée en:

Où:

-H: moyenne harmonique

-FToi: fréquence de classe

-mToi: Marque de classe

-G: numéro de classes

-N = f1 + F2 + F3 +..

Moyenne géométrique

Si tu as n Nombres positifs x1, X2, X3…, Sa moyenne géométrique est calculée par le n-eme du produit de tous les nombres:

Dans le cas des données groupées, il peut être démontré que le logarithme décimal du log G géométrique est donné par:

Où:

-G: moyenne géométrique

-FToi: fréquence de classe

-mToi: La marque de classe

-G: numéro de classes

-N = f1 + F2 + F3 +..

Relation entre h, g et x

Il est toujours vrai que:

H ≤ g ≤ x

Définitions les plus utilisées

Les définitions suivantes sont nécessaires pour trouver les valeurs décrites dans les formules précédentes:

Fréquence

La fréquence est définie comme le nombre de fois qu'un fait est répété.

Gamme

C'est la différence entre la valeur majeure et la valeur mineure, présente dans la distribution.

Nombre de classes

Pour savoir combien de classes nous regroupons les données, nous utilisons certains critères, par exemple ce qui suit:

Peut vous servir: 17 problèmes raisonnés

Limites

Les valeurs extrêmes de chaque classe ou intervalle sont appelées limites et chaque classe peut avoir les deux limites bien définies, auquel cas il a une limite inférieure et une plus grande. Ou il peut avoir des limites ouvertes, lorsqu'une plage est donnée, par exemple des valeurs supérieures ou inférieures à un certain nombre.

Marque de classe

Il se compose simplement du point médian de l'intervalle et est calculé en moyenne de la limite supérieure et de la limite inférieure.

Largeur d'intervalle

Les données peuvent être regroupées en classes de taille égale ou différente, c'est la largeur ou l'amplitude. La première option est la plus utilisée, car elle facilite les calculs, bien que dans certains cas, il est impératif que les classes aient une largeur différente.

La largeur c À partir de l'intervalle, il peut être déterminé par la formule suivante:

C = plage / nc

c C'est le nombre de classes.

Exercice résolu

Ci-dessous, nous avons une série de mesures de vitesse en km / h, prises avec un radar, qui correspondent à 50 voitures qui ont traversé une rue dans une certaine ville:

Figure 2. Table pour l'exercice résolu. Source: F. Zapata.

Solution

Les données présentées ne sont pas organisées, donc la première étape consiste à les regrouper en classes.

Étapes pour regrouper les données et construire le tableau

Étape 1

Trouvez la gamme R:

R = (52 - 16) km / h = 36 km / h

Étape 2

Sélectionnez le nombre de classes nc, Selon les critères donnés. Comme il y a 50 données, nous pouvons choisir nc = 6.

Étape 3

Calculez la largeur c de l'intervalle:

C = plage / nc = 36/6 = 6

Étape 4

Classes de formulaire et données de groupe comme suit: Pour la première classe, une limite inférieure est choisie dès que la valeur inférieure présente dans le tableau est ajoutée à cette valeur de C = 6, précédemment calculée, et elle obtient ainsi la limite supérieure de la première classe.

Il se déroule de la même manière pour construire le reste des classes, comme indiqué dans le tableau suivant:

Peut vous servir: qu'est-ce qu'un numéro Capicúa? Propriétés et exemples

Chaque fréquence correspond à une couleur de la figure 2, de cette manière, il est assuré qu'aucune valeur ne s'échappe de la prise en compte.

Calcul moyen

X = (5 x 18.5 +25 x 25.0 + 10 x 31.5 + 6 x 38.0 + 2 x 44.5 + 2 x 51.0) ÷ 50 = 29.03 km / h

Calcul médian

La médiane est dans la classe 2 du tableau, car il y a les 30 premières données de distribution.

-Largeur d'intervalle à laquelle appartient la médiane: c = 6

-Bordure inférieure de l'intervalle où la médiane est: bM = 22.0 km / h

-Nombre d'observations contenues dans l'intervalle fm = 25

-Total des données divisées par 2: 50/2 = 25

-Nombre d'observations avant l'intervalle contenant la médiane: fBM = 5

Et l'opération est:

Médian = 22.0 + [(25-5) ÷ 25] × 6 = 26.80 km / h

Mode

La mode se trouve également dans la classe 2:

-Largeur d'intervalle: C = 6

-Limite inférieure de la classe où la mode est trouvée: l1 = 22.0

-Soustrait entre la fréquence de la classe modale et la fréquence de la classe qui la précède: δ1 = 25-5 = 20

-Soustraire entre la fréquence de la classe modale et la fréquence de la classe qui suit: δ2 = 25 - 10 = 15

Avec ces données, l'opération est:

Mode = 22.0 + [20 ÷ (20 + 15)] x6 = 25.4 km / h

Calcul de la moyenne géométrique

N = f1 + F2 + F3 +... = 50

journal g = (5 x log 18.5 + 25 x log 25 + 10 x log 31.5 + 6 x log 38 + 2 × log 44.5 + 2 x log 51) / 50 =

journal g = 1.44916053

G = 28.13 km / h

Calcul moyen harmonique

1 / h = (1/50) x [(5/18.5) + (25/25) + (10/31.5) + (6/38) + (2/44.5) + (2/51)] = 0.0366

H = 27.32 km / h

Résumé des mesures de tendance centrale

Les unités de variables sont km / h:

-Médias: 29.03

-Médian: 26.80

-Mode: 25.40

-Médias géométriques: 28.13

-Moyenne harmonique: 27.32

Les références

  1. Berenson, M. 1985. Statistiques pour l'administration et l'économie. Inter-américain s.POUR.
  2. Canavos, g. 1988. Probabilité et statistiques: applications et méthodes. McGraw Hill.
  3. Devore, J. 2012. Probabilité et statistiques pour l'ingénierie et la science. 8e. Édition. Cengage.
  4. Levin, R. 1988. Statistiques pour les administrateurs. 2e. Édition. Prentice Hall.
  5. Spiegel, m. 2009. Statistiques. Série Schaum. 4 ta. Édition. McGraw Hill.
  6. Traitement des données groupées. Récupéré de: itchihuahua.Édu.mx.
  7. Walpole, R. 2007. Probabilité et statistiques pour l'ingénierie et la science. Pearson.