Mesures de la tendance centrale aux formules de données groupées, exercices
- 1769
- 11
- Raphaël Charles
Le mesures de tendance central Ils indiquent la valeur autour de laquelle les données d'une distribution sont. Le plus connu est la moyenne moyenne ou arithmétique, qui consiste à ajouter toutes les valeurs et à diviser le résultat par le nombre total de données.
Cependant, si la distribution se compose d'un grand nombre de valeurs et ne sont pas présentées de manière ordonnée, il n'est pas facile d'effectuer les calculs nécessaires pour extraire les informations précieuses qu'ils contiennent.
Figure 1. Les mesures de tendance centrale pour les données groupées sont un bon indicatif du comportement des données généralesC'est pourquoi ils sont regroupés en classes ou catégories, pour élaborer un distribution de Fréquences. Effectuer cet ordre précédent des données, il est alors plus facile de calculer les mesures de tendance centrale, parmi lesquelles sont:
-Moitié
-Médian
-Mode
-Moyenne géométrique
-Moyenne harmonique
Formules
Ci-dessous, nous avons les formules des mesures de tendance centrale pour les données groupées:
Moyenne arithmétique
La moyenne est la plus utilisée pour caractériser les données quantitatives (valeurs numériques), bien qu'elle soit assez sensible aux valeurs de distribution extrêmes. Il est calculé par:
Avec:
-X: arithmétique moyenne ou moyenne
-FToi: fréquence de classe
-mToi: La marque de classe
-G: numéro de classes
-N: données totales
Médian
Pour le calculer, il est nécessaire de trouver l'intervalle qui contient l'observation N / 2 et interpolaire pour déterminer la valeur numérique de ladite observation, au moyen de la formule suivante:
Où:
-C: Largeur d'intervalle à laquelle appartient la médiane
-BM: Bordure inférieure dudit intervalle
-Fm: Nombre d'observations contenues dans l'intervalle
-N / 2: données totales divisées par 2.
-FBM: nombre d'observations avant l'intervalle contenant la médiane.
Par conséquent, la médiane est une mesure de position, c'est-à-dire divise l'ensemble de données en deux parties. Ils peuvent également être définis quartiles, Déciles et centiles, qui divisent la distribution en quatre, dix et cent parties respectivement.
Peut vous servir: Fourier Transform: propriétés, applications, exemplesMode
Dans les données groupées, la classe ou la catégorie contenant la plupart des observations est recherchée. C'est le Classe modale. Une distribution peut avoir deux modes ou plus, auquel cas il est appelé bimodal et Multimodal, respectivement.
Vous pouvez également calculer la mode dans les données groupées après l'équation:
Avec:
-L1: Limite inférieure de la classe où est la mode
-Δ1: Il reste entre la fréquence de la classe modale et la fréquence de la classe qui la précède.
-Δ2: soustraire entre la fréquence de la classe modale et la fréquence de la classe qui le suit.
-C: Largeur d'intervalle contenant la mode
Moyenne harmonique
La moyenne harmonique est notée par h. Lorsque vous avez un ensemble de n valeurs x1, X2, X3…, La moyenne harmonieuse est l'inverse ou réciproque de la moyenne arithmétique de l'inverse des valeurs.
Il est plus facile de le voir à travers la formule:
Et lorsque vous avez les données groupées, l'expression est transformée en:
Où:
-H: moyenne harmonique
-FToi: fréquence de classe
-mToi: Marque de classe
-G: numéro de classes
-N = f1 + F2 + F3 +..
Moyenne géométrique
Si tu as n Nombres positifs x1, X2, X3…, Sa moyenne géométrique est calculée par le n-eme du produit de tous les nombres:
Dans le cas des données groupées, il peut être démontré que le logarithme décimal du log G géométrique est donné par:
Où:
-G: moyenne géométrique
-FToi: fréquence de classe
-mToi: La marque de classe
-G: numéro de classes
-N = f1 + F2 + F3 +..
Relation entre h, g et x
Il est toujours vrai que:
H ≤ g ≤ x
Définitions les plus utilisées
Les définitions suivantes sont nécessaires pour trouver les valeurs décrites dans les formules précédentes:
Fréquence
La fréquence est définie comme le nombre de fois qu'un fait est répété.
Gamme
C'est la différence entre la valeur majeure et la valeur mineure, présente dans la distribution.
Nombre de classes
Pour savoir combien de classes nous regroupons les données, nous utilisons certains critères, par exemple ce qui suit:
Peut vous servir: 17 problèmes raisonnésLimites
Les valeurs extrêmes de chaque classe ou intervalle sont appelées limites et chaque classe peut avoir les deux limites bien définies, auquel cas il a une limite inférieure et une plus grande. Ou il peut avoir des limites ouvertes, lorsqu'une plage est donnée, par exemple des valeurs supérieures ou inférieures à un certain nombre.
Marque de classe
Il se compose simplement du point médian de l'intervalle et est calculé en moyenne de la limite supérieure et de la limite inférieure.
Largeur d'intervalle
Les données peuvent être regroupées en classes de taille égale ou différente, c'est la largeur ou l'amplitude. La première option est la plus utilisée, car elle facilite les calculs, bien que dans certains cas, il est impératif que les classes aient une largeur différente.
La largeur c À partir de l'intervalle, il peut être déterminé par la formule suivante:
C = plage / nc
Oùc C'est le nombre de classes.
Exercice résolu
Ci-dessous, nous avons une série de mesures de vitesse en km / h, prises avec un radar, qui correspondent à 50 voitures qui ont traversé une rue dans une certaine ville:
Figure 2. Table pour l'exercice résolu. Source: F. Zapata.Solution
Les données présentées ne sont pas organisées, donc la première étape consiste à les regrouper en classes.
Étapes pour regrouper les données et construire le tableau
Étape 1
Trouvez la gamme R:
R = (52 - 16) km / h = 36 km / h
Étape 2
Sélectionnez le nombre de classes nc, Selon les critères donnés. Comme il y a 50 données, nous pouvons choisir nc = 6.
Étape 3
Calculez la largeur c de l'intervalle:
C = plage / nc = 36/6 = 6
Étape 4
Classes de formulaire et données de groupe comme suit: Pour la première classe, une limite inférieure est choisie dès que la valeur inférieure présente dans le tableau est ajoutée à cette valeur de C = 6, précédemment calculée, et elle obtient ainsi la limite supérieure de la première classe.
Il se déroule de la même manière pour construire le reste des classes, comme indiqué dans le tableau suivant:
Peut vous servir: qu'est-ce qu'un numéro Capicúa? Propriétés et exemplesChaque fréquence correspond à une couleur de la figure 2, de cette manière, il est assuré qu'aucune valeur ne s'échappe de la prise en compte.
Calcul moyen
X = (5 x 18.5 +25 x 25.0 + 10 x 31.5 + 6 x 38.0 + 2 x 44.5 + 2 x 51.0) ÷ 50 = 29.03 km / h
Calcul médian
La médiane est dans la classe 2 du tableau, car il y a les 30 premières données de distribution.
-Largeur d'intervalle à laquelle appartient la médiane: c = 6
-Bordure inférieure de l'intervalle où la médiane est: bM = 22.0 km / h
-Nombre d'observations contenues dans l'intervalle fm = 25
-Total des données divisées par 2: 50/2 = 25
-Nombre d'observations avant l'intervalle contenant la médiane: fBM = 5
Et l'opération est:
Médian = 22.0 + [(25-5) ÷ 25] × 6 = 26.80 km / h
Mode
La mode se trouve également dans la classe 2:
-Largeur d'intervalle: C = 6
-Limite inférieure de la classe où la mode est trouvée: l1 = 22.0
-Soustrait entre la fréquence de la classe modale et la fréquence de la classe qui la précède: δ1 = 25-5 = 20
-Soustraire entre la fréquence de la classe modale et la fréquence de la classe qui suit: δ2 = 25 - 10 = 15
Avec ces données, l'opération est:
Mode = 22.0 + [20 ÷ (20 + 15)] x6 = 25.4 km / h
Calcul de la moyenne géométrique
N = f1 + F2 + F3 +... = 50
journal g = (5 x log 18.5 + 25 x log 25 + 10 x log 31.5 + 6 x log 38 + 2 × log 44.5 + 2 x log 51) / 50 =
journal g = 1.44916053
G = 28.13 km / h
Calcul moyen harmonique
1 / h = (1/50) x [(5/18.5) + (25/25) + (10/31.5) + (6/38) + (2/44.5) + (2/51)] = 0.0366
H = 27.32 km / h
Résumé des mesures de tendance centrale
Les unités de variables sont km / h:
-Médias: 29.03
-Médian: 26.80
-Mode: 25.40
-Médias géométriques: 28.13
-Moyenne harmonique: 27.32
Les références
- Berenson, M. 1985. Statistiques pour l'administration et l'économie. Inter-américain s.POUR.
- Canavos, g. 1988. Probabilité et statistiques: applications et méthodes. McGraw Hill.
- Devore, J. 2012. Probabilité et statistiques pour l'ingénierie et la science. 8e. Édition. Cengage.
- Levin, R. 1988. Statistiques pour les administrateurs. 2e. Édition. Prentice Hall.
- Spiegel, m. 2009. Statistiques. Série Schaum. 4 ta. Édition. McGraw Hill.
- Traitement des données groupées. Récupéré de: itchihuahua.Édu.mx.
- Walpole, R. 2007. Probabilité et statistiques pour l'ingénierie et la science. Pearson.
- « Démonstration des événements indépendants, exemples, exercices
- Formule et équations de la quasi-élément, exemples, exercice »