Distribution du chi carré (χ²), comment elle est calculée, exemples

Distribution du chi carré (χ²), comment elle est calculée, exemples

La preuve Chi carré soit ji-carré2, Où χ est la lettre grecque appelée "Chi") est utilisée pour déterminer le comportement d'une certaine variable et aussi lorsque vous voulez savoir si deux ou plusieurs variables sont statistiquement indépendantes.

Pour vérifier le comportement d'une variable, le test à appeler Test de chich. Savoir si deux variables ou plus sont statistiquement indépendantes du test est appelée Chi carré d'indépendance, aussi appelé de contingence.

Figure 1. Tests d'hypothèse via Chi Cuadrado

Ces preuves font partie de la théorie statistique des décisions, dans laquelle une population est étudiée et des décisions sont prises à ce sujet, analysant un ou plusieurs échantillons extraits de celui-ci. Pour cela, il est nécessaire de faire certaines hypothèses concernant les variables, appelées hypothèse, qui peut ou non être certain.

Il existe des tests pour contraster ces conjectures et déterminer lesquels sont valides, dans une certaine marge de confiance, y compris le test du chi carré, qui peut être appliqué pour comparer deux et la plupart des populations.

Comme nous le verrons, deux types d'hypothèse sur certains paramètres de population dans deux échantillons sont généralement pris en compte: l'hypothèse nulle, appelée hsoit (les échantillons sont indépendants), et l'hypothèse alternative, indiquée H1, (les échantillons sont corrélés) qui est contraire à cela.

[TOC]

Quand le test du chi carré est-il utilisé?

Le test Chi Square s'applique aux variables qui décrivent des qualités, telles que le sexe, l'état civil, le groupe sanguin, la couleur des yeux et les préférences de divers types.

Le test est conçu lorsque vous souhaitiez:

-Vérifiez si une distribution est appropriée pour décrire une variable, qui est appelée bonté d'ajustement. Grâce au test Chi Square, vous pouvez savoir s'il existe des différences significatives entre la distribution théorique sélectionnée et la distribution de fréquence observée.

-Savoir si deux variables x et y sont indépendantes du point de vue statistique. Ceci est connu comme Test d'indépendance.

Puisqu'il s'applique aux variables qualitatives ou catégorielles, le test Chi Square est largement utilisé en sciences sociales, administration et médecine.

Conditions pour l'appliquer

Il existe deux exigences importantes pour l'appliquer correctement:

Il peut vous servir: quelle est la relation entre la zone du losange et le rectangle?

-Les données doivent être regroupées en fréquences.

-L'échantillon doit être suffisamment grand pour rendre la distribution de Chi carré valide, sinon sa valeur est surestimée et donne lieu au rejet de l'hypothèse nulle alors qu'elle ne devrait pas l'être.

La règle générale est que si dans les données groupées, une fréquence avec une valeur inférieure à 5 apparaît, elle n'est pas utilisée. S'il y a plus d'une fréquence inférieure à 5, alors ils doivent être combinés en un pour obtenir une fréquence avec une valeur numérique supérieure à 5.

Chi Square Distribution

χ2 C'est une distribution continue des probabilités. Il y a en fait différentes courbes, selon un paramètre k appelé degrés de liberté au hasard.

Ses propriétés sont:

-La zone sous la courbe est égale à 1.

-Les valeurs de χ2 Ils sont positifs.

-La distribution est asymétrique, c'est-à-dire qu'elle a un biais.

Figure 2. Chi Square Distribution pour les degrés de liberté watts. Source: Wikimedia Commons.

Degrés de liberté

À mesure que les degrés de liberté augmentent, la distribution du chi carré tend à la normale, comme on peut le voir sur la figure.

Pour une distribution donnée, les degrés de liberté sont déterminés à travers le tableau de contingence, qui est le tableau où les fréquences observées des variables sont enregistrées.

Si une table a F rangs et c colonnes, la valeur de k est:

K = (f - 1) ⋅ (c - 1)

Formulation d'hypothèse

Lorsque le test de Chi Square est un ajustement, les hypothèses suivantes sont formulées:

-Hsoit: la variable x a une distribution de probabilité f (x) avec des paramètres spécifiques et1, et2… , etp

-H1: X a une autre distribution de probabilité.

La distribution de probabilité qui est supposée dans l'hypothèse nulle peut être, par exemple, la distribution normale bien connue, et les paramètres seraient la moyenne μ et l'écart type σ.

De plus, l'hypothèse nulle est évaluée avec un certain niveau de signification, c'est-à-dire une mesure de l'erreur qui serait commise lorsque le rejet est vrai.

En général, ce niveau est établi de 1%, 5% ou 10% et plus le résultat du test est bas, plus.

Peut vous servir: Mumm

Et si le test de Chi Square de la contingence est utilisé, ce qui, comme nous l'avons dit, sert à vérifier l'indépendance entre deux variables x et y, les hypothèses sont:

-Hsoit: Les variables x et y sont indépendantes.

-H1: X et y sont dépendants.

Encore une fois, il est nécessaire de spécifier un niveau de signification pour connaître la mesure de l'erreur lors de la prise de décision.

Comment les statistiques du chi carré sont-elles calculées?

Les statistiques Chi Square sont calculées comme suit:

Le symbole ∑ signifie «sommation», que nous devons faire sur l'expression fractionnaire indiquée.

La somme est effectuée de la première classe I = 1 au dernier, qui est i = k.

En outre:

-Fsoit C'est une fréquence observée (elle provient des données obtenues).

-Fet C'est la fréquence attendue ou théorique (il est nécessaire de les calculer à partir des données).

Pour accepter ou rejeter l'hypothèse nulle, χ est calculé2 Pour les données observées et se compare à une valeur appelée Chi carré critique, qui dépend des degrés de liberté k et le niveau de signification α:

χ2critique =  χ2K, α

Si, par exemple, nous voulons effectuer le test avec un niveau de signification de 1%, alors α = 0.01, si ce sera avec 5% alors α = 0.05 et ainsi de suite. P, le paramètre de distribution, tel que:

P = 1 - α

Ces valeurs carrées critiques sont déterminées par des tableaux contenant la valeur de la zone accumulée. Par exemple, pour k = 1, qui représente 1 degré de liberté et α = 0.05, équivalent à p = 1-.05 = 0.95, la valeur de χ2 C'est 3.841.

figure 3. Tableau de valeurs de distribution Chi Square. Source: F. Zapata.

Critères d'acceptation ACsoit

Les critères pour accepter hsoit est:

-Oui χ2 < χ2critique  Hsoit, sinon il est rejeté (voir figure 1).

Exemple de calcul

Dans l'application suivante, le test Chi Square sera utilisé comme test d'indépendance.

Supposons que les chercheurs veulent savoir si la préférence pour le café noir est liée au genre de la personne et spécifiez la réponse avec un niveau de signification de α = 0.05.

Peut vous servir: angles alternatifs externes: exercices et exercices résolus

Pour cela, un échantillon de 100 personnes interrogées et leurs réponses sont disponibles:

Étape 1

Établir des hypothèses:

-Hsoit: le sexe et la préférence pour le café noir sont indépendants.
-H1: Le goût du café noir est lié au genre de la personne.

Étape 2

Calculez les fréquences attendues pour la distribution, pour lesquelles le total ajouté dans la dernière ligne et dans la colonne de droite -wing est requise. Chaque cellule de la boîte rouge a une valeur attendue Fet, qui est calculé en multipliant le total de sa ligne R F par la colonne totale C, divisée par l'échantillon total n:

Fet = (F x c) / n

Les résultats sont les suivants pour chaque cellule:

-C1: (36 x 47) / 100 = 16.92
-C2: (64 x 47) / 100 = 30.08
-C3: (36 x 53) / 100 = 19.08
-C4: (64 x 53) / 100 = 33.92

Étape 3

Ensuite, vous devez calculer la statistique Chi Cuadrado pour cette distribution, selon la formule donnée:

χ2= [(21 - 16.92)2 ÷ 16. 92] + [(26 - 30.08)2 ÷ 30.08] + [(15 - 19.08)2 ÷ 19.08] + [(38 - 33.92)2 ÷ 33. 92] = 0.9838 + 0.5534 + 0.8725 + 0.4908 = 2.9005

Étape 4

Déterminer χ2critique, Sachant que les données enregistrées sont à F = 2 lignes et C = 2 colonnes, par conséquent, le nombre de degrés de liberté est:

K = (2-1) ⋅ (2-1) = 1.

Ce qui signifie que nous devons regarder dans le tableau illustré ci-dessus la valeur de χ2K, α = χ21; 0.05 , qui est:

χ2critique = 3.841

Étape 5

Comparez les valeurs et décidez:

χ2 = 2.9005

χ2critique = 3.841

Depuis χ2 < χ2critique L'hypothèse nulle est acceptée et il est conclu que la préférence pour le café noir n'est pas liée au genre de la personne, avec un niveau de signification de 5%.

Les références

  1. Test de chi carré pour l'indépendance. Récupéré de: saylordotorg.Github.Io.
  2. Vague de médicaments. Statistiques appliquées aux sciences de la santé: le test de Ji-Square. Récupéré de: medwave.CL.
  3. Probabilités et statistiques. Test de bonté de réglage de Shi Square. Récupéré de: Probabilités etstics.com.
  4. Triola, m. 2012. Statistiques élémentaires. 11ème. Édition. Addison Wesley.
  5. Unam. Test de chi carré. Récupéré de: Advisory.Cuautitlan2.Unam.mx.