Caractéristiques et exemples de variables catégoriques

Caractéristiques et exemples de variables catégoriques

La variable catégorique C'est celui utilisé dans les statistiques pour attribuer une caractéristique ou une propriété non numérique ou qualitative à un objet, individu, entité, condition ou procédure. Il est possible de définir toutes sortes de variables catégorielles en fonction de chaque besoin. 

Des exemples de variables catégorielles sont les suivantes: couleur, sexe, groupe sanguin, état matrimonial, type de matériel, formulaire de paiement ou type de compte bancaire, et sont beaucoup utilisés quotidiennement.

Figure 1: La couleur est une variable catégorique. Source: Pixabay

Ce qui précède est les variables, mais leurs valeurs possibles sont qualitatives, c'est-à-dire de la qualité ou des caractéristiques et non d'une mesure numérique. Par exemple les valeurs possibles pour la variable sexe ils sont: homme , HEmbrassonner.

Lorsque cette variable est stockée dans un programme informatique, elle peut être déclarée comme une variable de texte et les seules valeurs acceptées seront nommées: Homme , Femme.

Cependant la même variable sexe peut être déclaré et stocké comme un entier si Homme est assigné 1 déjà Femme La valeur est attribuée 2. C'est pour cette raison que les variables catégorielles sont parfois appelées le type répertorié.

La principale caractéristique des variables catégorielles est que, contrairement à d'autres variables, telles que continue et discrète, il n'est pas possible de faire de l'arithmétique avec eux. Cependant, les statistiques peuvent être faites avec eux, comme nous le verront plus tard.

[TOC]

Exemples

Notez les exemples suivants de variables catégorielles et leurs valeurs possibles:

-Groupe sanguin, Plage de valeurs: A, B, AB, ou

-État civil, Valeurs catégoriques: Celibataire (POUR), Marié (B), Veuf (C) , Divorcé (D).

-Type de materiel, Catégories ou valeurs: 1 = bois, 2 = métal, 3 = plastique

-Mode de paiement, Valeurs ou catégories: (1) espèces, (2) débit, (3) transfert, (4) crédit

Peut vous servir: Tesla Coil: Histoire, comment ça marche, à quoi sert-il pour

Dans les exemples précédents, un nombre a été associé à chaque catégorie de manière complètement arbitraire. 

On pourrait alors penser que cette association numérique arbitraire le rend équivalent à un variable quantitative discrète, Mais ce n'est pas car les opérations arithmétiques ne peuvent pas être faites avec ces chiffres.

Pour illustrer l'idée, dans la variable Mode de paiement, L'opération de somme n'a aucun sens:

 (1) efficace + (2) débit ne sera jamais équivalent à (3) transfert

Classification des variables catégorielles

La classification est basée sur la question de savoir s'ils ont une hiérarchie implicite ou si le nombre de résultats possibles est supérieur à deux ou deux.

Une variable catégorique avec un seul résultat possible n'est pas une variable, c'est une constante catégorielle.

Catégorielle nominale 

Quand ils ne peuvent pas être représentés par un nombre ou avoir une commande. Par exemple la variable: Type_de_material, tvaleurs nominales (Bois, métal, plastique), ils n'ont ni hiérarchie ni ordre, même lorsqu'un numéro arbitraire est affecté à chaque réponse ou catégorie.

Catégorielle ordinale

Variable: La réussite scolaire

Valeurs nominales: Haut, moyen, bas

Bien que les valeurs de cette variable ne soient pas numériques, elles ont un ordre ou une hiérarchie implicite.

Catégorielle binaire

Ce sont des variables nominales avec deux réponses possibles, par exemple:

-Variable: Répondre

-Valeurs nominales: VRAI, Faux

Notez que la variable Répondre Cela n'implique pas une hiérarchie et n'a que deux résultats possibles, il s'agit donc d'une variable catégorique binaire.

Certains auteurs appellent ce type variable binaire, Et ils ne le considèrent pas appartenant au variables catégorielles qui sont limités à ceux qui ont plus de trois catégories possibles.

Statistiques avec des variables catégorielles

Les statistiques peuvent être faites avec des variables catégorielles, bien qu'ils ne soient pas des variables numériques ou quantitatives. Par exemple, pour connaître la tendance ou la valeur la plus probable d'une variable catégorique, il est pris Mode.

Il peut vous servir: astroclymiques: histoire, quelles études, branches

Mode C'est, dans ce cas, le résultat ou la valeur le plus répété d'une variable catégorique. Dans les variables catégorielles, il n'est pas possible de calculer ni la moyenne, ni la médiane.

La moyenne ne peut pas être calculée car elle ne peut pas être fabriquée arithmétique avec des variables catégorielles. Ni la médiane, car les variables quantitatives ou catégorielles n'ont pas d'ordre ou de hiérarchie, il n'est donc pas possible de déterminer une valeur centrale.

Représentation graphique des variables catégorielles

Compte tenu d'une certaine variable catégorique, vous pouvez trouver la fréquence ou le nombre de fois avec lequel le résultat de cette variable est répété. Si cela est fait pour chaque résultat, alors un graphique de fréquence peut être réalisé en fonction de chaque catégorie ou résultat.

Voici quelques exemples de la façon dont les variables catégorielles peuvent être représentées graphiquement.

Exercices résolus

Exercice 1

Une entreprise a des données de 170 employés. L'une des variables qui figure dans ces enregistrements est: État civil. Cette variable a quatre catégories ou valeurs possibles:

Celibataire (POUR), Marié (B), Veuf (C) , Divorcé (D).

Bien qu'il s'agisse d'une variable non nul, il est possible de savoir combien de dossiers totaux se trouvent dans une certaine catégorie et d'être représentés sous la forme d'un graphique à barres, comme indiqué sur la figure suivante:

Figure 2. Représentation des résultats d'une variable catégorique. Source: auto-faite

Exemple 2

Un magasin de chaussures porte un record de ses ventes. Parmi les variables qui gèrent leurs enregistrements est la couleur de la chaussure pour chaque modèle. La variable: 

Color_zapato_modelo_aw3

Il est catégorique et a cinq catégories ou valeurs possibles. Pour chaque catégorie de cette variable, le nombre de ventes est totalisé et le pourcentage de la même est établi. Les résultats sont présentés dans le graphique de la figure suivante:

Peut vous servir: propriétés électriques des matériaux figure 3. Couleur variable catégorique _ Zapato. De cette manière variable est blanc. Source: auto-faite.

On peut dire alors que à partir du modèle de chaussures AW3 qui est de mode, Le plus fréquemment vendu est le Blanc, suivi de près par le Noir

On peut également dire que la probabilité de 70% La prochaine chaussure vendue de ce modèle sera Blanc soit Noir.

Ces informations peuvent être utiles pour le magasin lors de la prise de nouvelles commandes, ou peuvent même appliquer des réductions sur les couleurs les moins vendues pour les stocks excédentaires.

Exemple 3

Pour une certaine population de donneurs de sang, nous voulons représenter le nombre de personnes appartenant à un certain groupe sanguin. Une façon graphique de visualiser les résultats est via un pictogramme, qui est en arrière-plan un tableau.

Dans la première colonne, la variable est représentée groupe sanguin et ses résultats ou catégories possibles. La deuxième colonne a la représentation d'une manière emblématique ou picturale du nombre de personnes dans chaque catégorie. Dans notre exemple, une gouttelette rouge est utilisée comme icône, chacune représente 10 personnes.

Figure 4. Pictogramme. Source: auto-faite

Les références

  1. Académie Khan. Analyse des données catégorielles. Récupéré de: Khanacademy.org
  2. Formules d'univers. Variable qualitative. Récupéré de: Univesformulas.com
  3. Minitab. Qui sont des variables catégorielles, discrètes et continues. Récupéré de: support.Minitab.com
  4. Tutoriel Excel. Caractérisation des variables. Récupéré de: aide.Xlslat.com.
  5. Wikipédia. Variable statistique. Récupéré de Wikipedia.com
  6. Wikipédia. Variable catégorique. Récupéré de Wikipedia.com
  7. Wikipédia. Variable catégorique. Récupéré de Wikipedia.com