Statistiques

Faire des statistiques c'est rassembler des données pour les exploiter.

Vocabulaire

Terme Définition
Données Les mesures recueillies
Population Ensemble d'objets ou d'individus faisant l'objet d'une étude statistique
Effectif partiel (ou sous-population) Partie de la population considérée, généralement déterminée par un caractère
Effectif total Nombre total d'objets ou d'individus
Caractère Propriété étudiée sur chaque objet ou individu
Caractère quantitatif Caractère qui ne prend que des valeurs numériques (poids, temps passé au téléphone, etc.)
Caractère qualitatif Caractère avec des valeurs qui ne sont pas des nombres (couleur des yeux, marque de la voiture, etc.)

Série statistique

Une série statistique est une liste de mesures contenant une série de caractères et leurs effectifs.

Exemple pour les notes de 25 candidats à un examen :

Notes
(Caractère quantitatif)
3 7 8 9 10 11 12 13 15 16 18
Effectifs
(Nombre de candidats ayant obtenu cette note)
1 2 5 5 1 2 3 2 2 1 1

Effectif cumulé

L'effectif cumulé s'obtient en ajoutant les effectifs de toutes les valeurs inférieures ou égales à celle de référence :

Notes 3 7 8 9 10 11 12 13 15 16 18
Effectifs 1 2 5 5 1 2 3 2 2 1 1
Effectifs cumulés (croissants) 1 3 8 13 14 16 19 21 23 24 25

Fréquence

Une fréquence est une proportion d'observations :

\[ \fbox{$ \text{Fréquence} = \frac{\text{Effectif}}{\text{Effectif total}} $} \]

Notes 3 7 8 9 10 11 12 13 15 16 18
Effectifs 1 2 5 5 1 2 3 2 2 1 1
Fréquence 4 % 8 % 20 % 20 % 4 % 8 % 12 % 8 % 8 % 4 % 4 %

Médiane

La médiane est un nombre qui permet de diviser une série statistique en deux sous-groupes de même effectif.

Pour la calculer :

  1. classer les valeurs dans l'ordre croissant
  2. si le nombre des valeurs :
    • est impair :
      • alors la médiane est la valeur du milieu :
      • \( 4, 5, 5, 8, {\large{{\color{ForestGreen}8}}}, 8, 9, 12, 13 \to {\color{RubineRed}8} \)
    • est pair :
      • alors la médiane est la moyenne des deux valeurs centrales
      • \( 1, 2, {\large{{\color{ForestGreen}4}}}, {\large{{\color{ForestGreen}8}}}, 21, 27 \to \frac{{\color{ForestGreen}4 + 8}}{2} = {\color{RubineRed}6} \)

Quartiles et déciles

Les quartiles d'une série statistique :

Les déciles d'une série statistique :

Si \( X \) est une série statistique :

\[ \fbox{$ Q2 = D5 = \text{Mediane}(X) $} \]

Moyenne arithmétique

La moyenne arithmétique d'une liste est la somme des valeurs divisée par le nombre de valeurs :

\[ \fbox{$ \text{Moyenne arithmétique} = \frac{\text{somme des valeurs}}{\text{nombre de valeurs}} $} \]

On utilise un trait suscrit pour représenter la moyenne \( \bar{x} \) :

\[ \fbox{$ \bar{x} = \frac{1}{n} \sum\limits_{i=1}^n x_i = {\frac{x_1 + x_2 + \cdots + x_n}{n}} $} \]

La formule s'écrit à l'aide du symbole ∑ (sigma) et se lit :

Moyenne arithmétique ou médiane

En règle générale :

Moyenne arithmétique Médiane
Sensible aux valeurs extrêmes du caractère Oui Non
Quand l'utiliser ? Pour des distributions normales Pour des distributions asymétriques
Valeur prise en compte Toutes les valeurs Uniquement la valeur centrale

Exemple pour une distribution asymétrique :

Assistants Commerciaux PDG
Salaire (en €) 1000 1200 20000
Effectifs 6 4 1
Moyenne \( \frac{(1000 \times 6) + (1200 \times 4) + 20000}{6 + 4 + 1} = {\color{ForestGreen}2800} \) €
Médiane \( {\small{1000, 1000, 1000, 1000, 1000,}} {\large{1000}} {,\small{1200, 1200, 1200, 1200, 20000}} \to {\color{ForestGreen}1000} \) €

Moyenne pondérée

Pondérer veut dire assigner des poids.

La moyenne pondérée d'une série :

Pour la calculer :

  1. multiplier chaque valeur par son coefficient de pondération
  2. additionner les produits obtenus
  3. diviser par la somme des coefficient de pondération

\[ \fbox{$ \text{Moyenne pondérée} = \frac{\sum \text{valeur} \times \text{coefficient}}{\sum \text{coefficient}} $} \]

Formule mathématique avec quotient de la somme pondérée des \( x_i \) par la somme des poids \( p_i \) :

\[ \fbox{$ \bar{x} = \frac{\sum\limits_{i=1}^n x_i p_i}{\sum\limits_{i=1}^n p_i} = {\frac{x_1 p_i + x_2 p_2 + \cdots + x_n p_n}{p_i + p_2 + \cdots + p_n}} $} \]

La variation des poids traduit une importance variable des observations.

Moyenne harmonique

La moyenne harmonique est l'inverse de la moyenne arithmétique des inverses des termes :

\[ \fbox{$ H = \frac{n}{\sum\limits_{i=1}^n \frac{1}{x_i}} = \left( \frac{\sum\limits_{i=1}^n x_i^{-1}}{n} \right)^{-1} = \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + \cdots + \frac{1}{x_n}} $} \]

Elle est généralement utilisée avec les vitesses, en électronique ou en finance.

Précédent Astuces de calcul mental Tous Suivant Équations

Tag Kemar Joint