Statistiques
Faire des statistiques c'est rassembler des données pour les exploiter.
Vocabulaire
Terme | Définition |
---|---|
Données | Les mesures recueillies |
Population | Ensemble d'objets ou d'individus faisant l'objet d'une étude statistique |
Effectif partiel (ou sous-population) | Partie de la population considérée, généralement déterminée par un caractère |
Effectif total | Nombre total d'objets ou d'individus |
Caractère | Propriété étudiée sur chaque objet ou individu |
Caractère quantitatif | Caractère qui ne prend que des valeurs numériques (poids, temps passé au téléphone, etc.) |
Caractère qualitatif | Caractère avec des valeurs qui ne sont pas des nombres (couleur des yeux, marque de la voiture, etc.) |
Série statistique
Une série statistique est une liste de mesures contenant une série de caractères et leurs effectifs.
Exemple pour les notes de 25 candidats à un examen :
Notes
(Caractère quantitatif) |
3 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 15 | 16 | 18 |
---|---|---|---|---|---|---|---|---|---|---|---|
Effectifs
(Nombre de candidats ayant obtenu cette note) |
1 | 2 | 5 | 5 | 1 | 2 | 3 | 2 | 2 | 1 | 1 |
Effectif cumulé
L'effectif cumulé s'obtient en ajoutant les effectifs de toutes les valeurs inférieures ou égales à celle de référence :
Notes | 3 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 15 | 16 | 18 |
---|---|---|---|---|---|---|---|---|---|---|---|
Effectifs | 1 | 2 | 5 | 5 | 1 | 2 | 3 | 2 | 2 | 1 | 1 |
Effectifs cumulés (croissants) | 1 | 3 | 8 | 13 | 14 | 16 | 19 | 21 | 23 | 24 | 25 |
Fréquence
Une fréquence est une proportion d'observations :
\[ \fbox{$ \text{Fréquence} = \frac{\text{Effectif}}{\text{Effectif total}} $} \]
Notes | 3 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 15 | 16 | 18 |
---|---|---|---|---|---|---|---|---|---|---|---|
Effectifs | 1 | 2 | 5 | 5 | 1 | 2 | 3 | 2 | 2 | 1 | 1 |
Fréquence | 4 % | 8 % | 20 % | 20 % | 4 % | 8 % | 12 % | 8 % | 8 % | 4 % | 4 % |
Médiane
La médiane est un nombre qui permet de diviser une série statistique en deux sous-groupes de même effectif.
Pour la calculer :
- classer les valeurs dans l'ordre croissant
- si le nombre des valeurs :
- est impair :
- alors la médiane est la valeur du milieu :
- \( 4, 5, 5, 8, {\large{{\color{ForestGreen}8}}}, 8, 9, 12, 13 \to {\color{RubineRed}8} \)
- est pair :
- alors la médiane est la moyenne des deux valeurs centrales
- \( 1, 2, {\large{{\color{ForestGreen}4}}}, {\large{{\color{ForestGreen}8}}}, 21, 27 \to \frac{{\color{ForestGreen}4 + 8}}{2} = {\color{RubineRed}6} \)
- est impair :
Quartiles et déciles
Les quartiles d'une série statistique :
- sont un triplet de réels \( Q_1 \thinspace ; \thinspace Q_2 ; \thinspace Q_3 \)
- qui la sépare en quatre groupes de même effectif
Les déciles d'une série statistique :
- sont un 9-uplet de réels \( D_1 \thinspace ; \thinspace D_2 ; \cdots ; \thinspace D_9 \)
- qui la sépare en dix groupes de même effectif
Si \( X \) est une série statistique :
\[ \fbox{$ Q2 = D5 = \text{Mediane}(X) $} \]
Moyenne arithmétique
La moyenne arithmétique d'une liste est la somme des valeurs divisée par le nombre de valeurs :
\[ \fbox{$ \text{Moyenne arithmétique} = \frac{\text{somme des valeurs}}{\text{nombre de valeurs}} $} \]
On utilise un trait suscrit pour représenter la moyenne \( \bar{x} \) :
\[ \fbox{$ \bar{x} = \frac{1}{n} \sum\limits_{i=1}^n x_i = {\frac{x_1 + x_2 + \cdots + x_n}{n}} $} \]
La formule s'écrit à l'aide du symbole ∑ (sigma) et se lit :
- somme de \( x \) indice \( i \)
- pour \( i \) variant de \( 1 \) à \( n \)
- divisé par \( n \)
Moyenne arithmétique ou médiane
En règle générale :
- tout va bien si la moyenne arithmétique et la médiane donnent une estimation du centre similaire
- sinon, il faut approfondir l'analyse
Moyenne arithmétique | Médiane | |
---|---|---|
Sensible aux valeurs extrêmes du caractère | Oui | Non |
Quand l'utiliser ? | Pour des distributions normales | Pour des distributions asymétriques |
Valeur prise en compte | Toutes les valeurs | Uniquement la valeur centrale |
Exemple pour une distribution asymétrique :
Assistants | Commerciaux | PDG | |
---|---|---|---|
Salaire (en €) | 1000 | 1200 | 20000 |
Effectifs | 6 | 4 | 1 |
Moyenne | \( \frac{(1000 \times 6) + (1200 \times 4) + 20000}{6 + 4 + 1} = {\color{ForestGreen}2800} \) € | ||
Médiane | \( {\small{1000, 1000, 1000, 1000, 1000,}} {\large{1000}} {,\small{1200, 1200, 1200, 1200, 20000}} \to {\color{ForestGreen}1000} \) € |
Moyenne pondérée
Pondérer veut dire assigner des poids.
La moyenne pondérée d'une série :
- est la moyenne des valeurs
- affectées de poids (ou coefficients de pondération)
Pour la calculer :
- multiplier chaque valeur par son coefficient de pondération
- additionner les produits obtenus
- diviser par la somme des coefficient de pondération
\[ \fbox{$ \text{Moyenne pondérée} = \frac{\sum \text{valeur} \times \text{coefficient}}{\sum \text{coefficient}} $} \]
Formule mathématique avec quotient de la somme pondérée des \( x_i \) par la somme des poids \( p_i \) :
\[ \fbox{$ \bar{x} = \frac{\sum\limits_{i=1}^n x_i p_i}{\sum\limits_{i=1}^n p_i} = {\frac{x_1 p_i + x_2 p_2 + \cdots + x_n p_n}{p_i + p_2 + \cdots + p_n}} $} \]
La variation des poids traduit une importance variable des observations.
Moyenne harmonique
La moyenne harmonique est l'inverse de la moyenne arithmétique des inverses des termes :
\[ \fbox{$ H = \frac{n}{\sum\limits_{i=1}^n \frac{1}{x_i}} = \left( \frac{\sum\limits_{i=1}^n x_i^{-1}}{n} \right)^{-1} = \frac{n}{\frac{1}{x_1} + \frac{1}{x_2} + \cdots + \frac{1}{x_n}} $} \]
Elle est généralement utilisée avec les vitesses, en électronique ou en finance.