6°) Mode d'une série statistique retour
7°) Moyenne retour
7.1°) Définition
|
- n1, n2, n3,
.........,nN sont les effectifs correspondants aux modalités
x1, x2,
x3, .........,xN., si la série est discrète ,
- ou les centres de chaque classe, si la série est continue.
|
7.2°) Exemple:
|
| Série discrète
|
Série continue
|
|
7.3°) Propriétés de la moyenne:
- Considérons une série statistique S de modalités
x1, x2, x3, .........,xN affectées
des effectifs n1, n2, n3, ... ,nN
de moyenne
, et la
série statistique S' de modalités
y1, y2, y3, ... ,yN affectées
des même effectifs n1, ... ,nN telle
que pour tout i appartenant à {1 ; 2 ; ... ; N } :
yi = axi + b.
Alors: la moyenne de la série statistique
S' est telle que : =
a + b.
- Soient S1 et S2 deux séries statistiques
d'effectifs totaux respectifs N1 et N2 et de moyennes
respectives
et
.
Alors la moyenne de la
série S regroupant les deux séries S1 et S2
est :
= [N1
+ N2 ]/(N1
+ N2).
(cette propriété se généralise).
|
8°) Variance et écart type retour
8.1°) Définition
8.1.a°)
Pour calculer la variance d'une série statistique on utilise la
formule :
|
 |
Pour calculer la variance , il faut calculer
d'abord la moyenne.
8.1.b°)
La variance peut être calculée aussi en
utilisant la formule :

Preuve:
|
8.2°) Ecart-type:
L'écart-type est le
nombre noté tel que :
.
Le coefficient de dispersion est le rapport écart-type moyenne : /x
|
|
|
8.3°) Propriété de l'écart type :
- Considérons une série statistique S de modalités x1,
x2, x3,...,xN affectées des
effectifs n1, n2, n3,
...,nN d'écart type
,
et la série statistique S'
de modalités y1, y2, y3,
...,yN affectées des mêmes effectifs n1,n2,n3,
...,nN telle que, pour tout i appartenant à {1 ; 2 ;
...; N } : yi = axi + b.
Alors l'écart type : de la série
statistique S' est tel que : = |a|  |
9°) Médiane retour
9.1°) Définition
La médiane
est un paramètre de position, qui permet de couper la population étudiée
en deux groupes contenant le même nombre d'individus.
Ce paramètre
est utile pour donner la répartition du caractère étudié, car 50 % environ
de la population étudiée a une modalité inférieure à la médiane
et 50 % une modalité supérieure à la médiane.
|
9.2°) Exemple
On fait une
étude statistique sur les 50 notes attribuées par un jury à un examen, voici
les résultats obtenus en classant ces notes par ordre croissant.
|
Variable discrète
 |
Utilisons la colonne des effectifs
cumulés pour déterminer la médiane : il y a 50 notes, la 25ème
note est 9 et la 26ème : 10.
Voici la répartition des notes :

Dans le tableau il n'y a pas de valeur partageant la série
statistique en deux groupe de même effectif , ( l'effectif total est pair
) dans ce cas l'intervalle médian est [9;10] et on prendre pour médiane
le centre de cet intervalle : 9,5
|
Variable continue
Si la variable est
continue ( regroupement par intervalle des résultats ) le calcul de
la médiane se fait autrement :
|
 |
Utilisons la colonne des effectifs
cumulés pour déterminer la médiane : Il y a 50 notes, 50 % de l'effectif
total c'est 25, la médiane est ici la note correspondant à l'effectif cumulé
25.
|
D'après la colonne
"effectif cumulé" :
- 18 personnes ont moins de 8
- 30 personnes ont moins de 12
La médiane se trouve donc dans l'intervalle [8;12[ ( appelé
classe médiane ). On le détermine par interpolation
linéaire.
|
 |
Les points A, M, B sont alignés
ce qui se traduit par les droites (AM) et (AB) ont même coefficient directeur
(ou on utilise le théorème de Thalès dans le triangle bleu ) :
|
 |
La médiane est environ 10,33
50 % environ des personnes ont eu moins de 10,33 et 50
% plus de 10,33 .
|
10°) Quartiles/Déciles retour
10.1°) Quartiles:
Définition:
On appelle premier quartile d'une série la plus petite
valeur q des termes de la série pour
laquelle au moins un quart (25%) des données sont inférieures ou égales à q.
On appelle troisième quartile d'une série la plus petite
valeur q' des termes de la série pour
laquelle au moins trois quarts (75%) des données sont inférieures ou égales à q'.
On appelle intervalle interquartile l'intervalle [q ; q'].
On appelle écart interquartile l'amplitude de
l'intervalle [q ; q'], c'est-à-dire le
nombre q' - q.
Exemple:
La recherche des quartiles sera plus facile si les termes de la
suite sont ordonnés.
La série 11 , 12 , 12 , 13 , 15 , 16 , 16 , 17 , 17 ,
18 , 19 , 20 , 22 , 23 a 14 termes.
Un quart (25%) des données correspond à : 14 x 0,25 =
3,5.
Le premier quartile est alors, par définition, la plus petite
valeur q pour laquelle les valeurs de 4
termes de la série sont inférieurs ou égales à q.
Le premier quartile est donc la valeur du 4ème terme
de la série c'est-à-dire 13.
Trois quarts (75%) des données correspondent à : 14 x 0,75 =
10,5.
Le troisième quartile est alors, par définition, la plus petite
valeur q' pour laquelle les valeurs de
11 termes de la série sont inférieurs ou égales à q'.
Le troisième quartile est donc la valeur du 11ème
terme de la série c'est-à-dire 19.
L'intervalle interquartile est [13
; 19]. L'écart interquartile est 19 - 13 = 6.
10.2°) Déciles:
Définition:
On appelle premier décile d'une série la plus petite
valeur d des termes de la série pour
laquelle au moins un dixième (10%) des données sont inférieures ou égales à d.
On appelle neuvième décile d'une série la plus petite
valeur d' des termes de la série pour
laquelle au moins neuf dixièmes (90%) des données sont inférieures ou égales à d'.
On appelle intervalle interdécile l'intervalle [d ; d'].
On appelle écart interdécile l'amplitude de l'intervalle [d ; d'], c'est-à-dire le nombre d' - d.
Exemple:
La recherche des quartiles sera plus facile si les termes de la
suite sont ordonnés.
La série 4, 5, 5, 5, 6, 6, 7, 8, 8, 9, 9, 9, 9, 10, 10,
11, 11, 11, 12, 13, 13, 13, 14, 14, 15, 15, 17 a 27 termes.
Un dixième (10%) des données correspond à : 27 x 0,10 =
2,7.
Le premier décile est alors, par définition, la plus petite
valeur d pour laquelle les valeurs de 3
termes de la série sont inférieurs ou égales à d.
Le premier décile est donc la valeur du 3ème terme de
la série c'est-à-dire 5.
Neuf dixièmes (90%) des données correspondent à : 27 x 0,9 =
24,3.
Le neuvième décile est alors, par définition, la plus petite
valeur d' pour laquelle les valeurs de
25 termes de la série sont inférieurs ou égales à d'.
Le neuvième décile est donc la valeur du 25ème terme
c'est-à-dire 15.
L'intervalle interdécile est [5
; 15]. L'écart interdécile est 15 - 5 = 10.
11°) Interpolation linéaire retour
12°) Diagrammes en boîtes retour
12.1°) Construction d'un diagramme en boîte:
Ce type de diagramme est aussi appelé diagramme de Tuckey, boîte
à moustaches ou boîte à pattes.
Il utilise le 1er et le 3ème quartile, les
valeurs extrêmes, le 1er et le 9ème décile et
éventuellement la médiane d'une série.
La construction ci-contre est faite pour la série de l'exercice
5 (tailles en cm pour des enfants de 68 mois).
Cette série était caractérisée par :
médiane : 113
1er
quartile : 110 3ème quartile : 117
1er décile : 108 9ème
décile : 119
On choisit une graduation verticale permettant de représenter les
différentes valeurs de la série.
On pourra par exemple graduer entre
90 et 130.
(Si certaines valeurs sont
manifestement hors normes, on n'en tiendra pas compte.)
Le
"corps" du diagramme, c'est-à-dire la "boîte" est formée
d'un rectangle ayant pour extrémité inférieure le 1er quartile et
pour extrémité supérieure le 3ème quartile. A l'intérieur de ce
rectangle on pourra tracer un segment représentant la médiane.
La largeur du rectangle n'est pas
fixée, elle sera choisie de façon à obtenir un graphique
"harmonieux".
Ce
rectangle représente les données contenues dans l'intervalle interquartile.
On repère ensuite les hauteurs
correspondant au 1er et au 9ème décile, et on trace deux
pattes représentant les données contenues dans l'intervalle interdécile.
(la largeur
des pattes n'a pas d'importance).
On peut ensuite terminer le
graphique, en faisant figurer par des points les données qui sont en dehors de
l'intervalle interdécile.
Si certaines données, sont
manifestement très éloignées, on ne les représentera pas, mais on écrira leurs
valeurs au dessous du diagramme.
Remarques:
Une boîte avec des "pattes"
courtes indique que la série est assez concentrée autour de sa médiane.
Au contraire des "pattes"
longues indique que la série est assez dispersée.
Un des avantages de cette représentation, est qu'elle nécessite
très peu de calculs.
La représentation peut aussi se faire horizontalement, la
graduation se trouvant alors sur l'axe horizontal, d'où l'appellation de
"boîte à moustaches".
Le graphique est parfois fait en dessinant des pattes
correspondant au 1er et au 99ème centile, ou même aux
valeurs extrêmes.
|