Les mesures de dispersion servent à caractériser l’étalement des valeurs présentes dans une distribution. Plus la distribution sera étalée, plus la valeur de la mesure de dispersion sera élevée.
Les quartiles
Les diagrammes de quartiles
L’étendue, habituellement notée E, est définie comme la différence entre la valeur maximale et la valeur minimale de la distribution.
|E=x\,_{max}-x\,_{min}|
où x représente une donnée de la distribution.
Tout au long d’une journée de printemps, on mesure la température extérieure à chaque heure. On obtient la distribution suivante, dans laquelle toutes les valeurs sont en degrés Celsius (°C).
7,8,10,11,12,11,10,9,6,4,3,2,0,-1,-3,-4,-5,-4,-3,-2,0,1,2,3
On place les données en ordre croissant et on identifie les valeurs maximales et minimales de la distribution. 
On calcule l’étendue : 12 –(-5) = 17
L’étendue de cette distribution est de 17 °C.
L’étendue des quarts, notée EQ dans cette fiche, est définie comme la différence entre la valeur maximale et la valeur minimale d’un quart. L’étendue des quarts fait donc appel à la notion de quartile.
|E\,_{Q1}=Q_{\,1}-x\,_{min}|
|E\,_{Q2}=Q_{\,2}-Q_{1}|
|E\,_{Q3}=Q_{\,3}-Q_{\,2}|
|E\,_{Q4}=x\,_{max}-Q_{\,3}|
où
EQ représente l'étendue des quarts
xmin représente la valeur minimum de la distribution.
xmax représente la valeur maximum de la distribution.
Calculer l’étendue du premier quart de la distribution utilisée à l’exemple précédent. Les données sont en degrés Celsius.
-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.
On doit trouve la médiane qui représente Q2
On a 24 données
|Position\, de\, Q_{2}=\frac{n+1}{2}=\frac{24+1}{2}=12,5^{e\:}donn\acute{e}e|
En partant de la valeur minimum, on trouve que Q2 se situe entre 3 et 3 donc Q2 est égal à 3 °C.
-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.
Q1 est la médiane de la première moitié de la distribution qui contient 12 données
-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.
|Position\, de\, Q_{1}=\frac{n+1}{2}=\frac{12+1}{2}=6,5^{e\:}donn\acute{e}e|
-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.
Q1 se retrouve entre la 6e et la 7e donnée donc entre -2 °C et -1 °C, ce qui donne -1,5 °C
La valeur la plus basse de la distribution est de –5 °C. On calcule l’étendue du premier quart : -1,5 °C -(-5 °C) = 3,5 °C.
L’étendue du premier quart est égale à 3,5 °C
L’étendue interquartile, habituellement notée EI, est définie comme la différence entre le troisième quartile et le premier quartile. L’étendue interquartile fait donc appel à la notion de quartile.
Puisque chaque quartile sépare la distribution en quatre parties ayant environ le même nombre de données, l’étendue interquartile revient à calculer l’étendue de 50 % des données, celles qui sont les plus près de la médiane, de part et d’autre de celle-ci.
|\acute{E}tendue\: interquartile=Q_{3}-Q_{1}|
Calculer l’étendue interquartile de la distribution suivante. Les données sont déjà placées en ordre croissant.
-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.
On détermine la valeur de chacun des quartiles. Pour ce faire, on trouve d’abord la médiane. Ici, on a 24 données, ce qui est un nombre pair. La médiane sera donc égale à la moyenne des 12e et 13e données. Dans ce cas, ces deux données sont égales à 3. La médiane vaut donc 3 °C.
On cherche maintenant les valeurs des premiers et troisièmes quartiles. Cela revient à chercher la médiane des 12 premières données (premier quartile) et des 12 dernières données (troisième quartile). La valeur du premier quartile est égale à –1,5 °C alors que celle du troisième quartile est égale à 8,5 °C.
On calcule l’étendue interquartile : 8,5 °C – (-1,5 °C) = 10 °C.
L’étendue interquartile de cette distribution est de 10 °C.
Il existe une autre mesure de dispersion qui est reliée à l’étendue interquartile. C’est l’étendue semi-interquartile, qui est définie comme la moitié de l’étendue interquartile. Dans l’exemple précédent, l’étendue interquartile serait donc égale à la moitié de 10 °C, c’est-à-dire à 5 °C
L’écart moyen, habituellement noté EM, est défini comme la moyenne des écarts à la moyenne des valeurs de la distribution.
L’écart moyen peut se calculer peu importe si la distribution étudiée est une population complète ou est un échantillon de cette population. De plus, on peut le calculer pour des données non regroupées, condensées ou regroupées en classes.
Calculer l’écart moyen de la distribution utilisée dans les exemples précédents. La distribution a été placée en ordre croissant. Les valeurs sont en degrés Celsius.
-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.
Cette distribution est un échantillon et contient des données non groupées. Elle contient 24 données. Sa moyenne est égale à 3,29 °C. Voici le calcul des écarts à la moyenne.
| |x_{i}| | |x_{i}-\overline{x}| | |x_{i}| | |x_{i}-\overline{x}| |
| -5 | 8.31 | 3 | 0.31 |
| -4 | 7.31 | 4 | 0.71 |
| -4 | 7.31 | 4 | 0.71 |
| -3 | 6.31 | 6 | 2.71 |
| -3 | 6.31 | 7 | 3.71 |
| -2 | 5.31 | 8 | 4.71 |
| -1 | 4.31 | 9 | 5.71 |
| 0 | 3.31 | 10 | 6.71 |
| 0 | 2.31 | 10 | 6.71 |
| 1 | 1.31 | 11 | 7.71 |
| 2 | 0.31 | 11 | 7.71 |
| 3 | 0.31 | 12 | 8.71 |
Pour calculer l’écart moyen, il reste à faire la somme de la colonne de droite du tableau précédent et à diviser ce résultat par 24.
L’écart moyen est donc égal à 4,65.
La variance, habituellement notée s2 est définie comme la moyenne du carré des écarts (positifs ou négatifs) à la moyenne des valeurs de la distribution.
La variance peut se calculer peu importe si la distribution étudiée est une population complète ou est un échantillon de cette population.
Calculer la variance de la distribution utilisée dans les exemples précédents. La distribution a été placée en ordre croissant. Les valeurs sont en degrés Celsius.
-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.
Cette distribution est un échantillon et contient des données non groupées. Elle contient 24 données. Sa moyenne est égale à 3,3 °C. Voici le calcul du carré des écarts à la moyenne.
| |x_{i}| | |\left(x_{i}-\overline{x}\right)^{2}| |
| -5 | 68,89 |
| -4 | 53,29 |
| -4 | 53,29 |
| -3 | 39,69 |
| -3 | 39,69 |
| -2 | 28,09 |
| -1 | 18,49 |
| 0 | 10,89 |
| 0 | 10,89 |
| 1 | 5,29 |
| 2 | 1,69 |
| 3 | 0,09 |
| 3 | 0,09 |
| 4 | 0,49 |
| 4 | 0,49 |
| 6 | 7,29 |
| 7 | 13,69 |
| 8 | 22,09 |
| 9 | 32,49 |
| 10 | 44,89 |
| 10 | 44,89 |
| 11 | 59,29 |
| 11 | 59,29 |
| 12 | 75,69 |
Pour calculer la variance, il reste à faire la somme de la colonne de droite du tableau précédent et à diviser ce résultat par 23 (car il faut diviser par n-1), comme on a 24 données. On obtient 30,04.
La variance est donc égale à 30,04 (°C)2.
L’écart type, habituellement noté s lorsqu’on étudie un échantillon et σ lorsqu’on étudie une population, est défini comme la racine carrée de la moyenne du carré des écarts (positifs ou négatifs) à la moyenne des valeurs de la distribution.
L’écart type est donc la racine carrée de la variance. Par conséquent, tout comme la variance, l’écart-type peut se calculer peu importe si la distribution étudiée est une population complète ou est un échantillon de cette population.
Calculer l’écart type de la distribution utilisée dans les exemples précédents. La distribution a été placée en ordre croissant. Les valeurs sont en degrés Celsius.
-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.
Dans l’exemple précédent, on a calculé la variance de cette distribution. Il ne nous reste qu’à en extraire la racine carrée pour obtenir l’écart-type. On obtient 5,48.
L’écart type de cette distribution est donc égal à 5,48 °C.