FERMER

Mathématique

Les mesures de dispersion

Les mesures de dispersion servent à caractériser l’étalement des valeurs présentes dans une distribution. Plus la distribution sera étalée, plus la valeur de la mesure de dispersion sera élevée.

L'étendue

L’étendue, habituellement notée |E|, est définie comme la différence entre la valeur maximale et la valeur minimale de la distribution.

 

|E=x\,_{\max}-x\,_{\min}|

où |x| représente une donnée de la distribution.

Procédure à appliquer pour déterminer l’étendue d’une distribution

  1. Placer les données de la distribution en ordre croissant.

  2. Identifier la donnée ayant la plus grande valeur et celle ayant la plus petite valeur.

  3. Calculer l’étendue en soustrayant ces deux valeurs.

Tout au long d’une journée de printemps, on mesure la température extérieure à chaque heure. On obtient la distribution suivante, dans laquelle toutes les valeurs sont en degrés Celsius (°C).

7,8,10,11,12,11,10,9,6,4,3,2,0,-1,-3,-4,-5,-4,-3,-2,0,1,2,3

On place les données en ordre croissant et on identifie les valeurs maximales et minimales de la distribution.



On calcule l’étendue : |E=12 –(-5) = 17|.

L’étendue de cette distribution est de 17 °C.

 

L'étendue des quarts

L’étendue des quarts, notée |EQ|, est définie comme la différence entre la valeur maximale et la valeur minimale d’un quart. L’étendue des quarts fait donc appel à la notion de quartile.

 

|E\,_{Q1}=Q_{\,1}-x\,_{\min}|


|E\,_{Q2}=Q_{\,2}-Q_{1}|


|E\,_{Q3}=Q_{\,3}-Q_{\,2}|


|E\,_{Q4}=x\,_{\max}-Q_{\,3}|



|E_Q| représente l'étendue des quarts;
|x_{\min}| représente la valeur minimum de la distribution;
|x_{\max}| représente la valeur maximum de la distribution.

Procédure à appliquer pour déterminer l’étendue d’une distribution

  1. Déterminer la valeur de chacun des quartiles de la distribution.

  2. Calculer l’étendue du quart recherchée.

Calculer l’étendue du 1er quart de la distribution utilisée à l’exemple précédent. Les données sont en degrés Celsius.

-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.

Il va falloit calculer |E\,_{Q1}=Q_{\,1}-x\,_{min}|

On doit trouve la médiane qui représente |Q_2| avant de trouver |Q_1|.

On a 24 données.

|\text{rang de } Q_{2}=\dfrac{n+1}{2}=\dfrac{24+1}{2}=12,5^{\text{e}} \text{donnée}|

En partant de la valeur minimum, on trouve que |Q_2| se situe entre 3 et 3 donc |Q_2| est égal à 3 °C.

-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.

Q1 est la médiane de la première moitié de la distribution qui contient 12 données

-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.

|\text{rang de } Q_{1}=\dfrac{n+1}{2}=\dfrac{12+1}{2}=6,5^{\text{e}} \text{donnée}|

-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.

|Q_1| se retrouve entre la 6e et la 7e donnée donc entre -2 °C et -1 °C, ce qui donne -1,5 °C

|x_{\min}| La valeur la plus basse de la distribution est de –5 °C.

On calcule l’étendue du premier quart : |E_{Q1}= -1,5^{\circ} \text{C} -(-5^{\circ}\text{C}) = 3,5^{\circ} \text{C}|.

L’étendue du premier quart est égale à 3,5 °C

L'étendue interquartile

L’étendue interquartile, habituellement notée |EI|, est définie comme la différence entre le troisième quartile et le premier quartile. L’étendue interquartile fait donc appel à la notion de quartile.

Puisque chaque quartile sépare la distribution en quatre parties ayant environ le même nombre de données, l’étendue interquartile revient à calculer l’étendue de 50 % des données, celles qui sont les plus près de la médiane, de part et d’autre de celle-ci.

|EI=Q_{3}-Q_{1}|

Procédure à appliquer pour déterminer l’étendue interquartile d’une distribution

  1. Déterminer la valeur de chacun des quartiles de la distribution.

  2. Calculer l’étendue interquartile.

Calculer l’étendue interquartile de la distribution suivante. Les données sont déjà placées en ordre croissant.

-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.

On détermine la valeur de chacun des quartiles. Pour ce faire, on trouve d’abord la médiane. Ici, on a 24 données, ce qui est un nombre pair. La médiane sera donc égale à la moyenne des 12e et 13e données. Dans ce cas, ces deux données sont égales à 3. La médiane vaut donc 3 °C.

On cherche maintenant les valeurs des premiers et troisièmes quartiles. Cela revient à chercher la médiane des 12 premières données (premier quartile) et des 12 dernières données (troisième quartile). La valeur du premier quartile est égale à –1,5 °C alors que celle du troisième quartile est égale à 8,5 °C.

On calcule l’étendue interquartile : |EI=8,5^\circ \text{C} – (-1,5^\circ \text{C}) = 10^\circ \text{C}|.

L’étendue interquartile de cette distribution est de 10 °C.

 

Il existe une autre mesure de dispersion qui est reliée à l’étendue interquartile. C’est l’étendue semi-interquartile, qui est définie comme la moitié de l’étendue interquartile. Dans l’exemple précédent, l’étendue interquartile serait donc égale à la moitié de 10 °C, c’est-à-dire à 5 °C

L'écart moyen

L’écart moyen, habituellement noté |EM|, est défini comme la moyenne des écarts à la moyenne des valeurs de la distribution.

L’écart moyen peut se calculer peu importe si la distribution étudiée est une population complète ou est un échantillon de cette population. De plus, on peut le calculer pour des données non regroupées, condensées ou regroupées en classes.

 

|EM= \dfrac{\sum|x_{i}-\overline{x}|}{n}|

|\sum| est la lettre grecque sigma, ce symbole signifie qu’il faut effectuer une somme.

|x_i| représente la |i^\text{e}| valeur de la distribution.

|\overline{x}| représente la moyenne de l’échantillon (on utiliserait le symbole |\mu| si nous avions la moyenne d'une population). .

|n| représente la taille de l’échantillon ou de la population.

Note : Un écart est positif, c'est la raison pour laquelle on utilise la valeur absolue.

Procédure à appliquer pour déterminer l’écart moyen d’une distribution

  1. Déterminer si les données proviennent d’un échantillon ou d’une population. Si ce n’est pas spécifié, on considère que c’est un échantillon.

  2. Déterminer si les données sont regroupées, condensées ou regroupées par classes.

  3. Déterminer la taille de la distribution.

  4. Calculer la moyenne de la distribution.

  5. Calculer tous les écarts à la moyenne.

  6. Calculer l’écart moyen.

Calculer l’écart moyen de la distribution utilisée dans les exemples précédents. La distribution a été placée en ordre croissant. Les valeurs sont en degrés Celsius.

-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.

Cette distribution est un échantillon et contient des données non groupées. Elle contient 24 données. Sa moyenne est environ  |3,29^\circ \text{C}| (ceci est |\overline{x}|. Voici le calcul des écarts à la moyenne.

|x_{i}| ||x_{i}-\overline{x}|| |x_{i}| ||x_{i}-\overline{x}||
-5 8,29 3 0,29
-4 7,29 4 0,71
-4 7,29 4 0,71
-3 6,29 6 2,71
-3 6,29 7 3,71
-2 5,29 8 4,71
-1 4,29 9 5,71
0 3,29 10 6,71
0 3,29 10 6,71
1 2,29 11 7,71
2 1,29 11 7,71
3 0,29 12 8,71

Pour calculer l’écart moyen, il reste à faire la somme de la colonne de droite du tableau précédent et à diviser ce résultat par 24 (il y a 24 données).

|EM = \dfrac{111,58}{24} \approx 4,65^\circ \text{C}|.

L'écart moyen de cette distribution est donc d'environ 4,65 degrés Celcius.

La variance

La variance, habituellement notée |s^2| ou |\sigma^2| est définie comme la moyenne du carré des écarts (positifs ou négatifs) à la moyenne des valeurs de la distribution.

Le calcul de la variance est nécessaire pour calculer l'écart type.

La variance peut se calculer peu importe si la distribution étudiée est une population complète ou est un échantillon de cette population.

|s^{2}=\dfrac{\sum(x_{i}-\overline{x})^{2}}{n-1}| ou |\sigma^2 = \dfrac{\sum (x_i-\mu)^2}{N}|


|\sum| est la lettre grecque sigma majuscule, ce symbole signifie qu’il faut effectuer une somme.

|x_i| représente la |i^\text{e}| valeur de la distribution.

|\overline{x}| représente la moyenne de l’échantillon et |\mu| représente la moyenne d'une population.

|n| représente la taille de l’échantillon et |N| la taille de la population.

Note : si on travaille avec un échantillon on utilise la formule pour |s^2| alors que si on travaille avec une population on utilise la formule pour |\sigma^2|.

Procédure à appliquer pour déterminer la variance d’une distribution

  1. Déterminer si les données constituent un échantillon ou une population.

  2. Déterminer la taille de la distribution (|n| ou |N|).

  3. Calculer la moyenne de la distribution (|\overline{x}| ou |\mu|).

  4. Calculer le carré de tous les écarts (positifs ou négatifs) à la moyenne.

  5. Calculer la variance (|s^2| ou |\sigma^2|).

Calculer la variance de la distribution utilisée dans les exemples précédents. La distribution a été placée en ordre croissant. Les valeurs sont en degrés Celsius.

-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.

Cette distribution est un échantillon et contient des données non groupées. Elle contient 24 données. Sa moyenne est |\overline{x} \approx 3,29^\circ \text{C}|. Voici le calcul du carré des écarts à la moyenne.

|x_{i}| |\left(x_{i}-\overline{x}\right)^{2}|
-5 68,72
-4 53,14
-4 53,14
-3 39,56
-3 39,56
-2 27,98
-1 18,40
0 10,82
0 10,82
1 5,24
2 1,66
3 0,08
3 0,08
4 0,50
4 0,50
6 7,34
7 13,76
8 22,18
9 32,60
10 45,02
10 45,02
11 59,44
11 59,44
12 75,86

Pour calculer la variance, il reste à faire la somme de la colonne de droite du tableau précédent et à diviser ce résultat par 23 (car il faut diviser par |n-1| puisque nous travaillons avec un échantillon), comme on a 24 données.

|s^2 = \dfrac{(x_i-\overline{x})^2}{n-1} = \dfrac{690,86}{23} \approx 30,04|

Ainsi, la variance est d'environ |30,04^\circ \text{C}^2|.

L'écart type

L’écart type, habituellement noté |s| lorsqu’on étudie un échantillon et |\sigma| lorsqu’on étudie une population, est défini comme la racine carrée de la moyenne du carré des écarts  à la moyenne des valeurs de la distribution.

L'écart type est la racine carrée de la variance

L’écart type est donc la racine carrée de la variance. Par conséquent, tout comme la variance, l’écart-type peut se calculer peu importe si la distribution étudiée est une population complète ou est un échantillon de cette population.

|s= \sqrt{\dfrac{\sum(x_{i}-\overline{x})^{2}}{n-1}}| ou |\sigma = \sqrt{\dfrac{\sum(x_i-\overline{x})^2}{N}}|


|\sum| est la lettre grecque sigma majuscule, ce symbole signifie qu’il faut effectuer une somme.

|x_i| représente la |i^\text{e}| valeur de la distribution.

|\overline{x}| représente la moyenne de l’échantillon et |\mu| la moyenne de la population.

|n| représente la taille de l’échantillon et |N| la taille de la population.

Note : si on travaille avec un échantillon on utilise la formule pour calculer |s| et si on travaille avec une population on utilise la formule pour calculer |\sigma|.

Procédure à appliquer pour déterminer l’écart type d’une distribution

  1. Calculer la variance de la distribution.

  2. Extraire la racine carrée de la variance de manière à obtenir l’écart type.

Calculer l’écart type de la distribution utilisée dans les exemples précédents. La distribution a été placée en ordre croissant. Les valeurs sont en degrés Celsius.

-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.

Dans l’exemple précédent, on a calculé la variance de cette distribution. Il ne nous reste qu’à en extraire la racine carrée pour obtenir l’écart-type.

|s^2 = 30,04^\circ \text{C}^2|

|s = \sqrt{30,04^\circ \text{C}^2} \approx 5,48^\circ \text{C}|

L’écart type de cette distribution est donc égal à environ  |5,48^\circ \text{C}|.

Les exercices

Les références