FERMER

Mathématique

Les mesures de dispersion

Les mesures de dispersion servent à caractériser l’étalement des valeurs présentes dans une distribution. Plus la distribution sera étalée, plus la valeur de la mesure de dispersion sera élevée.

Les quartiles
Les diagrammes de quartiles

L'étendue

L’étendue, habituellement notée E, est définie comme la différence entre la valeur maximale et la valeur minimale de la distribution.

 

|E=x\,_{max}-x\,_{min}|

x représente une donnée de la distribution.

Procédure à appliquer pour déterminer l’étendue d’une distribution

  1. Placer les données de la distribution en ordre croissant.

  2. Identifier la donnée ayant la plus grande valeur et celle ayant la plus petite valeur.

  3. Calculer l’étendue en soustrayant ces deux valeurs.

Tout au long d’une journée de printemps, on mesure la température extérieure à chaque heure. On obtient la distribution suivante, dans laquelle toutes les valeurs sont en degrés Celsius (°C).

7,8,10,11,12,11,10,9,6,4,3,2,0,-1,-3,-4,-5,-4,-3,-2,0,1,2,3

On place les données en ordre croissant et on identifie les valeurs maximales et minimales de la distribution.



On calcule l’étendue : 12 –(-5) = 17

L’étendue de cette distribution est de 17 °C.

 

L'étendue des quarts

L’étendue des quarts, notée EQ dans cette fiche, est définie comme la différence entre la valeur maximale et la valeur minimale d’un quart. L’étendue des quarts fait donc appel à la notion de quartile.

 

|E\,_{Q1}=Q_{\,1}-x\,_{min}|


|E\,_{Q2}=Q_{\,2}-Q_{1}|


|E\,_{Q3}=Q_{\,3}-Q_{\,2}|


|E\,_{Q4}=x\,_{max}-Q_{\,3}|



EQ représente l'étendue des quarts
xmin représente la valeur minimum de la distribution.
xmax représente la valeur maximum de la distribution.

Procédure à appliquer pour déterminer l’étendue d’une distribution

  1. Déterminer la valeur de chacun des quartiles de la distribution.

  2. Calculer l’étendue du quart recherchée.

Calculer l’étendue du 1er quart de la distribution utilisée à l’exemple précédent. Les données sont en degrés Celsius.

-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.

Il va falloit calculer |E\,_{Q1}=Q_{\,1}-x\,_{min}|

On doit trouve la médiane qui représente Q2 avant de trouver Q1

On a 24 données

|Position\, de\, Q_{2}=\frac{n+1}{2}=\frac{24+1}{2}=12,5^{e\:}donn\acute{e}e|

En partant de la valeur minimum, on trouve que Q2 se situe entre 3 et 3 donc Q2 est égal à 3 °C.

-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.

Q1 est la médiane de la première moitié de la distribution qui contient 12 données

-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.

|Position\, de\, Q_{1}=\frac{n+1}{2}=\frac{12+1}{2}=6,5^{e\:}donn\acute{e}e|

-5,-4,-4,-3,-3,-2,-1,0,0,1,2,3,3,4,4,5,7,8,9,10,10,11,11,12.

Q1 se retrouve entre la 6e et la 7e donnée donc entre -2 °C et -1 °C, ce qui donne -1,5 °C

|x\,_{min}| La valeur la plus basse de la distribution est de –5 °C.

On calcule l’étendue du premier quart : -1,5 °C -(-5 °C) = 3,5 °C.

L’étendue du premier quart est égale à 3,5 °C

L'étendue interquartile

L’étendue interquartile, habituellement notée EI, est définie comme la différence entre le troisième quartile et le premier quartile. L’étendue interquartile fait donc appel à la notion de quartile.

Puisque chaque quartile sépare la distribution en quatre parties ayant environ le même nombre de données, l’étendue interquartile revient à calculer l’étendue de 50 % des données, celles qui sont les plus près de la médiane, de part et d’autre de celle-ci.

|\acute{E}tendue\: interquartile=Q_{3}-Q_{1}|

Procédure à appliquer pour déterminer l’étendue d’une distribution

  1. Déterminer la valeur de chacun des quartiles de la distribution.

  2. Calculer l’étendue interquartile.

Calculer l’étendue interquartile de la distribution suivante. Les données sont déjà placées en ordre croissant.

-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.

On détermine la valeur de chacun des quartiles. Pour ce faire, on trouve d’abord la médiane. Ici, on a 24 données, ce qui est un nombre pair. La médiane sera donc égale à la moyenne des 12e et 13e données. Dans ce cas, ces deux données sont égales à 3. La médiane vaut donc 3 °C.

On cherche maintenant les valeurs des premiers et troisièmes quartiles. Cela revient à chercher la médiane des 12 premières données (premier quartile) et des 12 dernières données (troisième quartile). La valeur du premier quartile est égale à –1,5 °C alors que celle du troisième quartile est égale à 8,5 °C.

On calcule l’étendue interquartile : 8,5 °C – (-1,5 °C) = 10 °C.

L’étendue interquartile de cette distribution est de 10 °C.

 

Il existe une autre mesure de dispersion qui est reliée à l’étendue interquartile. C’est l’étendue semi-interquartile, qui est définie comme la moitié de l’étendue interquartile. Dans l’exemple précédent, l’étendue interquartile serait donc égale à la moitié de 10 °C, c’est-à-dire à 5 °C

L'écart moyen

L’écart moyen, habituellement noté EM, est défini comme la moyenne des écarts à la moyenne des valeurs de la distribution.

L’écart moyen peut se calculer peu importe si la distribution étudiée est une population complète ou est un échantillon de cette population. De plus, on peut le calculer pour des données non regroupées, condensées ou regroupées en classes.

 

|EM= \frac{\Sigma|x_{i}-\overline{x}|}{n}|

Σ
est la lettre grecque sigma, ce symbole signifie qu’il faut effectuer une somme.

xi représente la ie valeur de la distribution.

|\overline{x}| représente la moyenne de l’échantillon.

n représente la taille de l’échantillon ou de la population.

Procédure à appliquer pour déterminer l’écart moyen d’une distribution

  1. Déterminer si les données proviennent d’un échantillon ou d’une population. Si ce n’est pas spécifié, on considère que c’est un échantillon.

  2. Déterminer si les données sont regroupées, condensées ou regroupées par classes.

  3. Déterminer la taille de la distribution.

  4. Calculer la moyenne de la distribution.

  5. Calculer tous les écarts à la moyenne.

  6. Calculer l’écart moyen.

Calculer l’écart moyen de la distribution utilisée dans les exemples précédents. La distribution a été placée en ordre croissant. Les valeurs sont en degrés Celsius.

-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.

Cette distribution est un échantillon et contient des données non groupées. Elle contient 24 données. Sa moyenne est égale à 3,29 °C. Voici le calcul des écarts à la moyenne.

|x_{i}| ||x_{i}-\overline{x}|| |x_{i}| ||x_{i}-\overline{x}||
-5 8,29 3 0,29
-4 7,29 4 0,71
-4 7,29 4 0,71
-3 6,29 6 2,71
-3 6,29 7 3,71
-2 5,29 8 4,71
-1 4,29 9 5,71
0 3,29 10 6,71
0 3,29 10 6,71
1 2,29 11 7,71
2 1,29 11 7,71
3 0,29 12 8,71

Pour calculer l’écart moyen, il reste à faire la somme de la colonne de droite du tableau précédent et à diviser ce résultat par 24.

L’écart moyen est donc égal à 4,65.

La variance

La variance, habituellement notée s2 est définie comme la moyenne du carré des écarts (positifs ou négatifs) à la moyenne des valeurs de la distribution.

Le calcul de la variance est nécessaire pour calculer l'écart type.

La variance peut se calculer peu importe si la distribution étudiée est une population complète ou est un échantillon de cette population.

|s^{2}=\frac{\Sigma(x_{i}-\overline{x})^{2}}{n-1}|


Σ est la lettre grecque sigma, ce symbole signifie qu’il faut effectuer une somme.

xi représente la ie valeur de la distribution.

|\overline{x}| représente la moyenne de l’échantillon.

n représente la taille de l’échantillon.

Procédure à appliquer pour déterminer la variance d’une distribution

  1. Déterminer la taille de la distribution.

  2. Calculer la moyenne de la distribution.

  3. Calculer le carré de tous les écarts (positifs ou négatifs) à la moyenne.

  4. Calculer la variance.

Calculer la variance de la distribution utilisée dans les exemples précédents. La distribution a été placée en ordre croissant. Les valeurs sont en degrés Celsius.

-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.

Cette distribution est un échantillon et contient des données non groupées. Elle contient 24 données. Sa moyenne est égale à 3,3 °C. Voici le calcul du carré des écarts à la moyenne.

|x_{i}| |\left(x_{i}-\overline{x}\right)^{2}|
-5 68,89
-4 53,29
-4 53,29
-3 39,69
-3 39,69
-2 28,09
-1 18,49
0 10,89
0 10,89
1 5,29
2 1,69
3 0,09
3 0,09
4 0,49
4 0,49
6 7,29
7 13,69
8 22,09
9 32,49
10 44,89
10 44,89
11 59,29
11 59,29
12 75,69

Pour calculer la variance, il reste à faire la somme de la colonne de droite du tableau précédent et à diviser ce résultat par 23 (car il faut diviser par n-1), comme on a 24 données. On obtient 30,04.

La variance est donc égale à 30,04 (°C)2.

L'écart type

L’écart type, habituellement noté s lorsqu’on étudie un échantillon et σ lorsqu’on étudie une population, est défini comme la racine carrée de la moyenne du carré des écarts (positifs ou négatifs) à la moyenne des valeurs de la distribution.

L'écart type est la racine carrée de la variance

L’écart type est donc la racine carrée de la variance. Par conséquent, tout comme la variance, l’écart-type peut se calculer peu importe si la distribution étudiée est une population complète ou est un échantillon de cette population.

|s= \sqrt{\frac{\Sigma(x_{i}-\overline{x})^{2}}{n-1}}|


Σ est la lettre grecque sigma, ce symbole signifie qu’il faut effectuer une somme.

xi représente la ie valeur de la distribution.

|\overline{x}| représente la moyenne de l’échantillon.

n représente la taille de l’échantillon.

Procédure à appliquer pour déterminer l’écart-type d’une distribution

  1. Calculer la variance de la distribution.

  2. Extraire la racine carrée du résultat de manière à obtenir l’écart-type.

Calculer l’écart type de la distribution utilisée dans les exemples précédents. La distribution a été placée en ordre croissant. Les valeurs sont en degrés Celsius.

-5, -4, -4, -3, -3, -2, -1, 0, 0, 1, 2, 3, 3, 4, 4, 6, 7, 8, 9, 10, 10, 11, 11, 12.

Dans l’exemple précédent, on a calculé la variance de cette distribution. Il ne nous reste qu’à en extraire la racine carrée pour obtenir l’écart-type. On obtient 5,48.

L’écart type de cette distribution est donc égal à 5,48 °C.

Les exercices

Les références