6. Mesures de tendance centrale

Guillaume Gilles

2025-02-18

Agenda

  1. Moyenne
  2. Mode

Moyenne arithmétique

Définition

la somme des valeurs des observations divisée par le nombre total d’observations.

\[ \bar{x} = \frac{x_1 + x_2 + \dots + x_n}{n} = \frac{1}{n} \sum_{i=n}^{n} x_i \]

Moyenne arithmétique

Avantages

  • Facile à calculer.
  • Représente bien les données symétriques.

Inconvénients

  • Sensible aux valeurs extrêmes (outliers).

Moyenne arithmétique

Exemple

Les miles par gallon des voitures du jeu de données mtcars

 [1] 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.2 10.4
[16] 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.4 15.8 19.7
[31] 15.0 21.4

❔ Calculer la moyenne arithmétique, au centième prés.

[1] 20.09

Moyenne arithmétique

Représentation graphique

Moyenne pondérée

Variable discrète

Pour une variable discrète dont les modalités \(m_i\) sont des valeurs exactes représentées en tableau:

\[ \bar{x} = \frac{\sum_{i=1}^{k} n_i \times m_i}{n} = \frac{n_1 \times m_1 + n_2 \times m_2 + \dots + n_k \times m_k}{n} \]

\(n_i\) est l’effectif associé à \(m_i\). Dans ce cas, \(\bar{x}\) est appelée la moyenne pondérée des données.

Moyenne pondérée :: variable discrète

Exemple

Effectif des valeurs de la variable gear
Nombre de vitesses Effectif
3 15
4 12
5 5

❔ Calculer la moyenne pondérée, au centième prés.

[1] 3.69

Moyenne pondérée :: variable discrète

Représentation graphique

Moyenne pondérée

Variable continue

Pour une variable continue dont les modalités sont des classes représentées en tableau:

\[ \bar{x} = \frac{\sum_{i=1}^{k} n_i \times c_i}{n} = \frac{n_1 \times c_1 + n_2 \times c_2 + \dots + n_k \times c_k}{n} \]

\(c_i\) est le centre (milieu) de la \(i^e\) classe et \(n_i\) est son effectif associé. Dans ce cas, \(\bar{x}\) est également appelée la moyenne pondérée des données.

Moyenne pondérée :: variable continue

Exemple

Effectif des voitures par intervalle de poids
Intervalle de poids (wt) Effectif
[1.51,2] 4
(2,2.49] 4
(2.49,2.98] 4
(2.98,3.47] 9
(3.47,3.96] 7
(3.96,4.45] 1
(4.94,5.43] 3

❔ Calculer la moyenne pondérée, au centième prés.

[1] 3.22

Moyenne pondérée :: variable continue

Représentation graphique

Mode

Définiton

Le mode est la valeur la plus fréquente, qui apparaît le plus souvent, dans un ensemble de données.

Important

C’est le seul indicateur de tendance centrale qui peut être utilisée sur des données nominales

Une répartition peut être unimodale ou plurimodale (bimodale, trimodale…), si deux ou plusieurs valeurs de la variable considérée émergent également, voire sans aucun mode (distribution uniforme) si toutes les valeurs de la variable considérée émergent également. Aussi, sa définition ne s’obtient pas directement comme une fonction des termes de la série.

Mode

Les variables qualitatives ou discrète

Le mode est la (ou les) modalité(s) da la varaible dont la valeur de l’effectif (ou fréquence) est la plus élevée.

Mode :: variables qualitatives ou discrète

Exemples

Les cylindrées des voitures du jeu de données mtcars

 [1] 6 6 4 6 8 6 8 4 4 6 6 8 8 8 8 8 8 4 4 4 4 8 8 8 8 4 4 4 8 6 8 4

❔ Identifier le(s) mode(s) associés à ce jeu de données

  • 4
  • 6
  • 8

Mode :: variable discrète

Représentation graphique

Mode :: variables qualitatives

Représentation graphique

Mode

Les variables continues

Dans le cas d’une répartition en classes d’amplitudes égales, la classe modale désigne celle qui a le plus fort effectif. La convention est d’appeler mode le centre de la classe modale. Si les classes sont d’amplitudes diverses, il convient de relativiser pour désigner ce paramètre. La classe modale est alors celle qui a la plus forte densité.

Le mode appartient à la classe modale (celle qui possède la plus grande hauteur). Soit \([a; b[\) la classe modale, le mode est calculé ainsi :

\[ Mode = a + \left((b - a) \times \frac{\Delta_1}{\Delta_1 + \Delta_2}\right) \]

Où:

  • \(\Delta_1 = h_c - h_{c-1}\)
  • \(\Delta_2 = h_c - h_{c+1}\)

Avec:

  • \(h_c\) la hauteur de la classe modale \([a; b[\)
  • \(h_{c-1}\) la hauteur qui précède \([a; b[\)
  • et \(h_{c+1}\) la hauteur qui succède \([a; b[\)

Mode :: variables continues

Exemple

Effectif des voitures par intervalle de poids
Intervalle de poids (wt) Effectif
[1.51,2] 4
(2,2.49] 4
(2.49,2.98] 4
(2.98,3.47] 9
(3.47,3.96] 7
(3.96,4.45] 1
(4.94,5.43] 3

❔ Identifier le(s) mode(s) associés à ce jeu de données

[1] 3.44

Mode :: variables continues

Représentation graphique

Quand utiliser chaque indicateur ?

  • Moyenne :
    • Appropriée pour des données quantitatives symétriques sans valeurs extrêmes.
    • Exemples : calcul du revenu moyen, de la note moyenne.
  • Médiane :
    • Idéale pour des données asymétriques ou affectées par des valeurs extrêmes.
    • Exemples : revenu médian pour analyser les inégalités, âge médian.
  • Mode :
    • Particulièrement utile pour des données qualitatives ou pour identifier les tendances dominantes.
    • Exemples : marque de voiture préférée, catégorie d’âge prédominante.