Devoir de Philosophie

Grand oral du bac : Mathématiques LES STATISTIQUES

Publié le 05/02/2019

Extrait du document

ont eu une note inférieure ou égale à 20 (deuxième ligne du tableau). On peut présenter les données sous forme d’histogramme (voir figure 3). Il s’agit d’une figure constituée de rectangles dont la largeur est l’amplitude de la classe correspondante et dont la hauteur est proportionnelle à l’effectif de la classe.

 

On peut également tracer un histogramme des fréquences cumulées. Pour chaque classe, la hauteur du rectangle est alors proportionnelle à l’effectif cumulé correspondant.

Mesure de la tendance centrale

 

Le statisticien travaille souvent avec un très grand nombre de données. L’une de ses tâches est alors de les réduire, c’est-à-dire de les remplacer par des paramètres, ou caractéristiques, qui sont de deux types: ceux qui donnent une idée globale de la tendance centrale des valeurs ; ceux qui indiquent la dispersion (étalement) des valeurs observées.

 

Pour évaluer la tendance centrale, on peut calculer un nombre qui résume en quelque sorte l’ensemble des données: la moyenne arithmétique. Considérons la série de données xl, x2,..., xi,..., xm, d’effectifs respectifs ni, n2,..., ni..., nm. La moyenne arithmétique x de ces valeurs (prononcer « x barre ») est alors :

 

m

 

_ i = 1

 

X =

 

m

 

^i

 

i = I

 

Ainsi, dans l’exemple du groupe des 24 élèves, la note moyenne obtenue par le groupe est:

 

- _ (2x44) + (l x45) + (3 x 58) + (2 x 62) + (l x67) + ...+ (2x 100)

 

24

 

x=75,083

Dans le cas général, la moyenne arithmétique est aussi égale à:

 

m

 

x = î fjxt

 

i = 1

 

La médiane et le mode sont deux autres mesures de la valeur centrale. La médiane est la valeur telle qu’il existe un nombre égal d’observations, ou de valeurs, inférieures et supérieures à cette valeur. Ainsi, si l’on classe les m résultats observés dans l’ordre croissant, si m est impair, la médiane est la valeur de la variable correspondant au rang (m+l)/2. Par exemple, considérons les 5 résultats suivants: 2,4, 8, 41,45; la médiane est la troisième valeur, à savoir 8, alors que la

 

moyenne vaut 20. Quand le nombre de résultats est pair, la médiane n’est pas vraiment définie : elle est indéterminée entre les deux valeurs centrales. Ainsi, considérons les données: 2, 4, 7, 8, 41,45 ; la médiane est située entre 7 et 8. Le mode, également appelé dominante, est la valeur de la variable dont la fréquence est maximale. Un ensemble de données peut avoir plusieurs modes. Dans l’exemple précédent des notes obtenues par les 24 élèves, les modes sont 81 et 95.

Lorsque le nombre de données est trop important, on divise les données en groupes adaptés, généralement d’étendue égale, appelés classes. Les classes ne doivent pas être trop nombreuses et bien rendre compte de la répartition des données. Par exemple, si l’on considère les notes obtenues à l’examen de mathématiques par 20 groupes de 24 élèves chacun (soit 480 élèves), on peut introduire les classes suivantes:

Plus l’écart-type est petit, c’est-à-dire proche de 0, plus les valeurs sont regroupées entre elles et donc bien représentées par la moyenne arithmétique. Dans l’exemple considéré, comme l’écart-type est grand, on dit que les valeurs sont dispersées. Les calculs de la variance et de l’écart-type sont nécessaires au statisticien pour interpréter les résultats de son enquête.

« Les statistiques à pouvoir les interpréter facilement.

On peut représenter la répartition des notes par un dia­ gramme en bâtons: à chaque valeur de la variable (note, notée x) est associé un bâton ver­ tical dont la longueur est proportionnelle au nombre de cas observés (nombre d'élèves) ou à la fréquence, notée �-Ainsi, on trace le graphique (voir figure 1) qui donne fi en fonction dexr Un graphique des fréquences cumulées (voir figure 2) représente les notes sur l'axe des abs­ cisses; sur l'axe des ordonnées sont indiquées les fréquences cumulées en pourcentage.

Diagramme en bâtons 0,\60 0,140 0.12() 0,100 0.080 0.060 0.040 0.02() Graphique des fréquences cumulées Lorsque le nombre de données est trop impor­ tant, on divise les données en groupes adaptés, généralement d'étendue égale, appelés classes.

Les classes ne doivent pas être trop nombreuses et bien rendre compte de la répartition des don­ nées.

Par exemple, si l'on considère les notes obtenues à l'examen de mathématiques par 20 groupes de 24 élèves chacun (soit 480 élèves), on peut introduire les classes suivantes: Classes Centre Effectif Effectif des classes cumulé 0-10 5 22 22 10-20 15 20 42 20-30 25 30 72 30-40 35 34 106 40-50 45 40 146 50-60 55 60 206 60-70 65 55 261 70-80 75 75 336 80-90 85 82 418 90-100 95 62 480 Total 480 Pour une classe, l'effectif cumulé est le nombre .

d'élèves a�nt eu une note égale ou inférieure au maximum de la classe.

Par exemple, 42 élèves ont eu une note inférieure ou égale à 20 ( deuxiè­ me ligne du tableau).

On peut présenter les don­ nées sous forme d'histogramme (voir figure 3).

Il s'agit d'une figure constituée de rectangles dont la largeur est l'amplitude de la classe correspon­ dante et dont la hauteur est proportionnelle à l'effectif de la classe.

On peut également tracer un histogramme des fréquences cumulées.

Pour chaque classe, la hau­ teur du rectangle est alors proportionnelle à l'effectif cumulé correspondant.

Histogramme des effectifs 100 90 80 60 50 40 30 20 10 Mesure de la tendance centrale Le statisticien travaille souvent avec un très grand nombre de données.

Lune de ses tâches est alors de les réduire, c'est-à-. »

↓↓↓ APERÇU DU DOCUMENT ↓↓↓

Liens utiles