Grand oral du bac : Mathématiques LES STATISTIQUES
Publié le 05/02/2019
Extrait du document
ont eu une note inférieure ou égale à 20 (deuxième ligne du tableau). On peut présenter les données sous forme d’histogramme (voir figure 3). Il s’agit d’une figure constituée de rectangles dont la largeur est l’amplitude de la classe correspondante et dont la hauteur est proportionnelle à l’effectif de la classe.
On peut également tracer un histogramme des fréquences cumulées. Pour chaque classe, la hauteur du rectangle est alors proportionnelle à l’effectif cumulé correspondant.
Mesure de la tendance centrale
Le statisticien travaille souvent avec un très grand nombre de données. L’une de ses tâches est alors de les réduire, c’est-à-dire de les remplacer par des paramètres, ou caractéristiques, qui sont de deux types: ceux qui donnent une idée globale de la tendance centrale des valeurs ; ceux qui indiquent la dispersion (étalement) des valeurs observées.
Pour évaluer la tendance centrale, on peut calculer un nombre qui résume en quelque sorte l’ensemble des données: la moyenne arithmétique. Considérons la série de données xl, x2,..., xi,..., xm, d’effectifs respectifs ni, n2,..., ni..., nm. La moyenne arithmétique x de ces valeurs (prononcer « x barre ») est alors :
m
_ i = 1
X =
m
^i
i = I
Ainsi, dans l’exemple du groupe des 24 élèves, la note moyenne obtenue par le groupe est:
- _ (2x44) + (l x45) + (3 x 58) + (2 x 62) + (l x67) + ...+ (2x 100)
24
x=75,083
Dans le cas général, la moyenne arithmétique est aussi égale à:
m
x = î fjxt
i = 1
La médiane et le mode sont deux autres mesures de la valeur centrale. La médiane est la valeur telle qu’il existe un nombre égal d’observations, ou de valeurs, inférieures et supérieures à cette valeur. Ainsi, si l’on classe les m résultats observés dans l’ordre croissant, si m est impair, la médiane est la valeur de la variable correspondant au rang (m+l)/2. Par exemple, considérons les 5 résultats suivants: 2,4, 8, 41,45; la médiane est la troisième valeur, à savoir 8, alors que la
moyenne vaut 20. Quand le nombre de résultats est pair, la médiane n’est pas vraiment définie : elle est indéterminée entre les deux valeurs centrales. Ainsi, considérons les données: 2, 4, 7, 8, 41,45 ; la médiane est située entre 7 et 8. Le mode, également appelé dominante, est la valeur de la variable dont la fréquence est maximale. Un ensemble de données peut avoir plusieurs modes. Dans l’exemple précédent des notes obtenues par les 24 élèves, les modes sont 81 et 95.
Lorsque le nombre de données est trop important, on divise les données en groupes adaptés, généralement d’étendue égale, appelés classes. Les classes ne doivent pas être trop nombreuses et bien rendre compte de la répartition des données. Par exemple, si l’on considère les notes obtenues à l’examen de mathématiques par 20 groupes de 24 élèves chacun (soit 480 élèves), on peut introduire les classes suivantes:
Plus l’écart-type est petit, c’est-à-dire proche de 0, plus les valeurs sont regroupées entre elles et donc bien représentées par la moyenne arithmétique. Dans l’exemple considéré, comme l’écart-type est grand, on dit que les valeurs sont dispersées. Les calculs de la variance et de l’écart-type sont nécessaires au statisticien pour interpréter les résultats de son enquête.
«
Les
statistiques
à pouvoir les interpréter facilement.
On peut
représenter la répartition des notes par un dia
gramme en bâtons: à chaque valeur de la
variable (note, notée x) est associé un bâton ver
tical dont la longueur est proportionnelle au
nombre de cas observés (nombre d'élèves) ou à
la fréquence, notée �-Ainsi, on trace le graphique
(voir figure 1) qui donne fi en fonction dexr
Un graphique des fréquences cumulées (voir
figure 2) représente les notes sur l'axe des abs
cisses; sur l'axe des ordonnées sont indiquées les
fréquences cumulées en pourcentage.
Diagramme en bâtons
0,\60
0,140
0.12()
0,100
0.080 0.060
0.040
0.02()
Graphique des fréquences cumulées
Lorsque le nombre de données est trop impor
tant, on divise les données en groupes adaptés,
généralement d'étendue égale, appelés classes.
Les classes ne doivent pas être trop nombreuses
et bien rendre compte de la répartition des don
nées.
Par exemple, si l'on considère les notes
obtenues à l'examen de mathématiques par 20
groupes de 24 élèves chacun (soit 480 élèves), on
peut introduire les classes suivantes:
Classes Centre Effectif Effectif
des classes cumulé
0-10 5
22 22
10-20 15 20 42
20-30 25
30 72
30-40 35 34 106
40-50 45
40
146
50-60 55
60 206
60-70 65 55 261
70-80
75 75 336
80-90 85 82
418
90-100
95 62 480
Total 480
Pour une classe, l'effectif cumulé est le nombre
.
d'élèves a�nt eu une note égale ou inférieure au
maximum de la classe.
Par exemple, 42 élèves ont
eu une note inférieure ou égale à 20 ( deuxiè
me ligne du tableau).
On peut présenter les don
nées sous forme d'histogramme (voir figure 3).
Il
s'agit d'une figure constituée de rectangles dont
la largeur est l'amplitude de la classe correspon
dante et dont la hauteur est proportionnelle à
l'effectif de la classe.
On peut également tracer un histogramme des
fréquences cumulées.
Pour chaque classe, la hau
teur du rectangle est alors proportionnelle à
l'effectif cumulé correspondant.
Histogramme des effectifs
100
90
80 60
50
40
30
20 10
Mesure de la tendance centrale
Le statisticien travaille souvent avec un très grand
nombre de données.
Lune de ses tâches est alors
de les réduire, c'est-à-.
»
↓↓↓ APERÇU DU DOCUMENT ↓↓↓
Liens utiles
- Grand oral du bac : Arts et Culture L'ART DE LA PHOTOGRAPHIE
- Grand oral du bac : Arts et Culture LE BAUHAUS
- Grand oral du bac : Arts et Culture LE BAROQUE
- Grand oral du bac : WALT DISNEY
- Grand oral du bac : GEORGE ORWELL