|
|
La statistique est une branche des mathématiques appliquées et inclut la planification, le résumé et l'interprétation d'observations. Le mot statistique vient du Latin statisticus signifiant "probabilité". La théorie des probabilités joue un rôle critique dans le développement de la théorie des statistiques.
Le statisticien décrit la connaissance (ou l'ignorance) mathématique et tente d'en apprendre plus selon ses observations. Cela demande:
Certaines sciences utilisent des statistiques appliquées à leur domaine utilisant une terminologie spécifique (Biostatistique, Géostatistique,Statistique économique ...).
| Table of contents |
|
2 Probabilité 3 Lois statistiques 4 Acquisition et traitement des données 5 Incertitude de mesure 6 Liens externes |
Le but de la statistique est d'essayer de modéliser le hasard. Par essence, on ne peut pas prédire le résultat d'un phénomène aléatoire (par exemple un jet de dés). Les statistiques essaient tout de même de caractériser ces phénomènes, grâce à la notion de variable aléatoire (σ-algèbre, voir théorie des probabilités).
On remarque que sur un grand nombre d'essais, les différents résultats d'un événement reviennent avec une fréquence constante, par exemple, sur un jet de dés à six faces, chaque face apparaît en moyenne une fois sur six. On peut donc associer un nombre, appelé probabilité, qui représente cette fréquence. Dans certains cas simples, on peut calculer ces probabilités par dénombrement.
On commence en général l'étude des statistiques par l'étude des probabilités, de leurs propriétés et des calculs que l'on peut faire avec (moyenne, écart type), sans s'occuper de la manière dont on établit ces probabilités.
La répartition des probabilités, ou de la densité de probabilité, des phénomènes aléatoires suit souvent des lois relativement simples. Les lois de probabilité les plus connues sont :
Pour établir la loi de probabilité, et notamment déterminer le type de loi adapté et les paramètres E et σ, il faut utiliser des mesures. Se pose alors le problème de l'échantillonnage : choix de la population à sonder (au sens large : cela peut être un sondage d'opinion en interrogeant des humains, ou bien le ramassage de roches pour déterminer la nature d'un sol en géologie), la taille de la population et sa représentativité.
Dans le cas le plus simple, on fait n mesures, et on obtient n valeurs (''xi).
Une fois que l'on a collecté les résultats du sondage, il faut estimer E et σ. On utilise pour cela des estimateur sans biais, en générale la moyenne arithmétique Ê pour estimer l'espérance
Lorsque l'on collecte deux valeurs (xi,yi) par mesure, on travaille en fait avec deux variables aléatoires X et Y. X et Y sont dites corrélées si la connaissance de la valeur de X permet de prédire plus facilement la valeur de Y. Concrètement, cela peut vouloir dire que le paramètre X influence le paramètre Y, ou que Y influence X, ou encore que X et Y ont une origine commune. On calcule pour cela un coefficient de corrélation. L'utilisation de cette notion est souvent abusive, le fait que deux variables aléatoires soient corrélées ne signifie pas qu'elles soient dépendantes l'une de l'autre.
En physique et en chimie, on utilise souvent la loi de Student pour déterminer les incertitudes ; dans ces domaines, son utilisation se réduite souvent à multiplier l'estimateur de l'écart type par deux ou par trois pour avoir l'erreur acceptable.
Souvent, un phénomène physique obéit à une loi simple, linéaire :
Le hasard
Probabilité
Lois statistiques
La connaissance de la probabilité complète peut se résumer à la connaissance du type de loi et de deux paramètres : l'espérance E (la moyenne) et l'écart type σ.Acquisition et traitement des données
et la variance empirique corrigée pour l'écart type
Il faut ensuite faire des tests pour vérifier que la loi choisie est judicieuse, notamment le test du χ2 (ou Chi-deux, prononcer "ki-deux").Incertitude de mesure
c'est le cas caricatural de variables corrélées.
À partir de mesures de couples de valeurs (xi,yi), on veut établir a et b. Ceci s'appelle la régression linéaire.