Variables aléatoires élémentaires
La notion de variable aléatoire réelle est utilisée dès que le résultat d'une expérience aléatoire est quantifiable. Elle est née de la théorie des jeux o๠,à chaque jeu, pouvait être associé un gain (= somme empochée - mise).Une variable aléatoire réelle est une application X d'un univers Ω muni d'une probabilité p vers R. Cette application crée un nouvel univers X(Ω) sur lequel on peut construire une probabilité issue de p. Cette probabilité s'appelle loi de probabilité de X. Il arrive souvent que l'on oublie l'univers Ω pour ne s'intéresser qu'à l'univers X(Ω).
Exemple: En lançant deux dés, on crée un univers de 36 éléments formé de couples d'entiers de 1 à 6. Sur cet univers, on définit une équiprobabilité (les lancers des 2 dés étant deux expériences indépendantes). Si l'on ne s'intéresse qu'à la somme des deux dés, il faut créer une variable aléatoire X qui, à chaque couple, associe leur somme.
L'univers X(Ω) est donc {2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 , 11 , 12}. Cet univers contient 11 éléments, mais il n'est pas adéquat d'y définir une équiprobabilité.
Cas des variables aléatoires définies sur un univers Ω fini.
Si l'univers Ω est fini, alors l'univers X(Ω) est fini. X(Ω) = {x1, x2, ..., xn}.
Loi de probabilité
La loi de probabilité se construit alors de la manière suivante :
On peut ainsi créer une loi de probabilité sur X(Ω)
| 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12
| |
| 1/36 | 2/36 | 3/36 | 4/36 | 5/36 | 6/36 | 5/36 | 4/36 | 3/36 | 2/36 | 1/36 |
Espérance, variance et écart type
La présentation de la loi de probabilité sous forme d'un tableau ressemblant au tableau des fréquences d'une série statistique quantitative discrète et la loi des grands nombres qui stipule que les deux tableaux coà¯ncident si on renouvelle un grand nombre de fois l'expérience, pousse à définir aussi pour X la moyenne, la variance et l'écart type.
La moyenne de la série statistique sera appelé espérance dans le cas d'une variable aléatoire. Ce terme provient sans doute des premières variables aléatoires créées, les gains dans des jeux de hasard. L'espérance de gain correspond alors à la moyenne des gains au cours de nombreuses parties.
Dans le cas d'une variable discrète, c'est une fonction en escalier. En effet,
Fonction de répartition
La fonction de répartition est une fontion définie sur R par F(x) = p(X < x).Lois célèbres
Outre l'équiprobabilité, on peut rencontrer aussi
Variables aléatoires à densité
Il arrive que l'univers Ω soit infini et que l'univers X(Ω) soit aussi infini. Le calcul des pX(x) pour tout x de X(Ω) n'est souvent pas suffisant pour calculer la probabilité d'un événement et il est même fréquent que ces pX(x) soient tous nuls. Il est alors nécessaire de calculer directement pX([a ; b]).
Densité de probabilité
On dit que X est une variable aléatoire de densité f si la probabilité de l'événement "a ≤ X ≤ b" vaut . Il faut évidemment que f soit une fonction intégrable sur R, il faut en outre que f soit positive et que son intégrale sur R vale 1.
On peut remarquer que p([a ; a]) = 0, donc que p(]a ; b]) = p([a ; b]) ce qui explique la liberté prise dans ce cas avec les inégalités larges ou strictes.
L'aire sous la courbe entre xi et xj représente la fréquence de la classe [xi , xj]. Or la loi des grands nombres nous dit que cette fréquence est une bonne approximation de p([xi , xj]). En multipliant les expériences et en affinant les classes, la fonction en escaliers se rapproche d'une fonction souvent continue, l'aire sous cette courbe sur l'intervalle [a ; b] est alors un bon représentant de la probabilité de l'intervalle [a ; b]. Cette fonction s'appelle la densité de probabilité de la variable X.
On prend souvent l'habitude de tracer cette densité de probabilité pour mieux visualiser la loi de probabilité associée en regardant l'aire sous la courbe entre les valeurs qui nous intéressent.
La probabilité de l'intervalle [c ; d] (inclus dans [a ; b]) est alors k(d - c) =
De la moyenne de la série statistique, on passe à l'espérance de X par la formule.
Dans le cas d'une variable à densité, c'est la primitive de f dont la limite en + ∞ est 1.
En effet
La fonction de répartition F est continue et strictement croissante, et définit une bijection de R sur [0 ; 1]. Il existe donc une valeur M telle que F(M) = 1/2. Cette valeur s'appelle la médiane de la variable aléatoire X. Elle vérifie p(X < M) = p(X > M) = 0,5.
Il est possible de définir pX(xi) pour tout i de N.
Les lois sur des variables aléatoires à valeurs dans Nles plus connues sont
De l'histogramme à la densité de probabilité
En renouvelant 10000 fois l'expérience X, on crée une série statistique continue. On peut alors ranger les différentes valeurs obtenues dans des classes de même amplitude et tracer l'histogramme des fréquences. L'aire du rectangle de base [xi, xi+1] représente la fréquence de la classe [xi, xi+1] . Cet histogramme dessine une fonction en escalier. Loi uniforme
Le cas le plus simple de loi à densité est la loi uniforme. Les valeurs de X se répartissent uniformément sur un intervalle [a ; b].
L'histogramme que l'on pourrait dessiner serait une succession de rectangles de même hauteur. La densité de probabilité est donc une fonction constante k. L'aire sous la courbe sur l'intervalle [a ; b] vaut alors k(b - a). Or cette aire doit valoir 1, donc k = 1/(b-a).Autres lois
On rencontre aussi
Espérance, variance et écart type
La méthode d'approximation d'une intégrale par la méthode des rectangles conduit à définir l'espérance et la variance comme des intégrales issues du passage à la limite des sommes définissant moyenne et variance dans le cas d'une variable statistique continue.
La variance s'écrit alors, par analogie avec la formule de la variance avec fréquences:
L'écart type reste toujours la racine carrée de la variance : .Fonction de répartition
La fonction de répartition est une fonction définie sur R par F(x) = p(X < x).Médiane
Cas des variables aléatoires dont les valeurs sont infinies mais dénombrables
Ce cas sort du cadre des mathématiques élémentaires mais mérite cependant d'être évoqué.
Ces variables font le lien entre les variables discrètes prenant n valeurs, n grand, et les variables continues.Voir aussi