La vie

Exemple d'amorçage

Exemple d'amorçage

Le bootstrap est une technique statistique puissante. Cela est particulièrement utile lorsque la taille de l'échantillon avec lequel nous travaillons est petite. Dans des circonstances habituelles, il est impossible de traiter des échantillons de taille inférieure à 40 en supposant une distribution normale ou une distribution t. Les techniques Bootstrap fonctionnent assez bien avec des échantillons contenant moins de 40 éléments. La raison en est que l’amorçage implique un rééchantillonnage. Ces techniques ne supposent rien sur la distribution de nos données.

L'amorçage est devenu plus populaire que les ressources informatiques sont devenues plus facilement disponibles. En effet, pour que l'amorçage soit pratique, un ordinateur doit être utilisé. Nous verrons comment cela fonctionne dans l'exemple suivant d'amorçage.

Exemple

Nous commençons avec un échantillon statistique d'une population dont nous ne savons rien. Notre objectif sera un intervalle de confiance de 90% par rapport à la moyenne de l'échantillon. Bien que d'autres techniques statistiques utilisées pour déterminer les intervalles de confiance supposent que nous connaissions la moyenne ou l'écart type de notre population, le bootstrap n'exige rien d'autre que l'échantillon.

Aux fins de notre exemple, nous supposerons que l'échantillon est 1, 2, 4, 4, 10.

Échantillon Bootstrap

Nous rééchantillons maintenant avec le remplacement de notre échantillon pour former ce que nous appelons des échantillons bootstrap. Chaque échantillon de bootstrap aura une taille de cinq, tout comme notre échantillon d'origine. Étant donné que nous sélectionnons de manière aléatoire et que nous remplaçons ensuite chaque valeur, les échantillons de bootstrap peuvent être différents de l’échantillon d’origine et les uns des autres.

Pour des exemples que nous rencontrerions dans le monde réel, nous ré-échantillonnerions des centaines, voire des milliers de fois. Dans ce qui suit, nous allons voir un exemple de 20 exemples de bootstrap:

  • 2, 1, 10, 4, 2
  • 4, 10, 10, 2, 4
  • 1, 4, 1, 4, 4
  • 4, 1, 1, 4, 10
  • 4, 4, 1, 4, 2
  • 4, 10, 10, 10, 4
  • 2, 4, 4, 2, 1
  • 2, 4, 1, 10, 4
  • 1, 10, 2, 10, 10
  • 4, 1, 10, 1, 10
  • 4, 4, 4, 4, 1
  • 1, 2, 4, 4, 2
  • 4, 4, 10, 10, 2
  • 4, 2, 1, 4, 4
  • 4, 4, 4, 4, 4
  • 4, 2, 4, 1, 1
  • 4, 4, 4, 2, 4
  • 10, 4, 1, 4, 4
  • 4, 2, 1, 1, 2
  • 10, 2, 2, 1, 1

Signifier

Puisque nous utilisons bootstrapping pour calculer un intervalle de confiance pour la moyenne de la population, nous calculons maintenant les moyennes de chacun de nos échantillons bootstrap. Ces moyens, classés par ordre croissant sont: 2, 2.4, 2.6, 2.6, 2.8, 3, 3, 3.2, 3.4, 3.6, 3.8, 4, 4, 4.2, 4.6, 5.2, 6, 6, 6.6, 7.6.

Intervalle de confiance

Nous obtenons maintenant de notre liste d'échantillons bootstrap un intervalle de confiance. Puisque nous voulons un intervalle de confiance de 90%, nous utilisons les 95ème et 5ème centiles comme points de terminaison des intervalles. La raison en est que nous avons fractionné 100% - 90% = 10% en deux, de sorte que nous aurons le milieu de 90% de toutes les moyennes de l'échantillon bootstrap.

Pour notre exemple ci-dessus, nous avons un intervalle de confiance de 2,4 à 6,6.