Avis

Exemples d'intervalles de confiance pour les moyens

Exemples d'intervalles de confiance pour les moyens

L'une des principales composantes des statistiques inférentielles est la mise au point de méthodes de calcul des intervalles de confiance. Les intervalles de confiance nous permettent d'estimer un paramètre de population. Plutôt que de dire que le paramètre est égal à une valeur exacte, on dit que le paramètre se situe dans une plage de valeurs. Cette plage de valeurs est généralement une estimation, avec une marge d'erreur que nous additionnons et soustrayons de l'estimation.

Attaché à chaque intervalle est un niveau de confiance. Le niveau de confiance donne une mesure de la fréquence à laquelle, à long terme, la méthode utilisée pour obtenir notre intervalle de confiance capture le paramètre de population réel.

Lors de l’étude des statistiques, il est utile de voir quelques exemples élaborés. Nous examinerons ci-dessous plusieurs exemples d'intervalles de confiance relatifs à la moyenne d'une population. Nous verrons que la méthode que nous utilisons pour construire un intervalle de confiance autour d'une moyenne dépend d'informations supplémentaires sur notre population. Plus précisément, notre approche dépend de la connaissance ou non de l'écart type de la population.

Déclaration de problèmes

Nous commençons avec un échantillon aléatoire simple de 25 espèces particulières de tritons et mesurons leur queue. La longueur moyenne de la queue de notre échantillon est de 5 cm.

  1. Si nous savons que 0,2 cm est l'écart type de la longueur de la queue de tous les tritons de la population, alors quel est un intervalle de confiance de 90% pour la longueur de la queue moyenne de tous les tritons de la population?
  2. Si nous savons que l’écart-type de 0,2 cm est la longueur de la queue de tous les tritons de la population, quel est alors un intervalle de confiance de 95% de la longueur de la queue moyenne de tous les tritons de la population?
  3. Si nous trouvons que 0,2 cm est l'écart type des longueurs de queue des tritons de notre population, alors quel est un intervalle de confiance de 90% pour la longueur de queue moyenne de tous les tritons de la population?
  4. Si nous trouvons que 0,2 cm est l'écart type des longueurs de queue des tritons de notre population, alors quel est l'intervalle de confiance de 95% pour la longueur de queue moyenne de tous les tritons de la population?

Discussion des problèmes

Nous commençons par analyser chacun de ces problèmes. Dans les deux premiers problèmes, nous connaissons la valeur de l'écart type de la population. La différence entre ces deux problèmes est que le niveau de confiance est plus élevé dans le n ° 2 que dans le n ° 1.

Dans les deux autres problèmes, l’écart type de la population est inconnu. Pour ces deux problèmes, nous allons estimer ce paramètre avec l’écart type de l’échantillon. Comme nous l'avons vu dans les deux premiers problèmes, nous avons également des niveaux de confiance différents.

Solutions

Nous allons calculer des solutions pour chacun des problèmes ci-dessus.

  1. Puisque nous connaissons l’écart type de la population, nous utiliserons un tableau de z-scores. La valeur de z qui correspond à un intervalle de confiance de 90% est de 1,645. En utilisant la formule de la marge d'erreur, nous avons un intervalle de confiance de 5 - 1,645 (0,2 / 5) à 5 + 1,645 (0,2 / 5). (Le 5 dans le dénominateur est parce que nous avons pris la racine carrée de 25). Après avoir effectué l’arithmétique, nous avons un intervalle de confiance de 4,934 cm à 5,066 cm pour la moyenne de la population.
  2. Puisque nous connaissons l’écart type de la population, nous utiliserons un tableau de z-scores. La valeur de z qui correspond à un intervalle de confiance de 95% est de 1,96. En utilisant la formule de la marge d'erreur, nous avons un intervalle de confiance de 5 - 1,96 (0,2 / 5) à 5 + 1,96 (0,2 / 5). Après avoir effectué l’arithmétique, nous avons un intervalle de confiance de 4,922 cm à 5,078 cm pour la moyenne de la population.
  3. Ici, nous ne connaissons pas l’écart-type de la population, mais seulement l’écart-type de l’échantillon. Nous allons donc utiliser un tableau de t-scores. Quand on utilise une table de t scores, nous devons savoir combien de degrés de liberté nous avons. Dans ce cas, il y a 24 degrés de liberté, ce qui est un moins que la taille de l'échantillon de 25. La valeur de t qui correspond à un intervalle de confiance de 90% est 1,71. En utilisant la formule de la marge d'erreur, nous avons un intervalle de confiance de 5 - 1,71 (0,2 / 5) à 5 + 1,71 (0,2 / 5). Après avoir effectué l’arithmétique, nous avons un intervalle de confiance de 4,932 cm à 5,068 cm pour la moyenne de la population.
  4. Ici, nous ne connaissons pas l’écart-type de la population, mais seulement l’écart-type de l’échantillon. Nous allons donc utiliser à nouveau un tableau de t-scores. Il y a 24 degrés de liberté, soit un de moins que la taille de l'échantillon de 25. La valeur de t cela correspond à un intervalle de confiance de 95% = 2,06. En utilisant la formule de la marge d'erreur, nous avons un intervalle de confiance de 5 - 2,06 (0,2 / 5) à 5 + 2,06 (0,2 / 5). Après avoir effectué l'arithmétique, nous avons un intervalle de confiance de 4,912 cm à 5,082 cm pour la moyenne de la population.

Discussion des solutions

Il y a quelques points à noter en comparant ces solutions. La première est que, chaque fois que notre niveau de confiance augmente, plus la valeur de z ou t que nous avons fini avec. La raison en est que, pour être plus sûrs d'avoir bien capturé la moyenne de la population dans notre intervalle de confiance, nous avons besoin d'un intervalle plus long.

L’autre caractéristique à noter est que, pour un intervalle de confiance particulier, ceux qui utilisent t sont plus larges que ceux avec z. La raison en est qu'un t la distribution a une plus grande variabilité dans ses queues qu'une distribution normale standard.

La solution pour résoudre ce type de problèmes est que si nous connaissons l’écart type de la population, nous utilisons un tableau de zscores. Si nous ne connaissons pas l’écart type de la population, nous utilisons un tableau des t scores.