Conseils

Plus quatre intervalles de confiance

Plus quatre intervalles de confiance

Dans les statistiques inférentielles, les intervalles de confiance pour les proportions de la population reposent sur la distribution normale standard pour déterminer les paramètres inconnus d'une population donnée à partir d'un échantillon statistique de la population. Une des raisons à cela est que, pour des tailles d’échantillon appropriées, la distribution normale standard fait un excellent travail pour estimer une distribution binomiale. Ceci est remarquable car bien que la première distribution soit continue, la seconde est discrète.

Un certain nombre de problèmes doivent être résolus lors de la construction d'intervalles de confiance pour obtenir des proportions. L'une d'elles concerne ce que l'on appelle un intervalle de confiance «plus quatre», ce qui entraîne un estimateur biaisé. Cependant, cet estimateur d'une proportion de population inconnue donne de meilleurs résultats dans certaines situations que les estimateurs non biaisés, en particulier les situations dans lesquelles il n'y a pas de succès ou d'échec dans les données.

Dans la plupart des cas, la meilleure tentative pour estimer une proportion de la population consiste à utiliser une proportion correspondante de l'échantillon. Nous supposons qu'il existe une population avec une proportion inconnue p de ses individus contenant un certain trait, alors nous formons un échantillon aléatoire simple de taille n de cette population. De ceux-ci n individus, on en compte le nombre Y qui possèdent le trait qui nous intéresse. Maintenant, nous estimons p en utilisant notre échantillon. La proportion de l'échantillon Y / n est un estimateur impartial de p.

Quand utiliser l'intervalle de confiance Plus Four

Lorsque nous utilisons un intervalle de plus quatre, nous modifions l'estimateur de p. Nous faisons cela en ajoutant quatre au nombre total d'observations, expliquant ainsi l'expression «plus quatre». Nous avons ensuite divisé ces quatre observations en deux succès hypothétiques et deux échecs, ce qui signifie que nous en ajoutons deux au nombre total de succès. le résultat final est que nous remplaçons chaque instance de Y / n avec (Y + 2)/(n + 4), et parfois cette fraction est notée parp avec un tilde au dessus.

La proportion de l'échantillon est généralement très utile pour estimer une proportion de la population. Cependant, il existe certaines situations dans lesquelles nous devons modifier légèrement notre estimateur. La pratique statistique et la théorie mathématique montrent que la modification de l’intervalle plus quatre convient pour atteindre cet objectif.

Une situation qui devrait nous amener à considérer un intervalle de plus quatre est un échantillon déséquilibré. Plusieurs fois, la proportion de la population étant si petite ou si importante, la proportion de l'échantillon est également très proche de 0 ou très proche de 1. Dans ce type de situation, nous devrions envisager un intervalle de plus quatre.

Une autre raison d'utiliser un intervalle plus quatre est si nous avons un échantillon de petite taille. Un intervalle plus quatre dans cette situation fournit une meilleure estimation pour une proportion de la population que d'utiliser l'intervalle de confiance typique pour une proportion.

Règles d'utilisation de l'intervalle de confiance Plus Four

L’intervalle de confiance de plus quatre est un moyen presque magique de calculer des statistiques inférentielles avec plus de précision. En ajoutant simplement quatre observations imaginaires à un jeu de données donné, deux succès et deux échecs, il permet de prédire avec plus de précision la proportion d’un jeu de données qui correspond aux paramètres.

Cependant, l'intervalle de confiance plus-quatre ne s'applique pas toujours à tous les problèmes. Il ne peut être utilisé que lorsque l'intervalle de confiance d'un ensemble de données est supérieur à 90% et que la taille de la population est au moins égale à 10. Toutefois, l'ensemble de données peut contenir un nombre quelconque de succès et d'échecs, bien qu'il fonctionne mieux lorsqu'il existe. sont soit des succès, soit des échecs dans les données d’une population donnée.

Gardez à l'esprit que, contrairement aux calculs des statistiques régulières, les calculs des statistiques inférentielles reposent sur un échantillonnage de données pour déterminer les résultats les plus probables au sein d'une population. Bien que l'intervalle de confiance de plus quatre corrige une marge d'erreur plus grande, il convient de prendre en compte cette marge pour obtenir l'observation statistique la plus précise possible.