12.1: Teste de duas variâncias
- Page ID
- 186543
Este capítulo apresenta uma nova função de densidade de probabilidade, a\(F\) distribuição. Essa distribuição é usada para muitas aplicações, incluindo ANOVA, e para testar a igualdade em vários meios. Começamos com a\(F\) distribuição e o teste da hipótese de diferenças nas variâncias. Muitas vezes, é desejável comparar duas variâncias em vez de duas médias. Por exemplo, os administradores universitários gostariam que dois professores universitários avaliando os exames tivessem a mesma variação em suas notas. Para que uma tampa caiba em um recipiente, a variação na tampa e no recipiente deve ser aproximadamente a mesma. Um supermercado pode estar interessado na variabilidade dos horários de check-out de dois damas. Em finanças, a variância é uma medida de risco e, portanto, uma pergunta interessante seria testar a hipótese de que duas carteiras de investimento diferentes têm a mesma variância, a volatilidade.
Para realizar um\(F\) teste de duas variâncias, é importante que o seguinte seja verdadeiro:
- As populações das quais as duas amostras são retiradas são distribuídas aproximadamente normalmente.
- As duas populações são independentes uma da outra.
Diferente da maioria dos outros testes de hipóteses deste livro, o\(F\) teste de igualdade de duas variâncias é muito sensível a desvios da normalidade. Se as duas distribuições não forem normais ou próximas, o teste poderá fornecer um resultado tendencioso para a estatística de teste.
Suponha que façamos amostras aleatoriamente de duas populações normais independentes. \(\sigma_1^2\)\(\sigma_2^2\)Sejam as variâncias populacionais desconhecidas\(s_1^2\) e\(s_2^2\) sejam as variâncias da amostra. Deixe que os tamanhos das amostras sejam\(n_1\)\(n_2\) e. Como estamos interessados em comparar as duas variâncias da amostra, usamos a\(F\) razão:
\(F=\frac{\left[\frac{s_{1}^{2}}{\sigma_{1}^{2}}\right]}{\left[\frac{s_{2}^{2}}{\sigma_{2}^{2}}\right]}\)
\(F\)tem a distribuição\(F \sim F\left(n_{1}-1, n_{2}-1\right)\)
onde\(n_1 – 1\) estão os graus de liberdade para o numerador e\(n_2 – 1\) são os graus de liberdade para o denominador.
Se a hipótese nula for\(\sigma_{1}^{2}=\sigma_{2}^{2}\), então a\(F\) Razão, estatística de teste, se torna\(F_{c}=\frac{\left[\frac{s_{1}^{2}}{\sigma_{1}^{2}}\right]}{\left[\frac{s_{2}^{2}}{\sigma_{2}^{2}}\right]}=\frac{s_{1}^{2}}{s_{2}^{2}}\)
As várias formas das hipóteses testadas são:
Teste bicaudal | Teste unicaudal | Teste unicaudal |
---|---|---|
\(\mathrm{H}_{0} : \sigma_{1}^{2}=\sigma_{2}^{2}\) | \(\mathrm{H}_{0} : \sigma_{1}^{2} \leq \sigma_{2}^{2}\) | \(\mathrm{H}_{0} : \sigma_{1}^{2} \geq \sigma_{2}^{2}\) |
\(\mathrm{H}_{1} : \sigma_{1}^{2} \neq \sigma_{2}^{2}\) | \(\mathrm{H}_{1} : \sigma_{1}^{2}>\sigma_{2}^{2}\) | \(\mathrm{H}_{1} : \sigma_{1}^{2}<\sigma_{2}^{2}\) |
Uma forma mais geral da hipótese nula e alternativa para um teste bicaudal seria:
\[H_{0} : \frac{\sigma_{1}^{2}}{\sigma_{2}^{2}}=\delta_{0}\nonumber\]
\[H_{a} : \frac{\sigma_{1}^{2}}{\sigma_{2}^{2}} \neq \delta_{0}\nonumber\]
Onde\(\delta_{0}=1\), se for um teste simples da hipótese de que as duas variâncias são iguais. Essa forma da hipótese tem o benefício de permitir testes que são mais do que para diferenças simples e pode acomodar testes para diferenças específicas, como fizemos para diferenças em médias e diferenças em proporções. Essa forma da hipótese também mostra a relação entre a\(F\) distribuição e\(\chi^2\): a\(F\) é uma razão de duas distribuições de qui-quadrado, uma distribuição que vimos no último capítulo. Isso é útil para determinar os graus de liberdade da\(F\) distribuição resultante.
Se as duas populações tiverem variâncias iguais, então\(s_1^2\) e\(s_2^2\) tiverem um valor próximo e a estatística de teste\(F_{c}=\frac{s_{1}^{2}}{s_{2}^{2}}\) for próxima de um. Mas se as duas variações populacionais forem muito diferentes\(s_1^2\) e também\(s_2^2\) tendem a ser muito diferentes. Escolher\(s_1^2\) como a maior variância da amostra faz com que\(\frac{s_{1}^{2}}{s_{2}^{2}}\) a proporção seja maior do que um. Se\(s_1^2\) e\(s_2^2\) estiverem distantes, então\(F_{c}=\frac{s_{1}^{2}}{s_{2}^{2}}\) é um número grande.
Portanto, se\(F\) estiver próximo de um, a evidência favorece a hipótese nula (as duas variâncias da população são iguais). Mas se\(F\) for muito maior do que um, então a evidência é contra a hipótese nula. Em essência, estamos perguntando se a estatística F calculada, estatística de teste, é significativamente diferente de uma.
Para determinar os pontos críticos, precisamos encontrar\(F_{\alpha,df1,df2}\). Consulte o Apêndice A para ver a\(F\) tabela. Essa\(F\) tabela tem valores para vários níveis de significância de 0,1 a 0,001 designados como “p” na primeira coluna. Para encontrar o valor crítico, escolha o nível de significância desejado e siga para baixo e para frente para encontrar o valor crítico na interseção dos dois diferentes graus de liberdade. A\(F\) distribuição tem dois graus diferentes de liberdade, um associado ao numerador e outro associado ao denominador\(_{df1}\),\(_{df2}\) e para complicar as coisas, a\(F\) distribuição não é simétrica e altera o grau de distorção à medida que os graus de liberdade mudam. Os graus de liberdade no numerador são\(n_1-1\), onde\(n_1\) está o tamanho da amostra para o grupo 1, e os graus de liberdade no denominador é\(n_2-1\), onde\(n_2\) está o tamanho da amostra para o grupo 2. \(F_{\alpha,df1,df2}\)fornecerá o valor crítico na extremidade superior da\(F\) distribuição.
Para encontrar o valor crítico para a extremidade inferior da distribuição, inverta os graus de liberdade e divida o\(F\) valor -da tabela em um.
- Valor crítico da cauda superior:\(F_{\alpha,df1,df2}\)
- Valor crítico da cauda inferior:\(1/F_{\alpha,df2,df1}\)
Quando o valor calculado de\(F\) está entre os valores críticos, não na cauda, não podemos rejeitar a hipótese nula de que as duas variâncias vieram de uma população com a mesma variância. Se o valor F calculado estiver em qualquer uma das caudas, não podemos aceitar a hipótese nula, assim como fizemos em todos os testes de hipóteses anteriores.
Uma forma alternativa de encontrar os valores críticos da\(F\) distribuição facilita o uso da\(F\) tabela. Observamos na\(F\) tabela -que todos os valores de\(F\) são maiores que um, portanto, o\(F\) valor crítico para a cauda esquerda sempre será menor que um, porque para encontrar o valor crítico na cauda esquerda, dividimos um\(F\) valor no número um, conforme mostrado acima. Também observamos que se a variância da amostra no numerador da estatística de teste for maior do que a variância da amostra no denominador, o\(F\) valor resultante será maior que um. O método abreviado para este teste é, portanto, garantir que a maior das duas variâncias da amostra seja colocada no numerador para calcular a estatística de teste. Isso significa que somente o valor crítico da cauda direita deverá ser encontrado na\(F\) tabela.
Exemplo 12.1
Dois instrutores universitários estão interessados em saber se há ou não alguma variação na forma como avaliam os exames de matemática. Cada um deles avalia o mesmo conjunto de 10 exames. As notas do primeiro instrutor têm uma variação de 52,3. As notas do segundo instrutor têm uma variação de 89,9. Teste a afirmação de que a variação do primeiro instrutor é menor. (Na maioria das faculdades, é desejável que as variações nas notas dos exames sejam quase as mesmas entre os instrutores.) O nível de significância é 10%.
- Resposta
-
Solução 12.1
Seja 1 e 2 as inscrições que indicam o primeiro e o segundo instrutor, respectivamente.
\(n_1 = n_2 = 10\).
\(H_{0} : \sigma_{1}^{2} \geq \sigma_{2}^{2}\)e\(H_{a} : \sigma_{1}^{2}<\sigma_{2}^{2}\)
Calcule a estatística de teste: Pela hipótese nula (\(\sigma_{1}^{2} \geq \sigma_{2}^{2}\)), a\(F\) estatística é:
\(F_{c}=\frac{s_{2}^{2}}{s_{1}^{2}}=\frac{89.9}{52.3}=1.719\)
Valor crítico para o teste:\(F_{9,9}=5.35\) onde\(n_1 – 1 = 9\)\(n_2 – 1 = 9\) e.
Tome uma decisão: como o\(F\) valor calculado não está na cauda, não podemos rejeitar\(H_0\).
Conclusão: Com um nível de significância de 10%, a partir dos dados, não há evidências suficientes para concluir que a variação nas notas do primeiro instrutor seja menor.
Exercício 12.1
A Sociedade Coral de Nova York divide cantores masculinos em quatro categorias, das vozes mais altas às mais baixas: Tenor1, Tenor2, Bass1, Bass2. Na tabela estão as alturas dos homens dos grupos Tenor1 e Bass2. Suspeita-se que homens mais altos terão vozes mais baixas e que a variação de altura também pode aumentar com as vozes mais baixas. Temos boas evidências de que a variação das alturas dos cantores em cada um desses dois grupos (Tenor1 e Bass2) é diferente?
Tenor 1 | Baixo 2 | Tenor 1 | Baixo 2 | Tenor 1 | Baixo 2 |
---|---|---|---|---|---|
69 | 72 | 67 | 72 | 68 | 67 |
72 | 75 | 70 | 74 | 67 | 70 |
71 | 67 | 65 | 70 | 64 | 70 |
66 | 75 | 72 | 66 | 69 | |
76 | 74 | 70 | 68 | 72 | |
74 | 72 | 68 | 75 | 71 | |
71 | 72 | 64 | 68 | 74 | |
66 | 74 | 73 | 70 | 75 | |
68 | 72 | 66 | 72 |