13.8: Prática do capítulo
- Page ID
- 186912
13.1 O coeficiente de correlação r
1.
Para ter um coeficiente de correlação entre características\(A\) e\(B\), é necessário ter:
- um grupo de sujeitos, alguns dos quais possuem características de traço\(A\), o restante possuindo características de traço\(B\)
- medidas de traço\(A\) em um grupo de sujeitos e de traço\(B\) em outro grupo
- dois grupos de sujeitos, um que pode ser classificado como\(A\) ou não\(A\), o outro como\(B\) ou não\(B\)
- dois grupos de sujeitos, um que pode ser classificado como\(A\) ou não\(A\), o outro como\(B\) ou não\(B\)
Defina o coeficiente de correlação e dê um exemplo exclusivo de seu uso.
3.Se a correlação entre a idade de um automóvel e o dinheiro gasto em reparos for +.90
- 81% da variação do dinheiro gasto em reparos é explicada pela idade do automóvel
- 81% do dinheiro gasto em reparos não é explicado pela idade do automóvel
- 90% do dinheiro gasto em reparos é explicado pela idade do automóvel
- nenhuma das opções acima
Suponha que a média de notas da faculdade e a parte verbal de um teste de QI tenham uma correlação de 0,40. Qual porcentagem da variação esses dois têm em comum?
5.Verdadeiro ou falso? Se for falso, explique o porquê: O coeficiente de determinação pode ter valores entre -1 e +1.
6.Verdadeiro ou falso: Sempre que r é calculado com base em uma amostra, o valor que obtemos para r é apenas uma estimativa do verdadeiro coeficiente de correlação que obteríamos se o calculássemos para toda a população.
7.Sob um “diagrama de dispersão”, há uma notação de que o coeficiente de correlação é 0,10. O que isso significa?
- mais e menos 10% das médias incluem cerca de 68% dos casos
- um décimo da variância de uma variável é compartilhado com a outra variável
- um décimo de uma variável é causado pela outra variável
- em uma escala de -1 a +1, o grau de relação linear entre as duas variáveis é +0,10
Sabe-se que o coeficiente de correlação para\(X\) e\(Y\) é zero. Em seguida, podemos concluir que:
- X e\(Y\) têm distribuições padrão
- as variâncias de\(X\) e\(Y\) são iguais
- não existe relação entre\(X\) e Y
- não existe relação linear entre\(X\) e Y
- nenhum desses
Qual você acha que seria o valor do coeficiente de correlação para o par de variáveis: “número de horas-homem trabalhadas” e “número de unidades de trabalho concluídas”?
- Aproximadamente 0.9
- Aproximadamente 0.4
- Aproximadamente 0.0
- Aproximadamente -0,4
- Aproximadamente -0,9
Em um determinado grupo, a correlação entre a altura medida em pés e o peso medido em libras é de +.68. Qual das seguintes opções alteraria o valor de r?
13.2 Testando a significância do coeficiente de correlação
11.
Defina um\(t\) teste de um coeficiente de regressão e dê um exemplo exclusivo de seu uso.
12.A correlação entre as pontuações em um teste de neuroticismo e as pontuações em um teste de ansiedade é alta e positiva; portanto
13.3 Equações lineares
13.
Verdadeiro ou falso? Se for falso, corrija-o: suponha que um intervalo de confiança\(\beta\) de 95% para a inclinação da regressão em linha reta de\(Y\) on\(X\) seja dado por\(-3.5 < \beta < -0.5\). Então, um teste bilateral da hipótese\(H_{0} : \beta=-1\) resultaria na rejeição do\(H_0\) nível de significância de 1%.
14.Verdadeiro ou falso: É mais seguro interpretar os coeficientes de correlação como medidas de associação em vez de causalidade devido à possibilidade de correlação espúria.
15.Estamos interessados em encontrar a relação linear entre o número de widgets comprados de uma vez e o custo por widget. Os seguintes dados foram obtidos:
\(X\): Número de widgets comprados — 1, 3, 6, 10, 15
\(Y\): Custo por widget (em dólares) — 55, 52, 46, 32, 25
Suponha que a linha de regressão seja\(\hat{y}=-2.5 x+60\). Calculamos o preço médio por widget se 30 forem comprados e observamos qual das seguintes opções?
- \(\hat{y}=15 \text { dollars }\); obviamente, estamos enganados; a previsão\(\hat y\) é na verdade +15 dólares.
- \(\hat{y}=15 \text { dollars }\), o que parece razoável a julgar pelos dados.
- \ (\ hat {y} =-15\ text {dollars}\, o que é um absurdo óbvio. A linha de regressão deve estar incorreta.
- \(\hat{y}=-15 \text { dollars }\), o que é um absurdo óbvio. Isso nos lembra que prever\(Y\) fora da faixa de\(X\) valores em nossos dados é uma prática muito ruim.
Discuta brevemente a distinção entre correlação e causalidade.
17.Verdadeiro ou falso: Se\(r\) estiver próximo de + ou -1, diremos que há uma forte correlação, com o entendimento tácito de que estamos nos referindo a uma relação linear e nada mais.
13.4 A equação de regressão
18.
Suponha que você tenha à sua disposição as informações abaixo para cada um dos 30 motoristas. Proponha um modelo (incluindo uma indicação muito breve dos símbolos usados para representar variáveis independentes) para explicar como as milhas por galão variam de motorista para motorista com base nos fatores medidos.
Informações:
- milhas percorridas por dia
- peso do carro
- número de cilindros no carro
- velocidade média
- milhas por galão
- número de passageiros
Considere uma amostra de análise de regressão de mínimos quadrados entre uma variável dependente (\(Y\)) e uma variável independente (\(X\)). Um coeficiente de correlação amostral de −1 (menos um) nos diz que
- não há relação entre\(Y\) e\(X\) na amostra
- não há relação entre\(Y\) e\(X\) na população
- existe uma relação negativa perfeita entre\(Y\) e\(X\) na população
- há uma relação negativa perfeita entre\(Y\) e\(X\) na amostra.
Na análise correlacional, quando os pontos se espalham amplamente pela linha de regressão, isso significa que a correlação é
13.5 Interpretação dos coeficientes de regressão: elasticidade e transformação logarítmica
21.
Em uma regressão linear, por que precisamos nos preocupar com o alcance da variável independente (\(X\))?
22.Suponha que alguém tenha coletado as seguintes informações onde\(X\) é o diâmetro do tronco da árvore e\(Y\) a altura da árvore.
\ (\ PageIndex {3}\) “>X | Y |
4 | 8 |
2 | 4 |
8 | 18 |
6 | 22 |
10 | 30 |
6 | 8 |
Equação de regressão:\(\hat{y}_{i}=-3.6+3.1 \cdot X_{i}\)
Qual é a sua estimativa da altura média de todas as árvores com um diâmetro de tronco de 7 polegadas?
23.Os fabricantes de um produto químico usado em coleiras contra pulgas afirmam que, sob condições de teste padrão, cada unidade adicional do produto químico resultará em uma redução de 5 pulgas (ou seja, onde\(X_{j}=\text { amount of chemical }\) e\(Y_{J}=B_{0}+B_{1} \cdot X_{J}+E_{J}\),\(H_0:B_1=−5\)
Suponha que um teste tenha sido realizado e os resultados de um computador incluam:
Interceptar = 60
Inclinação = −4
Erro padrão do coeficiente de regressão = 1,0
Graus de liberdade para erro = 2000
Intervalo de confiança de 95% para a inclinação −2,04, −5,96
Essa evidência é consistente com a alegação de que o número de pulgas é reduzido a uma taxa de 5 pulgas por unidade química?
13.6 Prevendo com uma equação de regressão
24.
Verdadeiro ou falso? Se for Falso, corrija-o: suponha que você esteja realizando uma regressão linear simples de\(Y\) on\(X\) e teste a hipótese de que a inclinação\(\beta\) é zero em relação a uma alternativa bilateral. Você tem\(n=25\) observações e sua estatística computadorizada de teste (\(t\)) é 2,6. Então, seu valor P é dado por\(.01 < P < .02\), o que dá um significado limítrofe (ou seja, você rejeitaria\(H_0\) em\(\alpha=.02\), mas não rejeitaria\(H_0\) em\(\alpha=.01\)).
25.Um economista está interessado na possível influência do “Trigo Milagroso” no rendimento médio do trigo em um distrito. Para fazer isso, ele ajusta uma regressão linear do rendimento médio por ano em relação ao ano após a introdução do “Trigo Milagroso” por um período de dez anos.
A linha de tendência ajustada é
\(\hat{y}_{j}=80+1.5 \cdot X_{j}\)
(\(Y_j\): Rendimento médio no\(j\) ano após a introdução)
(\(X_j\):\(j\) ano após a introdução).
- Qual é o rendimento médio estimado para o quarto ano após a introdução?
- Você quer usar essa linha de tendência para estimar o rendimento por, digamos, 20 anos após a introdução? Por quê? Qual seria sua estimativa?
Uma interpretação de\(r=0.5\) é que a seguinte parte da\(Y\) variação -está associada a qual variação em\(X\):
27.Qual dos seguintes valores de\(r\) indica a previsão mais precisa de uma variável a partir de outra?
- \(r=1.18\)
- \(r=−.77\)
- \(r=.68\)
13.7 Como usar o Microsoft Excel® para análise de regressão
28.
Um programa de computador para regressão múltipla foi usado para ajustar\(\hat{y}_{j}=b_{0}+b_{1} \cdot X_{1 j}+b_{2} \cdot X_{2 j}+b_{3} \cdot X_{3 j}\).
Parte da saída do computador inclui:
\ (\ PageIndex {4}\) “>eu | \(b_i\) | \(S_{b_i}\) |
0 | 8 | 1.6 |
1 | 2.2 | 2.4 |
2 | -.72 | 3.2 |
3 | 0,005 | 0,002 |
- O cálculo do intervalo de confiança para\(b_2\) consiste em _______\(\pm\) (o\(t\) valor de um aluno) (_______)
- O nível de confiança desse intervalo é refletido no valor usado para _______.
- Os graus de liberdade disponíveis para estimar a variância estão diretamente relacionados ao valor usado para _______
Um investigador usou um programa de regressão múltipla em 20 pontos de dados para obter uma equação de regressão com 3 variáveis. Parte da saída do computador é:
\ (\ PageIndex {5}\) “>Variável | Coeficiente | Erro padrão de\(bf{b_i}\) |
1 | 0,45 | 0,21 |
2 | 0,80 | 0,10 |
3 | 3.10 | 0,86 |
- 0,80 é uma estimativa de ___________.
- 0,10 é uma estimativa de ___________.
- Supondo que as respostas satisfaçam a suposição de normalidade, podemos ter 95% de confiança de que o valor de\(\beta_2\) está no intervalo,\(t_{.025} \cdot \) _______ ± [_______], onde\(t_{.025}\) está o valor crítico da distribuição t do aluno com ____ graus de liberdade.