Skip to main content
Global

13.2: Testando a significância do coeficiente de correlação

  • Page ID
    186911
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    O coeficiente de correlação\(r\),, nos fala sobre a força e a direção da relação linear entre\(X_1\)\(X_2\) e.

    Os dados da amostra são usados para calcular\(r\) o coeficiente de correlação da amostra. Se tivéssemos dados para toda a população, poderíamos encontrar o coeficiente de correlação populacional. Mas como temos apenas dados de amostra, não podemos calcular o coeficiente de correlação da população. O coeficiente de correlação amostral, r, é nossa estimativa do coeficiente de correlação populacional desconhecido.

    • O teste de hipótese nos permite decidir se o valor do coeficiente de correlação populacional\ rho é “próximo de zero” ou “significativamente diferente de zero”. Decidimos isso com base no coeficiente de correlação da amostra\(r\) e no tamanho da amostra\(n\).

      Se o teste concluir que o coeficiente de correlação é significativamente diferente de zero, dizemos que o coeficiente de correlação é “significativo”.

      • O que as hipóteses significam em palavras
        • Chegando a uma conclusão Existem dois métodos para tomar a decisão sobre a hipótese. A estatística de teste para testar essa hipótese é:

          \[t_{c}=\frac{r}{\sqrt{\left(1-r^{2}\right) /(n-2)}}\nonumber\]

          \[t_{c}=\frac{r \sqrt{n-2}}{\sqrt{1-r^{2}}}\nonumber\]

          Onde a segunda fórmula é uma forma equivalente da estatística de teste,\(n\) é o tamanho da amostra e os graus de liberdade são\(n-2\). Essa é uma\(t\) estatística -e opera da mesma forma que outros\(t\) testes. Calcule o\(t\) valor -e compare-o com o valor crítico da\(t\) tabela -nos graus apropriados de liberdade e no nível de confiança que você deseja manter. Se o valor calculado estiver na cauda, não podemos aceitar a hipótese nula de que não há relação linear entre essas duas variáveis aleatórias independentes. Se o\(t\) valor calculado NÃO estiver na cauda, não poderá rejeitar a hipótese nula de que não há relação linear entre as duas variáveis.

          Uma forma abreviada rápida de testar correlações é a relação entre o tamanho da amostra e a correlação. Se:

          \[|r| \geq \frac{2}{\sqrt{n}}\nonumber\]

          então isso implica que a correlação entre as duas variáveis demonstra que existe uma relação linear e é estatisticamente significativa em aproximadamente o nível de significância de 0,05. Como a fórmula indica, há uma relação inversa entre o tamanho da amostra e a correlação necessária para a significância de uma relação linear. Com apenas 10 observações, a correlação necessária para significância é 0,6325, para 30 observações, a correlação necessária para significância diminui para 0,3651 e em 100 observações, o nível necessário é apenas 0,2000.

          As correlações podem ser úteis na visualização dos dados, mas não são usadas adequadamente para “explicar” uma relação entre duas variáveis. Talvez nenhuma estatística única seja mais mal utilizada do que o coeficiente de correlação. Citar correlações entre condições de saúde e tudo, desde o local de residência até a cor dos olhos, tem o efeito de implicar uma relação de causa e efeito. Isso simplesmente não pode ser feito com um coeficiente de correlação. O coeficiente de correlação é, obviamente, inocente dessa interpretação errônea. É dever do analista usar uma estatística projetada para testar as relações de causa e efeito e relatar somente esses resultados se ele pretende fazer tal afirmação. O problema é que passar nesse teste mais rigoroso é difícil, então “pesquisadores” preguiçosos e/ou sem escrúpulos recorrem às correlações quando não conseguem apresentar seu caso legitimamente.