Skip to main content
Global

13.0: Introdução à regressão linear e correlação

  • Page ID
    186933
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Esta é uma foto da oficina de um mecânico de automóveis. Há três caminhões dos Serviços Postais dos Estados Unidos sendo atendidos e um não está sendo reparado.
    Figura 13.1 A regressão linear e a correlação podem ajudá-lo a determinar se o salário de um mecânico de automóveis está relacionado à sua experiência profissional. (crédito: Joshua Rothhaas)

    Os profissionais geralmente querem saber como duas ou mais variáveis numéricas estão relacionadas. Por exemplo, existe uma relação entre a nota do segundo exame de matemática que um aluno faz e a nota no exame final? Se existe um relacionamento, qual é o relacionamento e quão forte é?

    Em outro exemplo, sua renda pode ser determinada por sua educação, sua profissão, seus anos de experiência e sua habilidade, ou seu sexo ou cor. O valor que você paga a um reparador pela mão de obra geralmente é determinado por um valor inicial mais uma taxa por hora.

    Esses exemplos podem ou não estar vinculados a um modelo, o que significa que alguma teoria sugere que existe um relacionamento. Essa ligação entre uma causa e um efeito, muitas vezes chamada de modelo, é a base do método científico e é a base de como determinamos o que acreditamos sobre como o mundo funciona. Começar com uma teoria e desenvolver um modelo da relação teórica deve resultar em uma previsão, o que chamamos de hipótese anteriormente. Agora, a hipótese diz respeito a um conjunto completo de relacionamentos. Como exemplo, em Economia, o modelo de escolha do consumidor é baseado em suposições sobre o comportamento humano: desejo de maximizar algo chamado utilidade, conhecimento sobre os benefícios de um produto sobre outro, gostos e desgostos, geralmente chamados de preferências, e assim por diante. Eles se combinaram para nos dar a curva de demanda. A partir disso, temos a previsão de que, à medida que os preços aumentarem, a quantidade exigida cairá. A economia tem modelos sobre a relação entre os preços cobrados pelos bens e a estrutura de mercado na qual a empresa opera, monopólio versus concorrência, por exemplo. Modelos de quem teria maior probabilidade de ser escolhido para uma posição de treinamento no trabalho, os impactos das mudanças políticas do Federal Reserve e o crescimento da economia e assim por diante.

    Os modelos não são exclusivos da economia, mesmo nas ciências sociais. Na ciência política, por exemplo, existem modelos que preveem o comportamento dos burocratas a várias mudanças nas circunstâncias com base em suposições dos objetivos dos burocratas. Existem modelos de comportamento político que lidam com a tomada de decisões estratégicas tanto para relações internacionais quanto para políticas domésticas.

    As chamadas ciências duras são, obviamente, a fonte do método científico, pois tentaram, ao longo dos séculos, explicar o mundo confuso ao nosso redor. Alguns dos primeiros modelos de hoje nos fazem rir; geração espontânea de vida, por exemplo. Esses primeiros modelos são vistos hoje como não muito mais do que os mitos fundamentais que desenvolvemos para nos ajudar a trazer algum senso de ordem ao que parecia um caos.

    A base de toda construção de modelos talvez seja a afirmação arrogante de que sabemos o que causou o resultado que vemos. Isso está incorporado na simples declaração matemática da forma funcional de que\(y = f(x)\). A resposta,\(Y\), é causada pelo estímulo,\(X\). Cada modelo acabará por chegar a esse ponto final e será aqui que a teoria viverá ou morrerá. Os dados apoiarão essa hipótese? Se sim, tudo bem, acreditaremos nesta versão do mundo até que uma teoria melhor venha substituí-la. Esse é o processo pelo qual passamos da terra plana para a terra redonda, do sistema solar central da Terra para o sistema solar central do sol, e assim por diante.

    O método científico não confirma uma teoria para sempre: ele não prova a “verdade”. Todas as teorias estão sujeitas a revisão e podem ser anuladas. Essas são lições que aprendemos quando desenvolvemos pela primeira vez o conceito do teste de hipóteses no início deste livro. Aqui, ao começarmos esta seção, esses conceitos merecem revisão porque a ferramenta que desenvolveremos aqui é a base do método científico e os riscos são maiores. Teorias completas aumentarão ou diminuirão por causa dessa ferramenta estatística; a regressão e as versões mais avançadas chamam de econometria.

    Neste capítulo, começaremos com a correlação, a investigação das relações entre variáveis que podem ou não ser baseadas em um modelo de causa e efeito. As variáveis simplesmente se movem na mesma direção ou na direção oposta. Ou seja, eles não se movem aleatoriamente. A correlação fornece uma medida do grau em que isso é verdade. A partir daí, desenvolvemos uma ferramenta para medir as relações de causa e efeito; análise de regressão. Poderemos formular modelos e testes para determinar se eles são estatisticamente sólidos. Se forem encontrados assim, podemos usá-los para fazer previsões: se, por uma questão de política, mudássemos o valor dessa variável, o que aconteceria com essa outra variável? Se impuséssemos um imposto sobre a gasolina de 50 centavos por galão, como isso afetaria as emissões de carbono, as vendas de Hummers/Hybrids, o uso de transporte coletivo, etc.? A capacidade de fornecer respostas a esses tipos de perguntas é o valor da regressão como uma ferramenta para nos ajudar a entender nosso mundo e tomar decisões políticas ponderadas.