Skip to main content
Global

12: Regressão linear e correlação

  • Page ID
    190008
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    A análise de regressão é um processo estatístico para estimar as relações entre variáveis e inclui muitas técnicas para modelar e analisar várias variáveis. Quando o foco está na relação entre uma variável dependente e uma ou mais variáveis independentes.

    • 12.1: Prelúdio para regressão linear e correlação
      Neste capítulo, você estudará a forma mais simples de regressão, “regressão linear” com uma variável independente (x). Isso envolve dados que se ajustam a uma linha em duas dimensões. Você também estudará a correlação que mede o quão forte é o relacionamento.
    • 12.2: Equações lineares
      A regressão linear para duas variáveis é baseada em uma equação linear com uma variável independente. A equação tem a forma: y=a+bx onde a e b são números constantes. A variável x é a variável independente e y é a variável dependente. Normalmente, você escolhe um valor para substituir a variável independente e, em seguida, resolver a variável dependente.
    • 12.3: Gráficos de dispersão
      Um gráfico de dispersão mostra a direção de uma relação entre as variáveis. Uma direção clara acontece quando há: valores altos de uma variável ocorrendo com valores altos da outra variável ou valores baixos de uma variável ocorrendo com valores baixos da outra variável. Valores altos de uma variável ocorrendo com valores baixos da outra variável.
    • 12.4: A equação de regressão
      Uma linha de regressão, ou uma linha de melhor ajuste, pode ser desenhada em um gráfico de dispersão e usada para prever resultados para as variáveis x e y em um determinado conjunto de dados ou dados de amostra. Há várias maneiras de encontrar uma linha de regressão, mas geralmente a linha de regressão de mínimos quadrados é usada porque ela cria uma linha uniforme. Os resíduos medem a distância do valor real de y e o valor estimado de y. A Soma dos Erros Quadrados, quando definida como seu mínimo, calcula os pontos na linha de melhor ajuste.
    • 12.5: Testando a significância do coeficiente de correlação
      O coeficiente de correlação nos informa sobre a força e a direção da relação linear entre x e y. No entanto, a confiabilidade do modelo linear também depende da quantidade de pontos de dados observados na amostra. Precisamos examinar o valor do coeficiente de correlação r e o tamanho da amostra n e realizar um teste de hipótese da “significância do coeficiente de correlação” para decidir se a relação linear nos dados da amostra é forte o suficiente para ser usada no modelo linear.
    • 12.6: Predição
      Depois de determinar a presença de um forte coeficiente de correlação e calcular a linha de melhor ajuste, você pode usar a linha de regressão de mínimos quadrados para fazer previsões sobre seus dados. O processo de predição dentro dos valores de x observados nos dados é chamado de interpolação. O processo de previsão fora dos valores de x observados nos dados é chamado de extrapolação.
    • 12.7: Outliers
      Em alguns conjuntos de dados, existem valores (pontos de dados observados) chamados outliers. Os valores atípicos são pontos de dados observados que estão longe da linha dos mínimos quadrados. Eles têm grandes “erros”, onde o “erro” ou resíduo é a distância vertical da linha até o ponto.
    • 12.8: Regressão - Distância da Escola (Planilha)
      Uma planilha de estatísticas: O aluno calculará e construirá a linha de melhor ajuste entre duas variáveis. O aluno avaliará a relação entre duas variáveis para determinar se essa relação é significativa.
    • 12.9: Regressão - Custo do livro didático (planilha)
      Uma planilha de estatísticas: O aluno calculará e construirá a linha de melhor ajuste entre duas variáveis. O aluno avaliará a relação entre duas variáveis para determinar se essa relação é significativa.
    • 12.10: Regressão - Eficiência de combustível (Planilha)
      Uma planilha de estatísticas: O aluno calculará e construirá a linha de melhor ajuste entre duas variáveis. O aluno avaliará a relação entre duas variáveis para determinar se essa relação é significativa.
    • 12.E: Regressão linear e correlação (exercícios)
      Estes são exercícios de lição de casa para acompanhar o mapa de texto criado para “Estatísticas introdutórias” pela OpenStax.