Skip to main content
Global

1.1: Definições de estatística, probabilidade e termos-chave

  • Page ID
    186548
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    A ciência da estatística lida com a coleta, análise, interpretação e apresentação de dados. Nós vemos e usamos dados em nossa vida cotidiana.

    Neste curso, você aprenderá a organizar e resumir dados. Organizar e resumir dados é chamado de estatística descritiva. Duas formas de resumir dados são por meio de gráficos e usar números (por exemplo, encontrar uma média). Depois de estudar as distribuições de probabilidade e probabilidade, você usará métodos formais para tirar conclusões a partir de dados “bons”. Os métodos formais são chamados de estatísticas inferenciais. A inferência estatística usa a probabilidade para determinar o quão confiantes podemos ter de que nossas conclusões estão corretas.

    A interpretação eficaz dos dados (inferência) é baseada em bons procedimentos para produzir dados e em um exame cuidadoso dos dados. Você encontrará o que parecem ser muitas fórmulas matemáticas para interpretar dados. O objetivo das estatísticas não é realizar vários cálculos usando as fórmulas, mas obter uma compreensão dos seus dados. Os cálculos podem ser feitos usando uma calculadora ou um computador. O entendimento deve vir de você. Se você conseguir entender completamente os fundamentos das estatísticas, poderá ter mais confiança nas decisões que toma na vida.

    Probabilidade

    A probabilidade é uma ferramenta matemática usada para estudar a aleatoriedade. Ele lida com a chance (a probabilidade) de um evento ocorrer. Por exemplo, se você jogar uma moeda justa quatro vezes, os resultados podem não ser duas caras e duas coroas. No entanto, se você jogar a mesma moeda 4.000 vezes, os resultados serão próximos a meia cabeça e meia cauda. A probabilidade teórica esperada de cabeças em qualquer sorteio é de\(\frac{1}{2}\) ou 0,5. Embora os resultados de algumas repetições sejam incertos, há um padrão regular de resultados quando há muitas repetições. Depois de ler sobre o estatístico inglês Karl Pearson, que jogou uma moeda 24.000 vezes com o resultado de 12.012 cabeças, um dos autores jogou uma moeda 2.000 vezes. Os resultados foram 996 cabeças. A fração\(\frac{996}{2000}\) é igual a 0,498, que é muito próxima de 0,5, a probabilidade esperada.

    A teoria da probabilidade começou com o estudo de jogos de azar, como o pôquer. As previsões assumem a forma de probabilidades. Para prever a probabilidade de um terremoto, de chuva ou se você obterá um A neste curso, usamos probabilidades. Os médicos usam a probabilidade para determinar a chance de uma vacinação causar a doença que a vacinação deve prevenir. Um corretor da bolsa usa a probabilidade para determinar a taxa de retorno dos investimentos de um cliente. Você pode usar a probabilidade para decidir comprar um bilhete de loteria ou não. Em seu estudo de estatística, você usará o poder da matemática por meio de cálculos de probabilidade para analisar e interpretar seus dados.

    Termos-chave

    Em estatística, geralmente queremos estudar uma população. Você pode pensar em uma população como uma coleção de pessoas, coisas ou objetos em estudo. Para estudar a população, selecionamos uma amostra. A ideia da amostragem é selecionar uma porção (ou subconjunto) da população maior e estudar essa porção (a amostra) para obter informações sobre a população. Os dados são o resultado da amostragem de uma população.

    Como é preciso muito tempo e dinheiro para examinar uma população inteira, a amostragem é uma técnica muito prática. Se você quiser calcular a média geral de notas em sua escola, faria sentido selecionar uma amostra de alunos que frequentam a escola. Os dados coletados da amostra seriam as médias de notas dos alunos. Nas eleições presidenciais, amostras de pesquisas de opinião de 1.000 a 2.000 pessoas são coletadas. A pesquisa de opinião deve representar as opiniões das pessoas em todo o país. Os fabricantes de bebidas carbonatadas enlatadas coletam amostras para determinar se uma lata de 16 onças contém 16 onças de bebida carbonatada.

    A partir dos dados da amostra, podemos calcular uma estatística. Uma estatística é um número que representa uma propriedade da amostra. Por exemplo, se considerarmos uma aula de matemática como uma amostra da população de todas as aulas de matemática, o número médio de pontos ganhos pelos alunos nessa aula de matemática no final do período é um exemplo de estatística. A estatística é uma estimativa de um parâmetro da população, neste caso, a média. Um parâmetro é uma característica numérica de toda a população que pode ser estimada por uma estatística. Como consideramos todas as aulas de matemática como sendo a população, o número médio de pontos ganhos por aluno em todas as aulas de matemática é um exemplo de parâmetro.

    Uma das principais preocupações no campo da estatística é a precisão com que uma estatística estima um parâmetro. A precisão realmente depende de quão bem a amostra representa a população. A amostra deve conter as características da população para ser uma amostra representativa. Estamos interessados na estatística da amostra e no parâmetro da população em estatísticas inferenciais. Em um capítulo posterior, usaremos a estatística da amostra para testar a validade do parâmetro populacional estabelecido.

    Uma variável, ou variável aleatória, geralmente notada por letras maiúsculas, como\(X\) e\(Y\), é uma característica ou medida que pode ser determinada para cada membro de uma população. As variáveis podem ser numéricas ou categóricas. As variáveis numéricas assumem valores com unidades iguais, como peso em libras e tempo em horas. As variáveis categóricas colocam a pessoa ou coisa em uma categoria. Se deixarmos\(X\) igualar o número de pontos ganhos por um estudante de matemática no final de um período, então\(X\) é uma variável numérica. Se deixarmos\(Y\) ser a filiação partidária de uma pessoa, alguns exemplos\(Y\) incluem republicano, democrata e independente. \(Y\)é uma variável categórica. Poderíamos fazer algumas contas com valores de\(X\) (calcular o número médio de pontos ganhos, por exemplo), mas não faz sentido fazer cálculos com valores de\(Y\) (calcular uma afiliação partidária média não faz sentido).

    Os dados são os valores reais da variável. Podem ser números ou palavras. Datum é um valor único.

    Duas palavras que aparecem com frequência nas estatísticas são média e proporção. Se você fizesse três exames em suas aulas de matemática e obtivesse notas de 86, 75 e 92, calcularia sua pontuação média somando as três notas dos exames e dividindo por três (sua pontuação média seria de 84,3 com uma casa decimal). Se, na sua aula de matemática, há 40 alunos e 22 são homens e 18 são mulheres, então a proporção de estudantes do sexo masculino é\(\frac{22}{40}\) e a proporção de estudantes do sexo feminino é\(\frac{18}{40}\). A média e a proporção são discutidas com mais detalhes nos capítulos posteriores.

    NOTA

    As palavras "significa" e "média" são frequentemente usadas de forma intercambiável. A substituição de uma palavra pela outra é uma prática comum. O termo técnico é “média aritmética” e “média” é tecnicamente uma localização central. No entanto, na prática entre não estatísticos, “média” é comumente aceita como “média aritmética”.

    Exemplo 1.1

    Determine a que os termos-chave se referem no estudo a seguir. Queremos saber a quantia média (média) de dinheiro que os estudantes universitários do primeiro ano gastam no ABC College em material escolar que não inclui livros. Entrevistamos aleatoriamente 100 alunos do primeiro ano da faculdade. Três desses estudantes gastaram $150, $200 e $225, respectivamente.

    Resposta

    Solução 1.1

    A população é composta por todos os estudantes do primeiro ano que frequentam o ABC College neste semestre.

    A amostra pode ser de todos os alunos matriculados em uma seção de um curso inicial de estatística no ABC College (embora essa amostra possa não representar toda a população).

    O parâmetro é a quantidade média (média) de dinheiro gasto (excluindo livros) por estudantes universitários do primeiro ano do ABC College neste período: a média da população.

    A estatística é a quantia média (média) de dinheiro gasta (excluindo livros) pelos estudantes universitários do primeiro ano da amostra.

    A variável pode ser a quantidade de dinheiro gasta (excluindo livros) por um aluno do primeiro ano. Seja\(X\) = a quantia de dinheiro gasta (excluindo livros) por um aluno do primeiro ano do ABC College.

    Os dados são os valores em dólares gastos pelos alunos do primeiro ano. Exemplos dos dados são $150, $200 e $225.

    Exercício 1.1

    Determine a que os termos-chave se referem no estudo a seguir. Queremos saber a quantia média (média) de dinheiro gasta em uniformes escolares a cada ano por famílias com crianças na Knoll Academy. Pesquisamos aleatoriamente 100 famílias com crianças na escola. Três das famílias gastaram $65, $75 e $95, respectivamente.

    Exemplo 1.2

    Determine a que os termos-chave se referem no estudo a seguir.

    Um estudo foi realizado em uma faculdade local para analisar a média cumulativa de GPA dos alunos que se formaram no ano passado. Preencha a letra da frase que melhor descreve cada um dos itens abaixo.

    1. População ____ 2. Estatística ____ 3. Parâmetro ____ 4. Amostra ____ 5. Variável ____ 6. Dados ____

    1. todos os estudantes que frequentaram a faculdade no ano passado
    2. o GPA cumulativo de um aluno que se formou na faculdade no ano passado
    3. 3,65, 2,80, 1,50, 3,90
    4. um grupo de estudantes que se formaram na faculdade no ano passado, selecionados aleatoriamente
    5. o GPA médio cumulativo dos estudantes que se formaram na faculdade no ano passado
    6. todos os estudantes que se formaram na faculdade no ano passado
    7. o GPA médio cumulativo dos estudantes do estudo que se formaram na faculdade no ano passado
    Resposta

    Solução 1.2

    1. f; 2,5 g; 3. e; 4. d; 5. b; 6,5 c

    Exemplo 1.3

    Determine a que os termos-chave se referem no estudo a seguir.

    Como parte de um estudo desenvolvido para testar a segurança de automóveis, o National Transportation Safety Board coletou e revisou dados sobre os efeitos de um acidente automobilístico em manequins de teste. Aqui está o critério que eles usaram:

    Velocidade com que os carros caíram Localização do “drive” (ou seja, manequins)
    35 milhas/hora Banco dianteiro
    Tabela 1.1

    Carros com manequins nos bancos dianteiros bateram contra uma parede a uma velocidade de 35 milhas por hora. Queremos saber a proporção de manequins no banco do motorista que teriam sofrido ferimentos na cabeça, se fossem motoristas reais. Começamos com uma amostra aleatória simples de 75 carros.

    Resposta

    Solução 1.3

    A população é composta por todos os carros que contêm bonecos no banco da frente.

    A amostra são os 75 carros, selecionados por uma amostra aleatória simples.

    O parâmetro é a proporção de motoristas bonecos (se fossem pessoas reais) que teriam sofrido ferimentos na cabeça na população.

    A estatística é a proporção de motoristas manequins (se fossem pessoas reais) que teriam sofrido ferimentos na cabeça na amostra.

    A variável\(X\) = o número de motoristas bonecos (se fossem pessoas reais) que teriam sofrido ferimentos na cabeça.

    Os dados são: sim, teve um ferimento na cabeça ou não, não.

    Exemplo 1.4

    Determine a que os termos-chave se referem no estudo a seguir.

    Uma seguradora gostaria de determinar a proporção de todos os médicos que estiveram envolvidos em uma ou mais ações judiciais por negligência médica. A empresa seleciona aleatoriamente 500 médicos de um diretório profissional e determina o número na amostra que estiveram envolvidos em uma ação judicial por negligência médica.

    Resposta

    Solução 1.4

    A população é composta por todos os médicos listados no diretório profissional.

    O parâmetro é a proporção de médicos que estiveram envolvidos em um ou mais processos por negligência médica na população.

    A amostra são os 500 médicos selecionados aleatoriamente do diretório profissional.

    A estatística é a proporção de médicos que estiveram envolvidos em um ou mais processos por negligência médica na amostra.

    A variável\(X\) = o número de médicos que estiveram envolvidos em um ou mais processos por negligência médica.

    Os dados são: sim, esteve envolvido em um ou mais processos por negligência médica, ou não, não estava.