Glossário
- Page ID
- 190181
\( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)
Palavras (ou palavras que têm a mesma definição) | A definição faz distinção entre maiúsculas | (Opcional) Imagem a ser exibida com a definição [Não exibida no Glossário, somente em pop-up nas páginas] | (Opcional) Legenda para imagem | (Opcional) Link externo ou interno | (Opcional) Fonte para definição |
---|---|---|---|---|---|
(Por exemplo. “Genético, hereditário, DNA...”) | (Por exemplo. “Relacionado a genes ou hereditariedade”) | A infame dupla hélice | https://bio.libretexts.org/ | CC-BY-SA; Delmar Larsen |
Análise de Vardelmar
Palavra (s) | Definição | Imagem | Legenda | Link | Fonte |
---|---|---|---|---|---|
Análise de Variância, Análise de Vardelmar | também conhecido como ANOVA, é um método de testar se as médias de três ou mais populações são iguais ou não. O método é aplicável se: (1) todas as populações de interesse estiverem normalmente distribuídas. (2) as populações têm desvios padrão iguais. (3) amostras (não necessariamente do mesmo tamanho) são selecionadas aleatoriamente e independentemente de cada população. (4) A estatística de teste para análise de variância é a\(F\) -proporção. | OpenStax | |||
Média | um número que descreve a tendência central dos dados; há várias médias especializadas, incluindo a média aritmética, média ponderada, mediana, modo e média geométrica. | OpenStax | |||
Testes de Bernoulli | um experimento com as seguintes características: (1) Existem apenas dois resultados possíveis chamados “sucesso” e “falha” para cada tentativa. (2) A probabilidade\(p\) de sucesso é a mesma para qualquer tentativa (portanto, a probabilidade\(q = 1 − p\) de falha é a mesma para qualquer tentativa). | OpenStax | |||
Distribuição binomial | uma variável aleatória discreta (RV) que surge dos ensaios de Bernoulli. Há um número fixo,\(n\), de ensaios independentes. “Independente” significa que o resultado de qualquer ensaio (por exemplo, ensaio 1) não afeta os resultados dos ensaios a seguir, e todos os ensaios são conduzidos nas mesmas condições. Nessas circunstâncias, o binômio RV □ é definido como o número de sucessos em\(n\) ensaios. A notação é:\(X \sim B(n, p) \mu = np\) e o desvio padrão é\(\sigma = \sqrt{npq}\). A probabilidade exata de\(x\) sucesso nos\(n\) testes é\(P(X = x) = \binom{n}{x} p^{x}q^{n-x}\). | OpenStax | |||
Experiência binomial | um experimento estatístico que satisfaz as três condições a seguir: (1) Há um número fixo de ensaios,\(n\). (2) Existem apenas dois resultados possíveis, chamados de “sucesso” e “fracasso”, para cada tentativa. A letra\(p\) indica a probabilidade de sucesso em uma tentativa e\(q\) denota a probabilidade de uma falha em uma tentativa. (3) As\(n\) tentativas são independentes e são repetidas usando condições idênticas. | OpenStax | |||
Distribuição de probabilidade binomial | uma variável aleatória discreta (VR) que surge dos ensaios de Bernoulli; há um número fixo,\(n\), de ensaios independentes. “Independente” significa que o resultado de qualquer ensaio (por exemplo, o primeiro ensaio) não afeta os resultados dos ensaios a seguir, e todos os ensaios são conduzidos nas mesmas condições. Nessas circunstâncias, o binômio RV\(X\) é definido como o número de sucessos em\(n\) ensaios. A notação é:\(X ~ B(n, p)\). A média é\(\mu = np\) e o desvio padrão é\(\sigma = \sqrt{npq}\). A probabilidade exata de\(x\) sucesso nos\(n\) testes é\(P(X = x) = {n \choose x}p^{x}q^{n-x}\). | OpenStax | |||
Cegando | não dizer aos participantes qual tratamento o sujeito está recebendo | OpenStax | |||
Gráfico da caixa | um gráfico que fornece uma visão rápida dos 50% médios dos dados | OpenStax | |||
Variável categórica | variáveis que assumem valores que são nomes ou rótulos | OpenStax | |||
Teorema do Limite Central | Dada uma variável aleatória (VR) com média\(\mu\) e desvio padrão conhecidos\(\sigma\), estamos amostrando com tamanho\(n\) e estamos interessados em dois novos RVs: a média da amostra e a soma da amostra,\(\sum X\).\(\bar{X}\) Se o tamanho (\(n\)) da amostra for suficientemente grande, então\(\bar{X} \sim N\left(\mu, \dfrac{\sigma}{\sqrt{n}}\right)\)\(\sum X \sim N(n\mu, (\sqrt{n})(\sigma))\) e. Se o tamanho (\(n\)) da amostra for suficientemente grande, a distribuição das médias da amostra e a distribuição das somas da amostra se aproximarão de uma distribuição normal, independentemente da forma da população. A média das médias da amostra será igual à média da população, e a média das somas da amostra será igual\(n\) à média da população. O desvio padrão da distribuição das médias da amostra,\(\dfrac{\sigma}{\sqrt{n}}\), é chamado de erro padrão da média. | OpenStax | |||
Teorema do Limite Central | Dada uma variável aleatória (VR) com média conhecida\(\mu\) e desvio padrão conhecido\(\sigma\). Estamos amostrando com tamanho\(n\) e estamos interessados em dois novos RVs - a média da amostra e a soma da amostra\(\sum X\).\(\bar{X}\) Se o tamanho\(n\) da amostra for suficientemente grande, então\(\bar{X} - N\left(\mu, \frac{\sigma}{\sqrt{n}}\right)\)\(\sum X - N \left(n\mu, \sqrt{n}\sigma\right)\) e. Se o tamanho n da amostra for suficientemente grande, a distribuição das médias da amostra e a distribuição das somas da amostra se aproximarão de uma distribuição normal, independentemente da forma da população. A média das médias da amostra será igual à média da população e a média das somas da amostra será igual\(n\) à média da população. O desvio padrão da distribuição das médias da amostra,\(\frac{\sigma}{\sqrt{n}}\), é chamado de erro padrão da média. | OpenStax | |||
Amostra de cluster | um método para selecionar uma amostra aleatória e dividir a população em grupos (agrupamentos); use amostragem aleatória simples para selecionar um conjunto de agrupamentos. Cada indivíduo nos clusters escolhidos é incluído na amostra. | OpenStax | |||
Coeficiente de correlação | uma medida desenvolvida por Karl Pearson (início dos anos 1900) que fornece a força da associação entre a variável independente e a variável dependente; a fórmula é:\[r = \dfrac{n \sum xy - \left(\sum x\right) \left(\sum y\right)}{\sqrt{\left[n \sum x^{2} - \left(\sum x\right)^{2}\right] \left[n \sum y^{2} - \left(\sum y\right)^{2}\right]}}\] onde\(n\) está o número de pontos de dados. O coeficiente não pode ser maior que 1 ou menor que —1. Quanto mais próximo o coeficiente estiver de ±1, mais forte será a evidência de uma relação linear significativa entre\(x\)\(y\) e. | OpenStax | |||
Probabilidade condicional | a probabilidade de que um evento ocorra, uma vez que outro evento já ocorreu | OpenStax | |||
Intervalo de confiança (CI) | uma estimativa de intervalo para um parâmetro populacional desconhecido. Isso depende de: (1) O nível de confiança desejado. (2) Informações conhecidas sobre a distribuição (por exemplo, desvio padrão conhecido). (3) A amostra e seu tamanho. | OpenStax | |||
Nível de confiança (CL) | a expressão percentual da probabilidade de que o intervalo de confiança contenha o verdadeiro parâmetro da população; por exemplo\(CL = 90%\), se o, em 90 das 100 amostras, a estimativa do intervalo incluirá o parâmetro da população real. | OpenStax | |||
tabela de contingência | o método de exibir uma distribuição de frequência como uma tabela com linhas e colunas para mostrar como duas variáveis podem ser dependentes (contingentes) uma da outra; a tabela fornece uma maneira fácil de calcular probabilidades condicionais. | OpenStax | |||
Variável aleatória contínua | uma variável aleatória (VR) cujos resultados são medidos; a altura das árvores na floresta é um RV contínuo. | OpenStax | |||
Grupo de controle | um grupo em um experimento randomizado que recebe um tratamento inativo, mas é gerenciado exatamente como os outros grupos | OpenStax | |||
Amostra de conveniência | um método não aleatório de seleção de uma amostra; esse método seleciona indivíduos que são facilmente acessíveis e podem resultar em dados enviesados. | OpenStax | |||
Frequência relativa cumulativa | O termo se aplica a um conjunto ordenado de observações da menor para a maior. A frequência relativa cumulativa é a soma das frequências relativas de todos os valores menores ou iguais ao valor dado. | OpenStax | |||
Dados | um conjunto de observações (um conjunto de resultados possíveis); a maioria dos dados pode ser colocada em dois grupos: qualitativo (um atributo cujo valor é indicado por um rótulo) ou quantitativo (um atributo cujo valor é indicado por um número). Os dados quantitativos podem ser separados em dois subgrupos: discretos e contínuos. Os dados são discretos se forem o resultado da contagem (como o número de alunos de um determinado grupo étnico em uma classe ou o número de livros em uma prateleira). Os dados são contínuos se forem o resultado de uma medição (como a distância percorrida ou o peso da bagagem) | OpenStax | |||
parâmetro de decaimento | O parâmetro de decaimento descreve a taxa na qual as probabilidades caem para zero para valores crescentes de\(x\). É o valor\(m\) na função densidade de probabilidade\(f(x) = me^{(-mx)}\) de uma variável aleatória exponencial. Também é igual a\(m = \dfrac{1}{\mu}\), onde\(\mu\) está a média da variável aleatória. | OpenStax | |||
Graus de liberdade (df) | o número de objetos em uma amostra que podem variar livremente. | OpenStax | |||
Eventos dependentes | Se dois eventos NÃO são independentes, então dizemos que eles são dependentes. | OpenStax | |||
Variável aleatória discreta | uma variável aleatória (RV) cujos resultados são contados | OpenStax | |||
Dupla cegueira | o ato de cegar tanto os sujeitos de um experimento quanto os pesquisadores que trabalham com os sujeitos | OpenStax | |||
Igualmente provável | Cada resultado de um experimento tem a mesma probabilidade. | OpenStax | |||
Limite de erro para uma média populacional (EBM) | a margem de erro; depende do nível de confiança, do tamanho da amostra e do desvio padrão da população conhecido ou estimado. | OpenStax | |||
Limite de erro para uma proporção da população (EBP) | a margem de erro; depende do nível de confiança, do tamanho da amostra e da proporção estimada (da amostra) de sucessos. | OpenStax | |||
Evento | um subconjunto do conjunto de todos os resultados de um experimento; o conjunto de todos os resultados de um experimento é chamado de espaço amostral e geralmente é denotado por\(S\). Um evento é um subconjunto arbitrário em\(S\). Ele pode conter um resultado, dois resultados, nenhum resultado (subconjunto vazio), todo o espaço amostral e similares. As notações padrão para eventos são letras maiúsculas\(A, B, C\), como e assim por diante. | OpenStax | |||
Valor esperado | média aritmética esperada quando um experimento é repetido várias vezes; também chamada de média. Anotações:\(\mu\). Para uma variável aleatória discreta (RV) com função de distribuição de probabilidade\(P(x)\), a definição também pode ser escrita no formulário\(\mu = \sum{xP(x)}\). | OpenStax | |||
Experimento | uma atividade planejada realizada sob condições controladas | OpenStax | |||
Unidade experimental | qualquer indivíduo ou objeto a ser medido | OpenStax | |||
Variável explicativa | a variável independente em um experimento; o valor controlado pelos pesquisadores | OpenStax | |||
Distribuição exponencial | uma variável aleatória contínua (VR) que aparece quando estamos interessados nos intervalos de tempo entre alguns eventos aleatórios, por exemplo, o período de tempo entre as chegadas de emergência em um hospital; a notação é\(X \sim \text{Exp}(m)\). A média é\(\mu = \frac{1}{m}\) e o desvio padrão é\(\sigma = \frac{1}{m}\). A função de densidade de probabilidade é\(f(x) = me^{-mx}\),\(x \geq 0\) e a função de distribuição cumulativa é\(P(X \leq x) = 1 − e^{mx}\). | OpenStax | |||
Primeiro quartil | o valor que é a mediana da metade inferior do conjunto de dados ordenado | OpenStax | |||
Frequência | o número de vezes que um valor dos dados ocorre | OpenStax | |||
Polígono de frequência | parece um gráfico de linhas, mas usa intervalos para exibir intervalos de grandes quantidades de dados | OpenStax | |||
Tabela de frequência | uma representação de dados na qual os dados agrupados são exibidos junto com as frequências correspondentes | OpenStax | |||
Distribuição geométrica | uma variável aleatória discreta (VR) que surge dos ensaios de Bernoulli; os ensaios são repetidos até o primeiro sucesso. A variável geométrica\(X\) é definida como o número de tentativas até o primeiro sucesso. Notação:\(X \sim G(p)\). A média é\(\mu = \dfrac{1}{p}\) e o desvio padrão é\(\sigma = \sqrt{\dfrac{1}{p}\left(\dfrac{1}{p} - 1\right)}\). A probabilidade de\(x\) falhas exatas antes do primeiro sucesso é dada pela fórmula:\(P(X = x) = p(1 –p)^{x-1}\). | OpenStax | |||
Experiência geométrica | um experimento estatístico com as seguintes propriedades: (1) Há um ou mais ensaios de Bernoulli com todas as falhas, exceto o último, que é um sucesso. (2) Em teoria, o número de ensaios poderia durar para sempre. Deve haver pelo menos uma tentativa. (3) A probabilidade,\(p\), de um sucesso e a probabilidade,\(q\), de um fracasso não mudam de tentativa para tentativa | OpenStax | |||
Experiência hipergeométrica | um experimento estatístico com as seguintes propriedades: (1) Você coleta amostras de dois grupos. (2) Você está preocupado com um grupo de interesse, chamado primeiro grupo. (3) Você coleta amostras sem substituição dos grupos combinados. (4) Cada seleção não é independente, pois a amostragem é sem substituição. (5) Você está não lidando com os julgamentos de Bernoulli. | OpenStax | |||
Probabilidade hipergeométrica | uma variável aleatória discreta (VR) que é caracterizada por: (1) Um número fixo de tentativas. (2) A probabilidade de sucesso não é a mesma de tentativa em tentativa. Coletamos amostras de dois grupos de itens quando estamos interessados em apenas um grupo. \(X\)é definido como o número de sucessos do número total de itens escolhidos. Notação:\(X \sim H(r, b, n)\), onde\(r =\) o número de itens no grupo de interesse,\(b =\) o número de itens no grupo não de interesse e\(n =\) o número de itens escolhidos. | OpenStax | |||
Hipótese | uma afirmação sobre o valor de um parâmetro populacional, no caso de duas hipóteses, a afirmação assumida como verdadeira é chamada de hipótese nula (notação\(H_{0}\)) e a afirmação contraditória é chamada de hipótese alternativa (notação\(H_{a}\)). | OpenStax | |||
Teste de hipóteses | Com base na evidência da amostra, um procedimento para determinar se a hipótese declarada é uma afirmação razoável e não deve ser rejeitada, ou não é razoável e deve ser rejeitada. | OpenStax | |||
Eventos independentes | A ocorrência de um evento não tem efeito sobre a probabilidade da ocorrência de outro evento. Eventos\(\text{A}\) e\(\text{B}\) são independentes se uma das seguintes situações for verdadeira: (1)\(P(\text{A|B}) = P(\text{A})\), (2)\(P(\text{B|A}) = P(\text{B})\), (3)\(P(\text{A AND B}) = P(\text{A})P(\text{B})\) | OpenStax | |||
Estatísticas inferenciais | também chamada de inferência estatística ou estatística indutiva; essa faceta da estatística lida com a estimativa de um parâmetro populacional com base em uma estatística de amostra. Por exemplo, se quatro das 100 calculadoras amostradas estiverem com defeito, podemos inferir que quatro por cento da produção está com defeito. | OpenStax | |||
Consentimento informado | Qualquer sujeito humano em um estudo de pesquisa deve estar ciente de quaisquer riscos ou custos associados ao estudo. O sujeito tem o direito de conhecer a natureza dos tratamentos incluídos no estudo, seus riscos potenciais e seus benefícios potenciais. O consentimento deve ser dado livremente por um participante informado e apto. | OpenStax | |||
Conselho de Revisão Institucional | um comitê encarregado de supervisionar programas de pesquisa que envolvem seres humanos | OpenStax | |||
Intervalo | também chamado de intervalo de classe; um intervalo representa um intervalo de dados e é usado para exibir grandes conjuntos de dados | OpenStax | |||
Nível de significância do teste | probabilidade de um erro do Tipo I (rejeite a hipótese nula quando ela for verdadeira). Notação:\(\alpha\). No teste de hipóteses, o Nível de Significância é chamado de preconcebido\(\alpha\) ou predefinido\(\alpha\). | OpenStax | |||
Variável oculta | uma variável que tem um efeito em um estudo, mesmo que não seja uma variável explicativa nem uma variável de resposta | OpenStax | |||
Significa | um número que mede a tendência central; um nome comum para média é “média”. O termo “média” é uma forma abreviada de “média aritmética”. Por definição, a média de uma amostra (indicada por\(\bar{x}\)) é\(\bar{x} = \dfrac{\text{Sum of all values in the sample}}{\text{Number of values in the sample}}\), e a média de uma população (indicada por\(\mu\)) é\(\mu = \dfrac{\text{Sum of all values in the population}}{\text{Number of values in the population}}\). | OpenStax | |||
Média de uma distribuição de probabilidade | a média de longo prazo de muitos ensaios de um experimento estatístico | OpenStax | |||
Mediana | um número que separa os dados ordenados em metades; metade dos valores são o mesmo número ou menores que a mediana e metade dos valores são o mesmo número ou maiores que a mediana. A mediana pode ou não fazer parte dos dados. | OpenStax | |||
propriedade sem memória | Para uma variável aleatória exponencial\(X\), a propriedade sem memória é a afirmação de que o conhecimento do que ocorreu no passado não tem efeito sobre as probabilidades futuras. Isso significa que a probabilidade que\(X\) excede\(x + k\), dado que foi excedida\(x\), é a mesma que\(X\) excederia\(k\) se não tivéssemos conhecimento sobre ela. Em símbolos, dizemos que\(P(X > x + k | X > x) = P(X > k)\) | OpenStax | |||
Ponto médio | a média de um intervalo em uma tabela de frequência | OpenStax | |||
Modo | o valor que aparece com mais frequência em um conjunto de dados | OpenStax | |||
Mutuamente exclusivo | Dois eventos são mutuamente exclusivos se a probabilidade de ambos acontecerem ao mesmo tempo for zero. Se eventos\(\text{A}\) e\(\text{B}\) forem mutuamente exclusivos, então\(P(\text{A AND B}) = 0\). | OpenStax | |||
Erro de não amostragem | um problema que afeta a confiabilidade dos dados de amostragem além da variação natural; inclui uma variedade de erros humanos, incluindo design de estudo inadequado, métodos de amostragem tendenciosos, informações imprecisas fornecidas pelos participantes do estudo, erros de entrada de dados e análise deficiente. | OpenStax | |||
Distribuição normal | uma variável aleatória contínua (RV) com pdf\(f(x) = \dfrac{1}{\sigma \sqrt{2 \pi}}e^{\dfrac{-(x-\mu)^{2}}{2 \sigma^{2}}}\), onde\(\mu\) é a média da distribuição e\(\sigma\) é o desvio padrão; notação:\(X \sim N(\mu, \sigma)\). Se\(\mu = 0\) e\(\sigma = 1\), o RV é chamado de distribuição normal padrão. | OpenStax | |||
Variável numérica | variáveis que assumem valores indicados por números | OpenStax | |||
ANOVA unidirecional | um método para testar se as médias de três ou mais populações são iguais; o método é aplicável se: (1) todas as populações de interesse estão normalmente distribuídas. (2) as populações têm desvios padrão iguais. (3) amostras (não necessariamente do mesmo tamanho) são selecionadas aleatoriamente e independentemente de cada população. (4) A estatística de teste para análise de variância é a\(F\) razão. | OpenStax | |||
Resultado | um resultado específico de um experimento | OpenStax | |||
Outlier | uma observação que não se encaixa no resto dos dados | OpenStax | |||
valor p | a probabilidade de que um evento aconteça puramente por acaso, assumindo que a hipótese nula é verdadeira. Quanto menor o\(p\) valor -, mais forte é a evidência contra a hipótese nula. | OpenStax | |||
Conjunto de dados emparelhado | dois conjuntos de dados que têm uma relação de um para um, de forma que: (1) ambos os conjuntos de dados tenham o mesmo tamanho e (2) cada ponto de dados em um conjunto de dados corresponda exatamente a um ponto do outro conjunto. | OpenStax | |||
Parâmetro | um número que é usado para representar uma característica da população e que geralmente não pode ser determinado facilmente | OpenStax | |||
Parâmetro | uma característica numérica de uma população | OpenStax | |||
Placebo | um tratamento inativo que não tem efeito real na variável explicativa | OpenStax | |||
Estimativa de | um único número calculado a partir de uma amostra e usado para estimar um parâmetro populacional | OpenStax | |||
Distribuição de Poisson | Se houver uma média conhecida de\(\lambda\) eventos ocorrendo por unidade de tempo e esses eventos forem independentes uns dos outros, o número de eventos\(X\) que ocorrem em uma unidade de tempo tem a distribuição de Poisson. A probabilidade de k eventos ocorrerem em uma unidade de tempo é igual\(P(X = k) = \dfrac{\lambda^{k}e^{-\lambda}}{k!}\) a. | OpenStax | |||
Distribuição de probabilidade de Pois | uma variável aleatória discreta (VR) que conta o número de vezes que um determinado evento ocorrerá em um intervalo específico; características da variável: (1) A probabilidade de que o evento ocorra em um determinado intervalo é a mesma para todos os intervalos. (2) Os eventos ocorrem com uma média conhecida e independentemente do tempo desde o último evento. A distribuição é definida pela média\(\mu\) do evento no intervalo. Notação:\(X \sim P(\mu)\). A média é\(\mu = np\). O desvio padrão é\(\sigma = \sqrt{\mu}\). A probabilidade de ter exatamente\(x\) sucesso nos\(r\) testes é\(P(X = x) = \left(e^{-\mu}\right)\frac{\mu^{x}}{x!}\). A distribuição de Poisson é frequentemente usada para aproximar a distribuição binomial, quando\(n\)\(p\) é “grande” e é “pequena” (uma regra geral é que\(n\) deve ser maior ou igual a 20 e\(p\) deve ser menor ou igual a 0,05). | OpenStax | |||
Proporção combinada | estimativa do valor comum de\(p_{1}\)\(p_{2}\) e. | OpenStax | |||
População | todos os indivíduos, objetos ou medidas cujas propriedades estão sendo estudadas | OpenStax | |||
Probabilidade | um número entre zero e um, inclusive, que fornece a probabilidade de que um evento específico ocorra | OpenStax | |||
Probabilidade | um número entre zero e um, inclusive, que dá a probabilidade de que um evento específico ocorra; a base da estatística é dada pelos seguintes 3 axiomas (por A.N. Kolmogorov, 1930): Vamos\(S\) denotar o espaço amostral\(A\) e e\(B\) são dois eventos em S. Então: (1)\(0 \leq P(\text{A}) \leq 1\), (2) Se\(\text{A}\) e\(\text{B}\) forem quaisquer dois eventos mutuamente exclusivos, então\(\text{P}(\text{A OR B}) = P(\text{A}) + P(\text{B})\) e (3)\(P(\text{S}) = 1\). | OpenStax | |||
Função de distribuição de probabilidade (PDF) | uma descrição matemática de uma variável aleatória discreta (RV), dada na forma de uma equação (fórmula) ou na forma de uma tabela listando todos os resultados possíveis de um experimento e a probabilidade associada a cada resultado. | OpenStax | |||
Proporção | o número de sucessos dividido pelo número total na amostra | OpenStax | |||
Dados qualitativos | Veja os dados. | OpenStax | |||
Dados quantitativos | Veja os dados. | OpenStax | |||
Cessão aleatória | o ato de organizar unidades experimentais em grupos de tratamento usando métodos aleatórios | OpenStax | |||
Amostra aleatória | um método de seleção de uma amostra que dá a cada membro da população uma chance igual de ser selecionado. | OpenStax | |||
Variável aleatória (RV) | uma característica de interesse em uma população que está sendo estudada; notação comum para variáveis são letras latinas maiúsculas\(X, Y, Z\),...; notação comum para um valor específico do domínio (conjunto de todos os valores possíveis de uma variável) são letras latinas minúsculas\(x\)\(y\),\(z\) e. Por exemplo, se\(X\) for o número de filhos em uma família, então\(x\) representa um número inteiro específico 0, 1, 2, 3,... As variáveis em estatística diferem das variáveis da álgebra intermediária nas duas formas a seguir. (1) O domínio da variável aleatória (RV) não é necessariamente um conjunto numérico; o domínio pode ser expresso em palavras; por exemplo, se a cor do\(X =\) cabelo, o domínio é {preto, loiro, cinza, verde, laranja}. (2) Só podemos dizer qual valor específico\(x\) a variável aleatória\(X\) assume após realizar o experimento. | OpenStax | |||
Frequência relativa | a razão entre o número de vezes que um valor dos dados ocorre no conjunto de todos os resultados e o número de todos os resultados e o número total de resultados | OpenStax | |||
Amostra representativa | um subconjunto da população que tem as mesmas características da população | OpenStax | |||
Variável de resposta | a variável dependente em um experimento; o valor que é medido para mudança no final de um experimento | OpenStax | |||
Amostra | um subconjunto da população estudada | OpenStax | |||
Espaço de amostra | o conjunto de todos os resultados possíveis de um experimento | OpenStax | |||
Viés de amostra | nem todos os membros da população têm a mesma probabilidade de serem selecionados | OpenStax | |||
Distribuição de amostras | Dadas amostras aleatórias simples\(n\) de tamanho de uma determinada população com uma característica medida, como média, proporção ou desvio padrão para cada amostra, a distribuição de probabilidade de todas as características medidas é chamada de distribuição amostral. | OpenStax | |||
Erro de amostragem | a variação natural que resulta da seleção de uma amostra para representar uma população maior; essa variação diminui à medida que o tamanho da amostra aumenta, portanto, selecionar amostras maiores reduz o erro de amostragem. | OpenStax | |||
Amostragem com substituição | Depois que um membro da população é selecionado para inclusão em uma amostra, esse membro é devolvido à população para a seleção do próximo indivíduo. | OpenStax | |||
Amostragem sem substituição | Um membro da população pode ser escolhido para inclusão em uma amostra apenas uma vez. Se for escolhido, o membro não será devolvido à população antes da próxima seleção. | OpenStax | |||
Amostragem aleatória simples | um método simples para selecionar uma amostra aleatória; dê a cada membro da população um número. Use um gerador de números aleatórios para selecionar um conjunto de rótulos. Esses rótulos selecionados aleatoriamente identificam os membros da sua amostra. | OpenStax | |||
Distorcido | usado para descrever dados que não são simétricos; quando o lado direito de um gráfico parece “cortado” em comparação com o lado esquerdo, dizemos que ele está “inclinado para a esquerda”. Quando o lado esquerdo do gráfico parece “cortado” em comparação com o lado direito, dizemos que os dados estão “distorcidos para a direita”. Como alternativa: quando os valores mais baixos dos dados estão mais espalhados, dizemos que os dados estão distorcidos para a esquerda. Quando os valores maiores estão mais dispersos, os dados são distorcidos para a direita. | OpenStax | |||
Desvio padrão | um número que é igual à raiz quadrada da variância e mede a que distância os valores dos dados estão de sua média; notação: s para desvio padrão da amostra e σ para desvio padrão da população. | OpenStax | |||
Desvio padrão de uma distribuição de probabilidade | um número que mede a distância entre os resultados de um experimento estatístico e a média da distribuição | OpenStax | |||
Erro padrão da média | o desvio padrão da distribuição das médias da amostra, ou\(\dfrac{\sigma}{\sqrt{n}}\). | OpenStax | |||
Distribuição normal padrão | uma variável aleatória contínua (RV)\(X \sim N(0, 1)\); quando\(X\) segue a distribuição normal padrão, geralmente é notada como\ (Z\ sim N (0, 1)\. | OpenStax | |||
Estatística | uma característica numérica da amostra; uma estatística estima o parâmetro populacional correspondente. | OpenStax | |||
Amostragem estratificada | um método para selecionar uma amostra aleatória usado para garantir que os subgrupos da população sejam representados adequadamente; divida a população em grupos (estratos). Use amostragem aleatória simples para identificar um número proporcional de indivíduos de cada estrato. | OpenStax | |||
Distribuição t do aluno | investigado e relatado por William S. Gossett em 1908 e publicado sob o pseudônimo de Student. As principais características da variável aleatória (RV) são: (1) Ela é contínua e assume quaisquer valores reais. (2) O pdf é simétrico em relação à sua média de zero. No entanto, está mais espalhado e mais plano no ápice do que a distribuição normal. (3) Ela se aproxima da distribuição normal padrão à medida que\(n\) aumenta. (4) Existe uma “família”\(t\) de distribuições: cada representante da família é completamente definido pelo número de graus de liberdade que é um a menos do que o número de itens de dados. | OpenStax | |||
Amostra sistemática | um método para selecionar uma amostra aleatória; liste os membros da população. Use amostragem aleatória simples para selecionar um ponto de partida na população. Seja k = (número de indivíduos na população)/(número de indivíduos necessários na amostra). Escolha cada késimo indivíduo na lista, começando com aquele que foi selecionado aleatoriamente. Se necessário, retorne ao início da lista da população para completar sua amostra. | OpenStax | |||
O evento AND | Um resultado ocorre\(\text{A AND B}\) se o resultado estiver em ambos\(\text{A AND B}\) ao mesmo tempo. | OpenStax | |||
O evento Complement | O complemento do evento\(\text{A}\) consiste em todos os resultados que NÃO estão presentes\(\text{A}\). | OpenStax | |||
A probabilidade condicional de A DADO B | \(P(\text{A|B})\)é a probabilidade de que o evento\(\text{A}\) ocorra, desde que o evento já\(\text{B}\) tenha ocorrido. | OpenStax | |||
A probabilidade condicional de um evento dado outro evento | P (A | B) é a probabilidade de que o evento A ocorra, dado que o evento B já ocorreu. | OpenStax | |||
A Lei dos Grandes Números | À medida que o número de ensaios em um experimento de probabilidade aumenta, a diferença entre a probabilidade teórica de um evento e a probabilidade de frequência relativa se aproxima de zero. | OpenStax | |||
O evento Or | Um resultado ocorre quando\(\text{A OR B}\) o resultado está em\(\text{A}\), está em\(\text{B}\) ou está em ambos\(\text{A}\)\(\text{B}\) e. | OpenStax | |||
O OR de dois eventos | Um resultado está no evento A OU B se o resultado estiver em A, em B ou em A e B. | OpenStax | |||
Tratamentos | valores ou componentes diferentes da variável explicativa aplicada em um experimento | OpenStax | |||
diagrama de árvore | a representação visual útil de um espaço amostral e eventos na forma de uma “árvore” com galhos marcados por possíveis resultados, juntamente com probabilidades associadas (frequências, frequências relativas) | OpenStax | |||
Erro do tipo 1 | A decisão é rejeitar a hipótese nula quando, na verdade, a hipótese nula é verdadeira. | OpenStax | |||
Erro do tipo 2 | A decisão é não rejeitar a hipótese nula quando, na verdade, a hipótese nula é falsa. | OpenStax | |||
Distribuição uniforme | uma variável aleatória contínua (RV) que tem resultados igualmente prováveis sobre o domínio\(a < x < b\); geralmente é chamada de distribuição retangular porque o gráfico do pdf tem a forma de um retângulo. Notação:\(X \sim U(a,b)\). A média é\(\mu = \frac{a+b}{2}\) e o desvio padrão é\(\sigma = \sqrt{\frac{(b-a)^{2}}{12}}\). A função de densidade de probabilidade é\(f(x) = \frac{1}{b-a}\) para\(a < x < b\) ou\(a \leq x \leq b\). A distribuição cumulativa é\(P(X \leq x) = \frac{x-a}{b-a}\). | OpenStax | |||
Distribuição uniforme | uma variável aleatória contínua (RV) que tem resultados igualmente prováveis sobre o domínio,\(a < x < b\); frequentemente chamada de distribuição retangular porque o gráfico do pdf tem a forma de um retângulo. Notação:\(X \sim U(a, b)\). A média é\(\mu = \dfrac{a+b}{2}\) e o desvio padrão é\(\sigma = \sqrt{\dfrac{(b-a)^{2}}{12}}\). A função de densidade de probabilidade é\(f(x) = \dfrac{a+b}{2}\) para\(a < x < b\) ou\(a \leq x \leq b\). A distribuição cumulativa é\(P(X \leq x) = \dfrac{x-a}{b-a}\). | OpenStax | |||
Variável | uma característica de interesse para cada pessoa ou objeto em uma população | OpenStax | |||
Variável (variável aleatória) | uma característica de interesse em uma população que está sendo estudada. A notação comum para variáveis são letras latinas maiúsculas\(X, Y, Z,\)... A notação comum para um valor específico do domínio (conjunto de todos os valores possíveis de uma variável) são letras latinas minúsculas\(x, y, z,\)... Por exemplo, se\(X\) for o número de filhos em uma família, então\(x\) representa um número inteiro específico 0, 1, 2, 3,... As variáveis em estatística diferem das variáveis da álgebra intermediária nas duas formas a seguir. (1) O domínio da variável aleatória (RV) não é necessariamente um conjunto numérico; o domínio pode ser expresso em palavras; por exemplo, se for a cor do\(X =\) cabelo, o domínio será {preto, loiro, cinza, verde, laranja}. (2) Só podemos dizer qual valor específico x da variável aleatória\(X\) assume depois de realizar o experimento. | OpenStax | |||
Variância | média dos desvios quadrados da média; o quadrado do desvio padrão. Para um conjunto de dados, um desvio pode ser representado como\(x - \bar{x}\) onde\(x\) está um valor dos dados e\(\bar{x}\) é a média da amostra. A variância da amostra é igual à soma dos quadrados dos desvios dividida pela diferença do tamanho amostral e um. | OpenStax | |||
Diagrama de Venn | a representação visual de um espaço amostral e eventos na forma de círculos ou ovais mostrando suas interseções | OpenStax | |||
pontuação z | a transformação linear da forma\(z = \dfrac{x-\mu}{\sigma}\); se essa transformação for aplicada a qualquer distribuição normal,\(X \sim N(\mu, \sigma\) o resultado será a distribuição normal padrão\(Z \sim N(0,1)\). Se essa transformação for aplicada a qualquer valor específico\(x\) do VD com média\(\mu\) e desvio padrão\(\sigma\), o resultado é chamado de\(z\) -score de\(x\). O\(z\) -score nos permite comparar dados que normalmente são distribuídos, mas escalados de forma diferente. | OpenStax |