Skip to main content
Global

10.4: Comparando duas proporções populacionais independentes

  • Page ID
    186666
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    Ao realizar um teste de hipótese que compara duas proporções populacionais independentes, as seguintes características devem estar presentes:

    1. As duas amostras independentes são amostras aleatórias que são independentes.
    2. O número de sucessos é pelo menos cinco e o número de falhas é pelo menos cinco, para cada uma das amostras.
    3. A crescente literatura afirma que a população deve ter pelo menos dez ou talvez 20 vezes o tamanho da amostra. Isso evita que cada população seja sobreamostrada e cause resultados tendenciosos.

    Comparar duas proporções, como comparar duas médias, é comum. Se duas proporções estimadas forem diferentes, isso pode ser devido a uma diferença nas populações ou pode ser devido ao acaso na amostragem. Um teste de hipótese pode ajudar a determinar se uma diferença nas proporções estimadas reflete uma diferença nas duas proporções da população.

    Como no caso das diferenças nas médias amostrais, construímos uma distribuição amostral para diferenças nas proporções amostrais:\(\left(p_{A}^{\prime}-p_{B}^{\prime}\right)\) onde\(p_{A}^{\prime}=X_{\frac{A}{n_{A}}}\) e\(p_{B}^{\prime}=X_{\frac{B}{n_{B}}}\) estão as proporções amostrais para os dois conjuntos de dados em questão. \(X_A\)e\(X_B\) são o número de sucessos em cada grupo amostral, respectivamente,\(n_A\) e\(n_B\) são os respectivos tamanhos de amostra dos dois grupos. Mais uma vez, vamos para a Figura Central\(\PageIndex{5}\).

    Figura\(\PageIndex{5}\)

    Geralmente, a hipótese nula permite o teste de uma diferença de um determinado valor\(\delta_{0}\), assim como fizemos para o caso de diferenças nas médias.

    \[H_{0} : p_{1}-p_{2}=\delta_{0}\nonumber\]

    \[H_{1} : p_{1}-p_{2} \neq \delta_{0}\nonumber\]

    O mais comum, no entanto, é o teste de que as duas proporções são iguais. Ou seja,

    \[H_{0} : p_{\mathrm{A}}=p_{B}\nonumber\]

    \[H_{a} : p_{\mathrm{A}} \neq p_{B}\nonumber\]

    Para realizar o teste, usamos uma proporção combinada,\(p_c\).

    \[\textbf{The pooled proportion is calculated as follows:}\nonumber\]

    \[p_{c}=\frac{x_{A}+x_{B}}{n_{A}+n_{B}}\nonumber\]

    \[\textbf{The test statistic (z-score) is:}\nonumber\]

    \[Z_{c}=\frac{\left(p_{A}^{\prime}-p_{B}^{\prime}\right)-\delta_{0}}{\sqrt{p_{c}\left(1-p_{c}\right)\left(\frac{1}{n_{A}}+\frac{1}{n_{B}}\right)}}\nonumber\]

    onde\(\delta_{0}\) estão as diferenças hipotéticas entre as duas proporções e p c é a variância combinada da fórmula acima.

    Exemplo\(\PageIndex{6}\)

    Um banco adquiriu recentemente uma nova agência e, portanto, tem clientes nesse novo território. Eles estão interessados na taxa de inadimplência em seu novo território. Eles desejam testar a hipótese de que a taxa de inadimplência é diferente de sua base de clientes atual. Eles coletam amostras de 200 arquivos na área A, seus clientes atuais, e descobrem que 20 estão como padrão. Na área B, os novos clientes, outra amostra de 200 arquivos mostra que 12 deixaram de pagar seus empréstimos. Em um nível de significância de 10%, podemos dizer que as taxas de inadimplência são iguais ou diferentes?

    Resposta

    Solução 10.6

    Este é um teste de proporções. Sabemos disso porque a variável aleatória subjacente é binária, padrão ou não padrão. Além disso, sabemos que é um teste de diferenças de proporções porque temos dois grupos de amostras, a base de clientes atual e a base de clientes recém-adquirida. Permita que A e B sejam os subscritos dos dois grupos de clientes. Então p A e p B são as duas proporções da população que desejamos testar.

    Variável aleatória:

    \(P_{A}^{\prime}-P_{B}^{\prime}\)= diferença nas proporções de clientes que ficaram inadimplentes nos dois grupos.

    \(H_{0} : p_{A}=p_{B}\)

    \(H_{a} : p_{A} \neq p_{B}\)

    As palavras “é uma diferença” indicam que o teste é bicaudal.

    Distribuição para o teste: Como esse é um teste de duas proporções binomiais da população, a distribuição é normal:

    \(p_{c}=\frac{x_{A}+x_{B}}{n_{A}+n_{B}}=\frac{20+12}{200+200}=0.08\)\(1-p_{c}=0.92\)

    \(\left(p^{\prime} A-p^{\prime} B\right)=0.04\)segue uma distribuição normal aproximada.

    Proporção estimada para o grupo A:\(p^{\prime}_{A}=\frac{x_{A}}{n_{A}}=\frac{20}{200}=0.1\)

    Proporção estimada para o grupo B:\(p^{\prime}_{B}=\frac{x_{B}}{n_{B}}=\frac{12}{200}=0.06\)

    A diferença estimada entre os dois grupos é:\(p_{A}^{\prime}-p_{B}^{\prime}=0.1-0.06=0.04\).

    Curva de distribuição normal da diferença nas porcentagens de pacientes adultos que não reagem aos medicamentos A e B após 30 minutos. A média é igual a zero e os valores -0,04, 0 e 0,04 são rotulados no eixo horizontal. Duas linhas verticais se estendem de -0,04 e 0,04 até a curva. A região à esquerda de -0,04 e a região à direita de 0,04 estão sombreadas para representar 1/2 (valor p) = 0,0702.

    Figura\(\PageIndex{6}\)

    \[Z_{c}=\frac{\left(\mathrm{P}_{A}^{\prime}-\mathrm{P}_{B}^{\prime}\right)-\delta_{0}}{P_{c}\left(1-P_{c}\right)\left(\frac{1}{n_{A}}+\frac{1}{n_{B}}\right)}=0.54\nonumber\]

    A estatística de teste calculada é 0,54 e não está na cauda da distribuição.

    Tome uma decisão: como a estatística do teste de cálculo não está na cauda da distribuição, não podemos rejeitar\(H_0\).

    Conclusão: Em um nível de significância de 1%, a partir dos dados da amostra, não há evidências suficientes para concluir que há uma diferença entre as proporções de clientes inadimplentes nos dois grupos.

    Exercício\(\PageIndex{6}\)

    Dois tipos de válvulas estão sendo testados para determinar se há uma diferença nas tolerâncias de pressão. Quinze de uma amostra aleatória de 100 da válvula A rachada abaixo de 4.500 psi. Seis de uma amostra aleatória de 100 da válvula B rachada abaixo de 4.500 psi. Teste em um nível de significância de 5%.