4.2. Testes de hipóteses

 

Os problemas que estudamos, no capítulo anterior, pretendiam determinar uma estimativa para um determinado parâmetro da população ou para a relação entre dois parâmetros de duas populações diferentes. Agora a questão é um pouco diferente porque pretende-se estudar o comportamento probabilístico do parâmetro, ou da relação entre dois parâmetros, e verificar se esse comportamento é ou não plausível com a informação inscrita numa amostra. Uma hipótese é uma afirmação que se faz sobre um parâmetro desconhecido e que pode, ou não, ser validada por uma estimativa amostral.

 

1 - Teste para uma média No exemplo, apresentado no capítulo anterior, sobre a classificação média de uma disciplina, nada impede que, apesar de \(\mu\) ser desconhecido, possamos afirmar hipoteticamente que \(\mu > 9.5\). A hipótese teórica que estabelecemos e que pretendemos confrontar com informação empírica é a de que a classificação média da disciplina é superior à que é exigida para que um aluno esteja aprovado. A informação amostral poderá então favorecer esta hipótese ou não, uma vez que temos agora o espaço de resultados dividido em dois subconjuntos. Em estatística, a formulação das hipóteses estatísticas baseia-se nesta divisão do espaço de resultados, dá-se o nome de hipótese nula \( (H_0)\) à hipótese que estabelece o statu quo, ou a situação que consideramos inicialmente como verdadeira e que pretendemos colocar em causa com a formulação da hipótese alternativa \( (H_1)\). No exemplo que temos estado a utilizar poderíamos então formular as seguintes hipóteses: $$ H_0: \mu \leq 9.5 \;\;\;\;\; H_1: \mu > 9.5 $$ Admitindo à partida que a classificação média da disciplina é inferior ou igual a 9.5 (que a \(H_0\) é verdadeira), então uma amostra retirada dum universo com estas características deveria, com uma probabilidade superior, produzir uma média próxima de 9.5 ou inferior. Por conseguinte, se a média amostral for superior a 9.5 então poderá por em causa a hipótese de partida e validar a hipótese alternativa. Consideremos então a situação limite em \(H_0\) e que corresponde a \(\mu = 9.5\). Nesta situação, qual a probabilidade de numa amostra de 25 alunos obtermos, por exemplo, uma média superior a 10 valores? $$ P \left (\bar{X}>10\right ) = P \left ( Z > 0.83 \right ) = 0.2033 $$ Se este nível de probabilidade for suficiente para os nossos objectivos então podemos estabelecer a classificação 10 como valor crítico para a tomada de decisão. Se da amostra resultar uma média superior a 10 valores então podemos dizer que rejeitamos a hipótese de partida, \(H_0\), e provamos \(H_1\) com um nível de significância de 20.33%. No entanto, se não tivermos nenhum valor crítico estabelecido à partida, podemos definir um nível de significância e a partir daí calcular então o valor crítico. Consideremos pois um nível de significância de 10%, ou seja, \(P \left ( Z \geq 1.282 \right ) = 0.1\) e por conseguinte a classificação crítica que estabelece as zonas de rejeição e aceitação seria dado por \(9.5+1.282\times 3/5 = 10.27\) e como a média obtida a partir da amostra selecionada no capítulo anterior é 10.28 poderíamos afirmar que se prova estatisticamente, com uma significância de 10%, que a classificação média da disciplina é superior a 9.5 valores. Este ensaio que acabamos de realizar pode ser representado da seguinte forma:

 

 

2 - Teste do qui-quadrado Considere um banco comercial (BC) que realizou um estudo sobre os seus clientes com o objectivo de determinar se o número de transações nas contas bancárias depende do estado civil dos seus clientes. Na impossibilidade de obter dados para todos os clientes foi seleccionada uma amostra aleatória de 300 clientes, cujos resultados são apresentados na tabela seguinte. $$\newcommand\T{\Rule{0pt}{0.5em}} \begin{array}{|l|c|c|c|c|c|c|}\hline & 0 - 10 & 11 - 20 & 21 - 30 & 31 - 40 & > 40 & Total\\\hline Solteiro & 32 & 26 & 15 & 7 & 2 & 82 \\\hline Casado & 6 & 28 & 34 & 12 & 5 & 85 \\\hline Divorciado & 4 & 11 & 22 & 36 & 44 & 117 \\\hline Outro & 3 & 5 & 3 &3 & 2 & 16 \\\hline Total & 45 & 70 & 74 & 58 & 53 & 300 \\\hline \end{array} $$ Neste teste consideramos, como hipótese verdadeira de partida, que as frequências observadas (\(n_{ij}\)) são iguais às frequências teóricas (\(n_{ij}^*\)) e pretendemos provar o contrário. Portanto \(H_0\): variáveis independentes \(H_1\): variáveis dependentes ou associadas ou seja, \(H_0: n_{ij}=\frac{n_{i.} \times n_{.j}}{n_{..}} \) \(H_1: n_{ij} \neq \frac{n_{i.} \times n_{.j}}{n_{..}} \) Neste caso afirmamos, à partida, que as variáveis são independentes e que a observação da realidade deverá por em causa esta tese de forma a que os valores observados deverão afastar-se significativamente das frequências que teoricamente deveriam ocorrer se a \(H_0\) fosse verdadeira. As frequências teóricas, ou esperadas, são portanto a situação de independência $$\newcommand\T{\Rule{0pt}{0.5em}} \begin{array}{|l|c|c|c|c|c|c|}\hline Estado civil & 0 - 10 & 11 - 20 & 21 - 30 & 31 - 40 & > 40 & Total\\\hline Solteiro & 12.30 & 19.13 & 20.23 & 15.85 & 14.49 & 82 \\\hline Casado & 12.75 & 19.83 & 20.97 & 16.43 & 15.02 & 85 \\\hline Divorciado & 17.55 & 27.30 & 28.86 & 22.62 & 20.67 & 117 \\\hline Outro & 2.4 & 3.73 & 3.95 & 3.09 & 2.83 & 16 \\\hline Total & 45 & 70 & 74 & 58 & 53 & 300 \\\hline \end{array} $$ O Qui-quadrado calculado mede essa distância entre frequências observadas e teóricas $$ \chi ^{2} = \sum_{i=1}^{r}\sum_{j=1}^{s}\frac{(n_{ij}-n_{ij}^{*})^2}{n_{ij}^{*}} = 131.11$$ que comparado com o valor tabelado para \((r-1) \times (s-1)\) graus de liberdade e uma significância de 5% \(\chi_{(4-1)\times(5-1);0.05} ^{2}= 21.0261\) permite provar estatisticamente que as variáveis estão associadas, os clientes solteiros deste banco estão associados com um número de transacções inferior, enquanto os clientes divorciados estão associados com um número de transacções bastante superior, porque o valor calculado é superior ao tabelado. De forma resumida, como \(\chi_{calc}^2 > \chi_{(4-1)\times(5-1);0.05} ^{2} \), \(131.11 > 21.0261\), logo rejeitamos \(H_0\) e aceitamos \(H_1\).