====== Variáveis Aleatórias Discretas ======

===== Introdução =====

Ao observar um fenômeno aleatório, muitas vezes números podem ser associados aos elementos do espaço amostral. Quando o espaço amostral for finito ou infinito, mas enumerável, é conveniente associar números (em geral no conjunto dos inteiros) aos seus elementos. Veja o exemplo abaixo.

//Exemplo: Uma moeda honesta é arremessada duas vezes consecutivas e, consequentemente, o espaço amostral é formado por//

<latex>\Omega=\lbrace(c,k),(k,c),(c,c)(k,k)\rbrace</latex>

Ao conjunto <latex>\Omega</latex> podemos associar números de uma forma conveniente. Considere //X// a quantidade de caras obtidas nos dois lançamentos. Deste modo, X é uma função que leva os elementos do espaço amostral aos números reais, mas especificamente ao conjunto <latex> \mathbb{X}=\lbrace0,1,2\rbrace</latex>.

É mais fácil notar que a variável aleatória é uma função do espaço amostral se adotarmos a notação abaixo:

<latex>X(k,k)=0</latex>

<latex>X(c,k)=X(k,c)=1</latex>

<latex>X(c,c)=2</latex>

Dependendo do par de resultados nos dois lançamentos //X// assume um valor real.


  * //X// é denominada de //variável aleatória discreta//, se assume valores num conjunto enumerável, com certa probabilidade; 

  * //X// será denominada //variável aleatória contínua// se seu conjunto de valores é qualquer intervalo dos números reais, o que seria um conjunto não enumerável. Este tipo de variáveis serão tratadas posteriormente no curso.

==== Função discreta de probabilidade ====

Seja //X// uma variável aleatória discreta e <latex>x_1, x_2, x_3</latex>,..., seus diferentes valores.

A função que atribui a cada valor da variável aleatória sua probabilidade é denominada de //função discreta de probabilidade// ou, simplesmente, //função de probabilidade//.

<latex> P(X=x_i)=p(x_i)=p_i, i=1,2,...</latex>

ou ainda, 

<latex>
\begin{tabular}{c|cccc}
$X$&$x_1$&$x_2$&$x_3$&\cdots\\ \hline
$p_i$&$p_1$&$p_2$&$p_3$&\cdots
\end{tabular}
</latex>

Uma função de probabilidade satisfaz:

<latex>0 \leq $p_i$ \leq 1</latex> e <latex> $\sum p_i = 1$</latex>.

As variáveis aleatórias são completamente caracterizadas pela sua função de probabilidade e uma parte importante da Estatística é, justamente, obter para uma dada variável de interesse, a função de probabilidade que melhor represente seu comportamento na população.


//**Exemplo 3.1:** Com dados do último censo, a assistente social de um Centro de Saúde contatou que para as famílias da região, 20% não têm filhos, 30% têm um filho, 35% têm dois e as restantes se dividem igualmente entre três, quatro ou cinco filhos. Suponha que uma família será escolhida, aleatoriamente, nessa região e o número de filhos averiguado.
//

Definimos //N// como sendo a variável aleatória //número de filhos//. Desse modo, estamos sorteando um valor de //N// dentre 0,1,2,3,4 ou 5.


A função de probabilidade dessa variável segue as informações disponíveis:

  * Como 20% das famílias não têm filhos, então a probabilidade de uma família sorteada ao acaso não ter filhos é <latex>$P(N=0)=0,20$</latex>.

  * De forma semelhante, temos que <latex>$P(N=1)=0,30$</latex> e <latex>$P(N=2)=0,35$</latex>.

  * Para completar a caracterização probabilística de //N//, falta obter <latex>$P(N=3)$</latex>, <latex>$P(N=4)$</latex> e <latex>$P(N=5)$</latex>. 

Segundo as informações fornecidas, elas são iguais, digamos a //p//. Utilizando a definição de função discreta de probabilidade, temos que:

<latex>$P(N=0)+P(N=1)+\cdots+P(N=5)=1$</latex>

<latex>0,20+0,30+0,35+$p$+$p$+$p$=1</latex>

<latex>0,85+3$p$=1</latex>

<latex>$p=\frac{0,15}{3}=0,05$</latex>


Logo, a função de probabilidade para //N// é dada pela tabela a seguir:


<latex>
\begin{tabular}{c|cccccc}
$N$&0&1&2&3&4&5\\ \hline
$p_i$&0,20&0,30&0,35&0,05&0,05&0,05
\end{tabular}
</latex>

{{disciplinas:ce067:semana4:graficobarra.jpg|Função de Probabilidade de N}}

//**Figura 3.1a - Função de Probabilidade para N (Número de Filhos)**//

Devemos lembrar que probabilidade é uma função cujo comportamento pode ser visualizado em um plano cartesiano, conforme o gráfico exibido na Figura 3.1a.

==== Função de distribuição de probabilidade ====

A função de distribuição acumulada de probabilidade é definida como:

<latex>
F(x)=P(X \leq x)
</latex>

A função //F(x)// acumula probabilidades até um determinado valor //x//. Perguntas tais como:

  * Qual a probabilidade de ocorrência de valores menores ou iguais a dois no lançamento de um dado?
  * Qual a probabilidade de encontrar uma família com dois filhos ou menos em uma determinada localização ?
  * Qual a probabilidade de realizar 4 lançamentos, ou menos, de uma moeda honesta até a obtenção da primeira cara ?

//**Exemplo 3.5:** Uma população de 1000 crianças foi analisada num estudo para determinar a efetividade de uma vacina contra um tipo de alergia. No estudo, as crianças recebiam uma dose da vacina e, após um mês, passavam por um novo teste. Caso ainda tivessem tido alguma reação alérgica, recebiam outra dose da vacina. Ao fim de 5 doses, todas as crianças foram consideradas imunizadas. Os resultados completos estão na tabela a seguir:
//

|Doses|1|2|3|4|5|
|freq.abs.|245|288|256|145|66|

Conforme o quadro acima, a variável //número de doses recebidas// obedece a seguinte lei de probabilidade:

<latex>
\begin{tabular}{c|ccccc}
$Doses$&1&2&3&4&5\\ \hline
$p_i$&0,245&0,288&0,256&0,145&0,066
\end{tabular}
</latex>

Uma questão importante para o planejamento do posto de saúde pode ser: //qual a probabilidade da criança necessitar no máximo de 2 doses ?// Pelos dados levantados na população de 1000 crianças, esta probabilidade será encontrada avaliando-se a funçao de distribuição acumulada no valor <latex>x=2</latex>. Então:

<latex> F(2)=P(X \leq 2) = P(X=1)+P(X=2) </latex>

<latex> F(2)=0,245+0,288 = 0,533 </latex>

Após o cálculo, verifica-se que a probabilidade de uma criança tomar 2 doses ou menos é igual a 53,3%.

=== Frequência Esperada x Frequência Observada ===

Caso haja conhecimento sobre o modelo probabilístico, pode-se avaliar a //aderência// de dados amostrais à este modelo. 

//**Exemplo 3.6:** Num estudo sobre a incidência de câncer foi registrado, para cada paciente com esse diagnóstico, o número de casos de câncer em parentes próximos (pais, irmãos, filhos, primos e sobrinhos). Os dados de 26 pacientes são os seguintes:
//

|Paciente  |1|2|3|4|5|6|7|8|9|10|11|12|13|14|15|16|17|18|19|20|21|22|23|24|25|26|
|Incidência|2|5|0|2|1|5|3|3|3| 2| 0| 1| 1| 4| 5| 2| 2| 3| 2| 1| 5| 4| 0| 0| 3| 3|

Estudos anteriores assumem que a incidência de câncer e, parentes próximos pode ser teoricamente modelada pela seguinte função discreta de probabilidade:


<latex>
\begin{tabular}{c|cccccc}
$Incidência$&0&1&2&3&4&5\\ \hline
$p_i$&0,1&0,1&0,3&0,3&0,1&0,1
\end{tabular}
</latex>

Os dados observados concordam com o modelo teórico?

Da tabela de dados brutos com as 26 observações, coletamos para cada valor da variável, o número de suas ocorrências. Por outro lado, seguindo o modelo  teórico, a frequência esperada é calculada como <latex> $e_i=26 \times p_i$</latex>. A tabela a seguir apresenta os resultados:


|Incidência  |//n<sub>i</sub>//|//e<sub>i</sub>//|
|0           |4                |2,6|
|1           |4                |2,6|
|2           |6                |7,8|
|3           |6                |7,8|
|4           |2                |2,6|
|5           |4                |2,6|
|Total       |26               |26 |


{{disciplinas:ce067:semana4:figpag66.jpg|Frequências observadas x esperadas.}}

//**Figura 3.2a: Gráfico de frequências observadas x esperadas.**//

Notamos da Figura 3.2a que os dados observados seguem a mesma tendência do modelo teórico, porém seus valores são discrepantes. É uma amostra pequena, mas parece não haver boa adaptação entre os dois conjuntos de números.

===== Principais Modelos Discretos =====

Algumas variáveis aleatórias aparecem com bastante frequência em situações práticas e justificam um estudo mais aprofundado. Nestes casos, a distribuição de probabilidade pode ser escrita de uma maneira mais compacta, ie, existe uma lei para atribuir probabilidades. Vejamos algumas delas...

 
==== Modelo Uniforme Discreto ====

Seja //X// uma variável aleatória discreta cujos possíveis valores são representados por <latex>$x_1,x_2,x_3,\cdots,x_k$</latex>. 

Dizemos que //X// segue o modelo //Uniforme Discreto// se sua função de probabilidade é dada por:

<latex>
\begin{equation*}
P(X=x_j)=\frac{1}{k}, \forall j =1,2,3,\cdots,k.
\end{equation*}
</latex>

**OBS**: Esta expressão realmente representa uma função de probabilidade pois:

  * seus valores estão no intervalo [0,1];
  * a soma de todas as probabilidades é igual a 1.


//**Exemplo 3.7:** Uma rifa tem 100 bilhetes numerados de 1 a 100. Tenho 5 bilhetes consecutivos numerados de 21 a 25 e meu colega tem outros 5 bilhetes, com os números 1, 11, 29, 68 e 93. Quem tem maior possibilidade de ser sorteado?
//

Assumindo a honestidade da rifa, todos os números tem a mesma probabilidade de ocorrência, com 1/100 para cada um.

A variável o //número sorteado// segue o modelo Uniforme e, portanto, eu e meu colega com 5 bilhetes temos a mesma probabilidade de ganhar a rifa.

Segundo o modelo Uniforme a maior ou menor probabilidade de ganhar depende de quantos bilhetes se tem e não da particular escolha do número.

  * Comentários
  - O modelo uniforme é adequado para fenômenos aleatórios com espaço amostral finito.
  - No modelo uniforme, os eventos elementares do espaço amostral finito têm todos a mesma probabilidade.
  - Quando não há conhecimento sobre a distribuição de probabilidades, este modelo é o que melhor representa ignorância sobre o fenômeno aleatório pois atribui iguais probabilidades aos elementos de <latex>\Omega</latex>
  - O gráfico de F(x) da função de distribuição de probabilidades (figura 3.3a) assemelha-se a uma escada em que os degraus tem a mesma altura.


{{disciplinas:ce067:semana4:facunidisc.jpg|Gráfico da Função de Distribuição de Probabilidade }}

//**Figura 3.3a - Função de Distribuição de Probabilidade para Variável Uniforme Discreta(k=6)**//

==== Modelo Bernoulli ====

Em muitas situações práticas a variável de interesse assume somente dois valores:

  * uma peça é classificada como boa ou defeituosa;
  * o entrevistado concorda ou não com a afirmação feita;
  * a vacina imunizou ou não a criança.

Estas situações têm alternativas dicotômicas, que genericamente podem ser representadas por respostas do tipo //sucesso-fracasso//.

Experimentos deste tipo recebem o nome de //Ensaios de Bernoulli// e dão origem a uma variável aleatória com o mesmo nome.

Dizemos que uma variável //X// segue o modelo Bernoulli se atribui 0 ou 1 à ocorrência de fracasso ou sucesso, respectivamente. 

Com //p// representando a probabilidade de //sucesso//, <latex> $0 \leq p \leq 1$</latex>, sua função discreta de probabilidade é dada por:

<latex>
\begin{equation*}
P(X=x)=p^x(1-p)^{1-x}, x=0,1.
\end{equation*}
</latex>

**OBS:** A repetição de ensaios de Bernoulli independentes dá origem à mais importante variável aleatória discreta cujo modelo é denominado //Modelo Binomial//.

//**Exemplo 3.8:** Sabe-se que a eficiência de uma vacina é de 80%. Um grupo de três indivíduos é sorteado, dentre a população vacinada, e submetido a testes para averiguar se a imunização foi efetiva, evento representado por //I//.
//

Consideramos que a escolha dos 3 indivíduos foi feita de uma população muito grande, ie, é como se a escolha tivesse sido com reposição.

Suponha que cada indivíduo escolhido tem probabilidade 0,80 de estar imunizado, independente dos outros indivíduos na população.

Se classificarmos como sucesso a ocorrência de imunização, temos a repetição independente de três ensaios de Bernoulli.

Desejamos estudar o comportamento da variável //X//: número de indivíduos imunizados nesse grupo 

//X// assume os valores 0, 1, 2, 3 com as seguintes probabilidades:

|Eventos|Probabilidade|//X//|
|<latex>$III$</latex>|<latex>$0,8^3$</latex>|3|
|<latex>$III^c$</latex>|<latex>$0,8^2 \times 0,2$</latex>|2|
|<latex>$II^cI$</latex>|<latex>$0,8^2 \times 0,2$</latex>|2|
|<latex>$I^cII$</latex>|<latex>$0,8^2 \times 0,2$</latex>|2|
|<latex>$II^cI^c$</latex>|<latex>$0,8 \times 0,2^2$</latex>|1|
|<latex>$I^cII^c$</latex>|<latex>$0,8 \times 0,2^2$</latex>|1|
|<latex>$I^cI^cI$</latex>|<latex>$0,8 \times 0,2^2$</latex>|1|
|<latex>$I^cI^cI^c$</latex>|<latex>$0,2^3$</latex>|0|

A função de probabilidade de //X// fica então:

<latex>
\begin{tabular}{c|cccc}
$X$&0&1&2&3\\ \hline
$p_i$&$0,2^3$&$3 \times 0,8 \times 0,2^2$&$3 \times 0,8^2 \times 0,2$&$0,8^3$
\end{tabular}
</latex>

As probabilidade acima podem ser escritas através da expressão:

<latex>
\begin{equation*}
P(X=k)=\left(\begin{array}{c}3\\
                             k
             \end{array}\right) \times 0,8^k \times 0,2^{3-k}, k=0,1,2,3.
\end{equation*}
</latex>

em que 

<latex>$\left(\begin{array}{c}3\\k\end{array}\right)=\frac{3!}{k!(3-k)!}$</latex>.

**OBS:** Estas probabilidades correspondem aos termos do desenvolvimento em binômio de Newton de <latex>$(0,8+0,2)^3$</latex>, o que justifica o nome escolhido para esse modelo.

==== Modelo Binomial ====

Considere a repetição de //n// ensaios de Bernoulli independentes e todos com a mesma probabilidade de sucesso //p//.

A variável aleatória //X// que conta o número total de sucessos é denominada Binomial com parâmetros //n// e //p// e a   denotaremos por //X ~ b(n,p)//. 

Sua função de probabilidade é dada por:

<latex>
\begin{equation*}
P(X=k)=\left(\begin{array}{c}n\\
                             k
             \end{array}\right) \times p^k \times (1-p)^{n-k}, k=0,1,2,\cdots,n.
\end{equation*}
</latex>

=== Frequência Esperada x Frequência Observada ===

Caso haja conhecimento sobre o modelo probabilístico, novamente pode-se avaliar a //aderência// de dados amostrais à este modelo. 

//**Exemplo 3.10:** Um veterinário está estudando o índice de natalidade em porcos sijeitos à inseminação artificial. Para tal, coletou informações sobre a variável número de filhos nascidos vivos em cada uma das 100 inseminações realizadas com o mesmo reprodutor, N.
//

|N|1|2|3|4|5|6|7|8|9|
|Freq. Observada|1|6|7|23|26|21|12|3|1|

Seria interessante estabelecer um modelo probabilístico para a variável de interesse pois isso possibilitaria a comparação de reprodutores.

O veterinário informa que a ocorrência de 11 ou mais filhotes nascidos vivos é rara e pode ser desprezada em termos do modelo.

Traduzindo para a linguagem de modelos, ele sugeriu que a variável //N: número de filhotes nascidos vivos// poderia ser ajustada pelo modelo Binomial com parâmetros //n=10// e //p=0,5//. 

O que você acha da sugestão do veterinário?

Com o modelo sugerido calculamos as probabilidades de cada um dos valores de 0 a 10, e a partir deles, os resultados esperados em 100 inseminações.

Por exemplo:

<latex>
\begin{equation*}
P(N=7)=\left(\begin{array}{c}10\\
                             7
             \end{array}\right) \times 0,5^7 \times (1-0,5)^{10-7}=0,117
\end{equation*}
</latex>

Então, segundo o modelo espera-se 11,7 nascimentos com 7 filhotes dentre 100 inseminações.

|N|0|1|2|3|4|5|6|7|8|9|10|
|Freq. Observada|0  |1|6  |7   |23  |26  |21  |12  |3  |1|0  |
|Freq. Esperada |0,1|1|4,4|11,7|20,5|24,6|20,5|11,7|4,4|1|0,1|

O modelo proposto parece se ajustar bem aos dados observados e tendemos a acreditar que o modelo Binomial é uma escolha adequada.

{{disciplinas:ce067:semana4:fig3.4.jpg|Gráfico de frequências-natalidade em porcos.}}

//**Figura 3.4: Gráfico de frequências observadas x esperadas-natalidade em porcos.**//

===== Outros Modelos Discretos =====

Os modelos //Geométrico//, //Poisson// e //Hipergeométrico//, têm várias aplicações práticas, conforme ilustram os exemplos desta seção.

Na seção anterior, os modelos definidos assumiram apenas um número finito de valores distintos. Como veremos a seguir, os modelos Geométrico e Poisson podem ter um número infinito de valores dentre os inteiros positivos.

==== Modelo Geométrico ====

Dizemos que uma variável aleatória //X// tem distribuição Geométrica de parâmetro //p//, ie //X ~G(p)//, se sua função de probabilidade tem a forma

<latex>
\begin{equation*}
P(X=k)= p(1-p)^k, 0 \leq p \leq 1, k=0,1,2,\cdots.
\end{equation*}
</latex>

Interpretando //p// como a probabilidade de sucesso, a distribuição Geométrica pode ser pensada como o número de ensaios de Bernoulli até o primeiro sucesso.

//**Exemplo 3.11:** Uma linha de produção está sendo analisada para efeito de controle da qualidade das peças produzidas. Tendo em vista o alto padrão requerido, a produção é interrompida para regulagem toda vez que uma peça defeituosa é observada. Se 0,1 é a probabilidade da peça ser defeituosa, estude o comportamento da variável Q, quantidade de peças boas produzidas antes da 1a. defeituosa.//

Admitindo que a probabilidade de uma peça ser defeituosa seja constante, independentemente da qualidade das demais. 

Sendo a ocorrência de peça defeituosa um sucesso, podemos aplicar o modelo Geométrico. 

Observe que o número de peças boas produzidas é exatamente o quanto se "espera" para a ocorrência do primeiro sucesso.

<latex>
\begin{equation*}
P(Q=k)= 0,1 \times (1-0,1)^k, k=0,1,2,\cdots,
\end{equation*}
</latex>

cuja representação gráfica está na Figura 3.5.

{{disciplinas:ce067:semana4:fig3.5.jpg|Figura 3.5: Modelo Geométrico (//p//=0,1)}}

//**Figura 3.5: Modelo Geométrico (p=0,1).**//


==== Modelo Poisson ====

Uma variável aleatória //X// tem distribuição de Poisson com parâmetro <latex>$\lambda > 0$</latex>, ie //X// ~Po(<latex>\lambda</latex>), se sua função de probabilidade é dada por

<latex>
\begin{equation*}
P(X=k)= \frac{e^{-\lambda}\lambda^k}{k!}, k=0,1,2,\cdots,
\end{equation*}
</latex>
com o parâmetro <latex>\lambda</latex> sendo usualmente referido como a //taxa de ocorrência// ou também a frequência média ou esperada de ocorrências num determinado intervalo de tempo. 


//**Exemplo 3.13:** Engenheiros da companhi telefônica estudam se o modelo de Poisson pode ser ajustado ao número N de chamadas interestaduais que chegam por hora a uma central telefônica, durante o período noturno.//

Os dados coletados referentes a 650 períodos de uma hora, estão representados a seguir:

|N|0|1|2|3|4|5|6|7|≥8|
|Freq. Observada|9|38|71|115|125|106|79|50|57|
|Freq. Esperada |7,22|32,50|73,13|109,66|123,37|111,02|83,27|53,56|56,36|

Os engenheiros sugerem utilizar uma taxa de ocorrência de 4,5 chamadas por hora no período estudado.

Seguindo o modelo indicado, a frequência esperada de ocorrências com //k// chamadas é obtida multiplicando 650 pela probabilidade de //k// chamadas.

Para //k=2// por exemplo, temos 

Freq. esperada para 2 chamadas=<latex>650 \times P(N=2)=650 \times \frac{e^{-4,5}4,5^2}{2!}=73,13</latex>

O ajuste do modelo Poisson com <latex>\lambda=4,5</latex> parece razoável.

OBS: Se o intervalo de tempo é alterado, a variável aleatória mantém a mesma distribuição de Poisson, mas com o valor do parâmetro ajustado de forma conveniente. Assim se o período de tempo considerado for por exemplo de duas horas, teremos que o número de chamadas em duas horas terá distribuição //Po(9)//.