Tabela de conteúdos

Variáveis Aleatórias Discretas

Variáveis Aleatórias Discretas

Introdução

Ao observar um fenômeno aleatório, muitas vezes números podem ser associados aos elementos do espaço amostral. Quando o espaço amostral for finito ou infinito, mas enumerável, é conveniente associar números (em geral no conjunto dos inteiros) aos seus elementos. Veja o exemplo abaixo.

Exemplo: Uma moeda honesta é arremessada duas vezes consecutivas e, consequentemente, o espaço amostral é formado por

Graph

Ao conjunto Graph podemos associar números de uma forma conveniente. Considere X a quantidade de caras obtidas nos dois lançamentos. Deste modo, X é uma função que leva os elementos do espaço amostral aos números reais, mas especificamente ao conjunto Graph.

É mais fácil notar que a variável aleatória é uma função do espaço amostral se adotarmos a notação abaixo:

Graph

Graph

Graph

Dependendo do par de resultados nos dois lançamentos X assume um valor real.

Função discreta de probabilidade

Seja X uma variável aleatória discreta e Graph,…, seus diferentes valores.

A função que atribui a cada valor da variável aleatória sua probabilidade é denominada de função discreta de probabilidade ou, simplesmente, função de probabilidade.

Graph

ou ainda,

Graph

Uma função de probabilidade satisfaz:

Graph e Graph.

As variáveis aleatórias são completamente caracterizadas pela sua função de probabilidade e uma parte importante da Estatística é, justamente, obter para uma dada variável de interesse, a função de probabilidade que melhor represente seu comportamento na população.

Exemplo 3.1: Com dados do último censo, a assistente social de um Centro de Saúde contatou que para as famílias da região, 20% não têm filhos, 30% têm um filho, 35% têm dois e as restantes se dividem igualmente entre três, quatro ou cinco filhos. Suponha que uma família será escolhida, aleatoriamente, nessa região e o número de filhos averiguado.

Definimos N como sendo a variável aleatória número de filhos. Desse modo, estamos sorteando um valor de N dentre 0,1,2,3,4 ou 5.

A função de probabilidade dessa variável segue as informações disponíveis:

Segundo as informações fornecidas, elas são iguais, digamos a p. Utilizando a definição de função discreta de probabilidade, temos que:

Graph

Graph

Graph

Graph

Logo, a função de probabilidade para N é dada pela tabela a seguir:

Graph

Função de Probabilidade de N

Figura 3.1a - Função de Probabilidade para N (Número de Filhos)

Devemos lembrar que probabilidade é uma função cujo comportamento pode ser visualizado em um plano cartesiano, conforme o gráfico exibido na Figura 3.1a.

Função de distribuição de probabilidade

A função de distribuição acumulada de probabilidade é definida como:

Graph

A função F(x) acumula probabilidades até um determinado valor x. Perguntas tais como:

Exemplo 3.5: Uma população de 1000 crianças foi analisada num estudo para determinar a efetividade de uma vacina contra um tipo de alergia. No estudo, as crianças recebiam uma dose da vacina e, após um mês, passavam por um novo teste. Caso ainda tivessem tido alguma reação alérgica, recebiam outra dose da vacina. Ao fim de 5 doses, todas as crianças foram consideradas imunizadas. Os resultados completos estão na tabela a seguir:

Doses12345
freq.abs.24528825614566

Conforme o quadro acima, a variável número de doses recebidas obedece a seguinte lei de probabilidade:

Graph

Uma questão importante para o planejamento do posto de saúde pode ser: qual a probabilidade da criança necessitar no máximo de 2 doses ? Pelos dados levantados na população de 1000 crianças, esta probabilidade será encontrada avaliando-se a funçao de distribuição acumulada no valor Graph. Então:

Graph

Graph

Após o cálculo, verifica-se que a probabilidade de uma criança tomar 2 doses ou menos é igual a 53,3%.

Frequência Esperada x Frequência Observada

Caso haja conhecimento sobre o modelo probabilístico, pode-se avaliar a aderência de dados amostrais à este modelo.

Exemplo 3.6: Num estudo sobre a incidência de câncer foi registrado, para cada paciente com esse diagnóstico, o número de casos de câncer em parentes próximos (pais, irmãos, filhos, primos e sobrinhos). Os dados de 26 pacientes são os seguintes:

Paciente 1234567891011121314151617181920212223242526
Incidência250215333 2 0 1 1 4 5 2 2 3 2 1 5 4 0 0 3 3

Estudos anteriores assumem que a incidência de câncer e, parentes próximos pode ser teoricamente modelada pela seguinte função discreta de probabilidade:

Graph

Os dados observados concordam com o modelo teórico?

Da tabela de dados brutos com as 26 observações, coletamos para cada valor da variável, o número de suas ocorrências. Por outro lado, seguindo o modelo teórico, a frequência esperada é calculada como Graph. A tabela a seguir apresenta os resultados:

Incidência niei
0 4 2,6
1 4 2,6
2 6 7,8
3 6 7,8
4 2 2,6
5 4 2,6
Total 26 26

Frequências observadas x esperadas.

Figura 3.2a: Gráfico de frequências observadas x esperadas.

Notamos da Figura 3.2a que os dados observados seguem a mesma tendência do modelo teórico, porém seus valores são discrepantes. É uma amostra pequena, mas parece não haver boa adaptação entre os dois conjuntos de números.

Principais Modelos Discretos

Algumas variáveis aleatórias aparecem com bastante frequência em situações práticas e justificam um estudo mais aprofundado. Nestes casos, a distribuição de probabilidade pode ser escrita de uma maneira mais compacta, ie, existe uma lei para atribuir probabilidades. Vejamos algumas delas…

Modelo Uniforme Discreto

Seja X uma variável aleatória discreta cujos possíveis valores são representados por Graph.

Dizemos que X segue o modelo Uniforme Discreto se sua função de probabilidade é dada por:

Graph

OBS: Esta expressão realmente representa uma função de probabilidade pois:

Exemplo 3.7: Uma rifa tem 100 bilhetes numerados de 1 a 100. Tenho 5 bilhetes consecutivos numerados de 21 a 25 e meu colega tem outros 5 bilhetes, com os números 1, 11, 29, 68 e 93. Quem tem maior possibilidade de ser sorteado?

Assumindo a honestidade da rifa, todos os números tem a mesma probabilidade de ocorrência, com 1/100 para cada um.

A variável o número sorteado segue o modelo Uniforme e, portanto, eu e meu colega com 5 bilhetes temos a mesma probabilidade de ganhar a rifa.

Segundo o modelo Uniforme a maior ou menor probabilidade de ganhar depende de quantos bilhetes se tem e não da particular escolha do número.

  1. O modelo uniforme é adequado para fenômenos aleatórios com espaço amostral finito.
  2. No modelo uniforme, os eventos elementares do espaço amostral finito têm todos a mesma probabilidade.
  3. Quando não há conhecimento sobre a distribuição de probabilidades, este modelo é o que melhor representa ignorância sobre o fenômeno aleatório pois atribui iguais probabilidades aos elementos de Graph
  4. O gráfico de F(x) da função de distribuição de probabilidades (figura 3.3a) assemelha-se a uma escada em que os degraus tem a mesma altura.

Gráfico da Função de Distribuição de Probabilidade

Figura 3.3a - Função de Distribuição de Probabilidade para Variável Uniforme Discreta(k=6)

Modelo Bernoulli

Em muitas situações práticas a variável de interesse assume somente dois valores:

Estas situações têm alternativas dicotômicas, que genericamente podem ser representadas por respostas do tipo sucesso-fracasso.

Experimentos deste tipo recebem o nome de Ensaios de Bernoulli e dão origem a uma variável aleatória com o mesmo nome.

Dizemos que uma variável X segue o modelo Bernoulli se atribui 0 ou 1 à ocorrência de fracasso ou sucesso, respectivamente.

Com p representando a probabilidade de sucesso, Graph, sua função discreta de probabilidade é dada por:

Graph

OBS: A repetição de ensaios de Bernoulli independentes dá origem à mais importante variável aleatória discreta cujo modelo é denominado Modelo Binomial.

Exemplo 3.8: Sabe-se que a eficiência de uma vacina é de 80%. Um grupo de três indivíduos é sorteado, dentre a população vacinada, e submetido a testes para averiguar se a imunização foi efetiva, evento representado por I.

Consideramos que a escolha dos 3 indivíduos foi feita de uma população muito grande, ie, é como se a escolha tivesse sido com reposição.

Suponha que cada indivíduo escolhido tem probabilidade 0,80 de estar imunizado, independente dos outros indivíduos na população.

Se classificarmos como sucesso a ocorrência de imunização, temos a repetição independente de três ensaios de Bernoulli.

Desejamos estudar o comportamento da variável X: número de indivíduos imunizados nesse grupo

X assume os valores 0, 1, 2, 3 com as seguintes probabilidades:

EventosProbabilidadeX
GraphGraph3
GraphGraph2
GraphGraph2
GraphGraph2
GraphGraph1
GraphGraph1
GraphGraph1
GraphGraph0

A função de probabilidade de X fica então:

Graph

As probabilidade acima podem ser escritas através da expressão:

Graph

em que

Graph.

OBS: Estas probabilidades correspondem aos termos do desenvolvimento em binômio de Newton de Graph, o que justifica o nome escolhido para esse modelo.

Modelo Binomial

Considere a repetição de n ensaios de Bernoulli independentes e todos com a mesma probabilidade de sucesso p.

A variável aleatória X que conta o número total de sucessos é denominada Binomial com parâmetros n e p e a denotaremos por X ~ b(n,p).

Sua função de probabilidade é dada por:

Graph

Frequência Esperada x Frequência Observada

Caso haja conhecimento sobre o modelo probabilístico, novamente pode-se avaliar a aderência de dados amostrais à este modelo.

Exemplo 3.10: Um veterinário está estudando o índice de natalidade em porcos sijeitos à inseminação artificial. Para tal, coletou informações sobre a variável número de filhos nascidos vivos em cada uma das 100 inseminações realizadas com o mesmo reprodutor, N.

N123456789
Freq. Observada1672326211231

Seria interessante estabelecer um modelo probabilístico para a variável de interesse pois isso possibilitaria a comparação de reprodutores.

O veterinário informa que a ocorrência de 11 ou mais filhotes nascidos vivos é rara e pode ser desprezada em termos do modelo.

Traduzindo para a linguagem de modelos, ele sugeriu que a variável N: número de filhotes nascidos vivos poderia ser ajustada pelo modelo Binomial com parâmetros n=10 e p=0,5.

O que você acha da sugestão do veterinário?

Com o modelo sugerido calculamos as probabilidades de cada um dos valores de 0 a 10, e a partir deles, os resultados esperados em 100 inseminações.

Por exemplo:

Graph

Então, segundo o modelo espera-se 11,7 nascimentos com 7 filhotes dentre 100 inseminações.

N012345678910
Freq. Observada0 16 7 23 26 21 12 3 10
Freq. Esperada 0,114,411,720,524,620,511,74,410,1

O modelo proposto parece se ajustar bem aos dados observados e tendemos a acreditar que o modelo Binomial é uma escolha adequada.

Gráfico de frequências-natalidade em porcos.

Figura 3.4: Gráfico de frequências observadas x esperadas-natalidade em porcos.

Outros Modelos Discretos

Os modelos Geométrico, Poisson e Hipergeométrico, têm várias aplicações práticas, conforme ilustram os exemplos desta seção.

Na seção anterior, os modelos definidos assumiram apenas um número finito de valores distintos. Como veremos a seguir, os modelos Geométrico e Poisson podem ter um número infinito de valores dentre os inteiros positivos.

Modelo Geométrico

Dizemos que uma variável aleatória X tem distribuição Geométrica de parâmetro p, ie X ~G(p), se sua função de probabilidade tem a forma

Graph

Interpretando p como a probabilidade de sucesso, a distribuição Geométrica pode ser pensada como o número de ensaios de Bernoulli até o primeiro sucesso.

Exemplo 3.11: Uma linha de produção está sendo analisada para efeito de controle da qualidade das peças produzidas. Tendo em vista o alto padrão requerido, a produção é interrompida para regulagem toda vez que uma peça defeituosa é observada. Se 0,1 é a probabilidade da peça ser defeituosa, estude o comportamento da variável Q, quantidade de peças boas produzidas antes da 1a. defeituosa.

Admitindo que a probabilidade de uma peça ser defeituosa seja constante, independentemente da qualidade das demais.

Sendo a ocorrência de peça defeituosa um sucesso, podemos aplicar o modelo Geométrico.

Observe que o número de peças boas produzidas é exatamente o quanto se "espera" para a ocorrência do primeiro sucesso.

Graph

cuja representação gráfica está na Figura 3.5.

Figura 3.5: Modelo Geométrico (//p//=0,1)

Figura 3.5: Modelo Geométrico (p=0,1).

Modelo Poisson

Uma variável aleatória X tem distribuição de Poisson com parâmetro Graph, ie X ~Po(Graph), se sua função de probabilidade é dada por

Graph com o parâmetro Graph sendo usualmente referido como a taxa de ocorrência ou também a frequência média ou esperada de ocorrências num determinado intervalo de tempo.

Exemplo 3.13: Engenheiros da companhi telefônica estudam se o modelo de Poisson pode ser ajustado ao número N de chamadas interestaduais que chegam por hora a uma central telefônica, durante o período noturno.

Os dados coletados referentes a 650 períodos de uma hora, estão representados a seguir:

N01234567≥8
Freq. Observada93871115125106795057
Freq. Esperada 7,2232,5073,13109,66123,37111,0283,2753,5656,36

Os engenheiros sugerem utilizar uma taxa de ocorrência de 4,5 chamadas por hora no período estudado.

Seguindo o modelo indicado, a frequência esperada de ocorrências com k chamadas é obtida multiplicando 650 pela probabilidade de k chamadas.

Para k=2 por exemplo, temos

Freq. esperada para 2 chamadas=Graph

O ajuste do modelo Poisson com Graph parece razoável.

OBS: Se o intervalo de tempo é alterado, a variável aleatória mantém a mesma distribuição de Poisson, mas com o valor do parâmetro ajustado de forma conveniente. Assim se o período de tempo considerado for por exemplo de duas horas, teremos que o número de chamadas em duas horas terá distribuição Po(9).