====== Probabilidades ======
===== Introdução =====
Na semana anterior, foram enfatizados alguns conceitos relacionados à //estatística
descritiva //. Nesta semana, será apresentada a base teórica para muitas técnicas
estatísticas de caráter inferencial.
Para entender a motivação em estudar o cálculo de probabilidades, imagine que um pesquisador selecione uma amostra de pacientes e registrou a idade e pressão arterial. Com base nesta amostra, ele identificou uma relação entre estas duas variáveis. O pesquisador pensa em estender as conclusões do seu estudo para outros pacientes, ou seja, fazer inferência. Neste exemplo específico, cabe a pergunta: a relação entre pressão e idade encontrada se deu ao acaso, ou há fortes indícios de que ela seja verdadeira ? A resposta à esta pergunta estará baseada no cálculo de probabilidades.
O //cálculo de probabilidades// é um importante ramo da teoria matemática, desenvolvido a partir da resolução de problemas em jogos de azar, que se destina a estudar //fenômenos aleatórios//. Estes fenômenos representam situações ou acontecimentos sobre os quais não há como predizer seus resultados. O cotidiano está repleto de fenômenos aleatórios. Veja por exemplo o resultado do //lançamento de uma moeda//, o //tempo de espera em uma fila de banco// e o //retorno de um investimento// de rentabilidade variável. Em todas estas situações, não é possível predizer com absoluta certeza qual será o resultado final.
----
==== Espaço Amostral ====
O conjunto Ω de todos os possíveis resultados de um fenômeno aleatório é chamado
espaço amostral.
Veja alguns exemplos de fenômenos aleatórios e espaços amostrais:
* Lançamento de um dado honesto: Ω={1,2,3,4,5,6}
* Lançamento de uma moeda honesta: Ω={cara,coroa}
* Horário de ocorrência de queda de energia durante o dia Ω=(0h,24h)
Nos exemplos acima, os dois primeiros conjuntos são finitos, enquanto o terceiro contém infinitos elementos,por se tratar de um intervalo. Esta será uma importante classificação para os espaços amostrais: finitos e infinitos.
Veja a lista de outros {{disciplinas:ce067:semana3:fenomenosaleatorios.pdf|fenômenos aleatórios}} presentes em nosso cotidiano.
----
==== Eventos ====
Os subconjuntos de Ω são chamados de eventos e, geralmente, representados
por letras maiúsculas do alfabeto; A,B,C,...
Considere alguns eventos relacionados aos espaços amostrais descritos anteriormente:
* Evento A: Números pares obtidos em um lançamento de dado honesto.
A=\left\lbrace2,4,6\right\rbrace
* Evento B: Números primos obtidos em um lançamento de dado honesto.
B=\left\lbrace 1,2,3,5\right\rbrace
* Evento C :Horário de ocorrência de queda de energia no período da manhã situado entre 6:00h as 12:00h
C =\left(6h,12h\right)
, alternativamente:
C =\left\lbrace t \in \mathbb{R} :0
Ressalta-se que ao lidarmos com eventos, estamos lidando com conjuntos e, por isto, é importante conhecimento sobre a Teoria dos Conjuntos, principalmente suas operações básicas (união, interseção,complemento,...).
Alguns importantes {{disciplinas:ce067:semana3:teoriaconjuntos.pdf|conceitos na Teoria dos Conjuntos}}
----
==== Probabilidade ====
É uma função P(.) que associa números reais aos elementos do espaço amostral e satisfaz os 3
axiomas:
- 0 \leq P(A) \leq 1
- P(\Omega)=1
- P(\cup_{j=1}^{n}A_{j})=\sum_{j=1}^n P(A_{j}) para A_1,A_2,...,A_n disjuntos.
Dois eventos A e B são disjuntos se A ∩ B = \emptyset
A função P(.) faz um mapeamento de conjuntos em números reais.
Uma importante questão é a atribuição das probabilidades aos elementos do espaço amostral. Duas abordagens são comuns: atribuição //a priori// e //a posteriori//.
**//A priori//** :Considere um espaço amostral com n eventos elementares
\Omega=\lbrace A_{1},A_{2},\ldots,A_{n}\rbrace
caso não haja justificativas para atribuir maior probabilidade a um determinado ponto, é natural imaginar que as chances estão igualmente distribuídas nestes n eventos e, portanto:
P(A_{i})=\displaystyle \frac{1}{n}
para //i=1,2,...,n//.
A atribuição de probabilidades a priori é feita quando se há conhecimento sobre as características físicas do experimento, como por exemplo no lançamento da moeda e do dado. Por outro lado, se não há conhecimento
sobre as chances do eventos no espaço amostral, as probabilidades são atribuídas após repetidas observações do fenômeno aleatório.
----
//**Exemplo**: Ao lançar um dado e observar o resultado obtido na face superior, as características físicas do experimento nos levam a atribuir probabilidades do seguinte modo://
\Omega=\lbrace1,2,3,4,5,6\rbrace\
P(A_{1})=P(A_{2})=P(A_{3})=P(A_{4})=P(A_{5})=P(A_{6})=\displaystyle\frac{1}{6}
e nesta situação, as probabilidades são atribuídas a priori.
----
**//A posteriori//** : Quando não há conhecimento a priori das probabilidades, elas podem ser atribuídas através da experimentação. Observe o exemplo abaixo:
----
//**Exemplo**: Seja a inspeção de peças em um processo de fabricação e os seguintes eventos A={Peça Defeituosa} e B ={Peça Perfeita}. Após inspecionar 1000 peças, verificou-se que 350 eram defeituosas. A partir deste experimento, ao selecionar aleatóriamente uma peça, pode-se atribuir as seguintes probabilidades//:
P(A)=\displaystyle\frac{350}{1000}=0,35
P(B)=\displaystyle\frac{650}{1000}=0,65
que são calculadas a posteriori, pela frequência de situações favoráveis
em relação aos casos possíveis.
----
====Regra da Adição de Probabilidades ====
A probabilidade da união de eventos é calculada através da regra da adição conforme
a equação abaixo.
P(A \cup B)=P(A)+P(B)-P(A \cap B)
[[http://www.math.uah.edu/stat/applets/VennGame.xhtml| Ilustração pelo Diagrama de Venn]]
----
===== Probabilidade Condicional e Independência =====
Existem situações em que a ocorrência de um determinado evento B altera
a chance de ocorrência de outro evento A. A informação da ocorrência do
evento B traz um ganho de informação e a probabilidade de A pode ser "recalculada".
A probabilidade condicional é definida conforme a equação abaixo :
P(A|B)=\displaystyle\frac{P(A\cap B)}{P(B)}~,P(B)>0
É comum a leitura da expressão acima como "probabilidade de A dado (a ocorrência) B".
----
==== Regra do Produto de Probabilidades ====
P(A\cap B)=P(A|B)P(B)
----
==== Independência de Eventos ====
P(A|B) = P(A), ~P(B) >0
Se a ocorrência do evento B não altera a probabilidade de ocorrência do evento A, os eventos A e B são ditos serem independentes. A partir dos resultados apresentados acima, torna-se direta a verificação de que:
P(A\cap B)=P(A)P(B)
se A e B são eventos independentes.
//
Exemplo: Sejam dois lançamentos consecutivos de uma moeda honesta e a observação das faces superiores. Considere
os eventos A={cara no primeiro lançamento} e B={cara no segundo lançamento}. Pelas características deste experimento, o resultado do primeiro lançamento não deve causar interferência na probabilidade de ocorrência de cara no segundo lançamento. De fato A e B são independentes e, portanto:
//
P(A\cap B)=P(A)P(B)=\displaystyle \frac{1}{2} \times \displaystyle \frac{1}{2}=\displaystyle \frac{1}{4}
Veja o artigo : [[http://www.rsscse.org.uk/ts/gtb/tomlinson.pdf|Entendendo Probabilidades Condicionais]]
Na área biológica existem vários exemplos de //eventos dependentes// e //eventos independentes//. Assim, //olhos claros// e //cabelos claros// são dois eventos dependentes porque a probabilidade de uma pessoa ter olhos claros é maior se a pessoa tem cabelos claros. Já "olhos claros" e "idade avançada" são eventos independentes pois um não modifica a probabilidade do outro.
----
==== Partição do Espaço Amostral ====
No Cálculo de Probabilidades, um conjunto de eventos que sejam mutuamente exclusivos entre si, ou seja, não tenham interseção e cuja união gere o espaço amostral irá constituir uma //partição do espaço amostral//. No trivial exemplo do lançamento de um dado honesto e observação da face superior, os eventos:
A_1=\lbrace 1 \rbrace,A_2=\lbrace 2 \rbrace,A_3=\lbrace 3 \rbrace,A_4=\lbrace 4 \rbrace,A_5=\lbrace 5 \rbrace,A_6=\lbrace 6\rbrace
formam uma partição trivial do espaço amostral. Eles não tem interseção entre si, ou seja, não posso obter ao mesmo tempo 1 e 6 no lançamento de um dado, e a união entre eles reconstitui o próprio espaço amostral.
\cup_{i=1}^6 A_i=\Omega
Para o mesmo fenômeno aleatório (face superior no lançamento de um dado honesto) existem outras formas de particionar o espaço amostral. Verifique, por exemplo, os eventos :
B_1=\lbrace \text{Números Pares}\rbrace = \lbrace 2,4,6 \rbrace
B_2=\lbrace \text{Números Ímpares} \rbrace = \lbrace 1,3,5 \rbrace
também formam uma partição do espaço amostral pois :
* B_1 \cup B_2 = \Omega
* não há interseção entre eles
Caso haja conhecimento das probabilidades dos eventos que formam a partição, este fato pode auxiliar o cálculo de probabilidades de outros eventos conforme o exemplo abaixo.
----
//**Exemplo**: Em um determinado banco, 20 % dos clientes pertencem à classe social A, 40 % à classe social B, 20 % à C e o restante à classe D.
Portanto, Considerando os eventos: A = {pertencer a classe social A}, B={pertencer a classe social B}, C = {pertencer a classe social C} e D = {pertencer a classe social D}.: P(A)=0,20;P(B)=0,40;P(C)=0,20;P(D)=0,20
a situação de inadimplência ocorre nas classes sociais de acordo com os seguintes percentuais ://
Tabela 2.1 - Inadimplência dentro das classes sociais
\begin{tabular}{ccccc} \hline \hline
&\multicolumn{4}{c}{Classe Social} \\
situação & A & B & C & D \\
\hline
Inadimplência & 5\% & 30\% & 20\% & 60\% \\
Adimplência & 95\% & 70 \% & 80\% & 40\% \\
\hline
\end{tabular}
// As informações desta tabela correspondem à probabilidades condicionais. Condicional ao fato de que o cliente pertence a classe A, sua probabilidade de inadimplência é 0,05.//
//Com estes dados, qual a probabilidade de sortear um cliente inadimplente ? //
Note que no exemplo acima, as classes sociais formam a partição do espaço amostral constituído pelos
clientes do banco. As probabilidades de cada elemento da partição também são conhecidas, mas a probabilidade de um cliente ser inadimplente, independentemente de sua classe social, ainda não é conhecida, devendo ser calculada.
Considere o evento I = {cliente inadimplente}. O cliente inadimplente deve obrigatoriamente pertencer a uma das classes sociais e, não pode pertencer a mais do que uma. Logo, a probabilidade de I pode ser expressa como :
P(I)=P(I\cap A)+P(I\cap B)+P(I\cap C)+P(I\cap D)
Entretanto, pela definição de probabilidade condicional, podemos re-expressar a probabilidade acima como:
P(I)=P(I|A)P(A)+P(I|B)P(B)+P(I|C)P(C)+P(I|D)P(D)
As probabilidades acima são todas conhecidas pois P(I|A),P(I|B),P(I|C) ~\text{e}~ P(I|D) são probabilidades de inadimplência condicionais ao conhecimento da classe social e foram fornecidas na Tabela 2.1.
Substituindo as respectivas probabilidades, a probabilidade de inadimplência será:
P(I) =(0,05*0,2)+(0,3*0,4)+(0,2*0,2)+(0,6*0,2)=0,29
Conforme o cálculo acima, a probabilidade de sortear um cliente e este ser inadimplente é de 29 %.
----
A solução do problema acima, calcular a probabilidade de sortear este cliente e este ser inadimplente, foi encontrada mediante a utilização do chamado Teorema da Probabilidade Total. Abaixo enunciamos este teorema.
=== Teorema da Probabilidade Total ===
Seja uma partição do espaço amostral \Omega:
C_1,C_2,\ldots,C_n
Para qualquer evento A pertencente a este espaço amostral, podemos escrever sua probabilidade como :
P(A)=P(A\cap C_1)+P(A \cap C_2)+\ldots+P(A \cap C_n)
e usando a definição de probabilidade condicional;
P(A)=P(A|C_1)P(C_1)+P(A|C_2)P(C_2)+\ldots+P(A|C_n)P(C_n)
----
==== Teorema de Bayes ====
A razão entre as probabilidades condicionais é a mesma razão entre as probabilidades incondicionais.
\displaystyle \frac{P(A|B)}{P(B|A)} = \displaystyle \frac{P(A)}{P(B)}
Este resultado é geralmente expresso como:
P(B|A) = \displaystyle \frac{P(A|B)P(B)}{P(A)}
Considere uma partição C1,C2,...,Cn do espaço amostral Ω. A probabilidade condicional de um determinado elemento desta partição pode ser escrita como:
P(C_j|A) = \displaystyle \frac{P(A|C_j)P(C_j)}{P(A|C_1)P(C_1)+P(A|C_2)P(C_2)+\ldots+P(A|C_n)P(C_n)}
que corresponde a enunciação geral do Teorema de Bayes.
Veja aplicação de probabilidade em saúde: [[http://www.leg.ufpr.br/~silvia/CE055/node33.html|Avaliação da qualidade de testes diagnósticos]]
----