Não foi possível enviar o arquivo. Será algum problema com as permissões?
Diferenças
Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior | |||
disciplinas:ce067:teoricas:bidimensional [2008/02/22 17:18] silvia |
disciplinas:ce067:teoricas:bidimensional [2008/02/22 17:26] (atual) silvia |
||
---|---|---|---|
Linha 43: | Linha 43: | ||
A linha dos totais fornece a distribuição da variável Y, ao passo que a coluna dos totais fornece a distribuição da variável V. A distribuições assim obtidas são chamadas tecnicamente de distribuições marginais, enquanto o conteúdo da tabela constitui a distribuição conjunta de Y e V. | A linha dos totais fornece a distribuição da variável Y, ao passo que a coluna dos totais fornece a distribuição da variável V. A distribuições assim obtidas são chamadas tecnicamente de distribuições marginais, enquanto o conteúdo da tabela constitui a distribuição conjunta de Y e V. | ||
+ | ===== Associação entre variáveis quantitativas ===== | ||
+ | |||
+ | Uma das questões que é levantada entre pesquisadores de diversas áreas diz respeito a associação entre variáveis. Veja alguns casos: | ||
+ | |||
+ | * A velocidade do atleta está associada com sua massa muscular ? | ||
+ | * A venda diária de refrigerantes está associada a temperatura máxima ? | ||
+ | * A nota de matemática de um aluno está associada a sua nota em física ? | ||
+ | |||
+ | //**Exemplo 5.3:** Dentre os alunos do 1o ano do ensino médio de uma certa escola, selecionou-se os quinze alunos com melhor desempenho (nota acima de 7) em inglês. Veja na tabela abaixo as notas em inglês, português e matemática destes quinze alunos.// | ||
+ | |||
+ | <latex> | ||
+ | \begin{tabular}{c|ccc} \hline | ||
+ | & & Notas\\ | ||
+ | Aluno & Inglês & Português & Matemática\\ \hline | ||
+ | 1 & 7 & 8 & 5 \\ | ||
+ | 2 & 7 & 6 & 6 \\ | ||
+ | 3 & 7 & 8 & 7 \\ | ||
+ | 4 & 7 & 9 & 5 \\ | ||
+ | 5 & 8 & 8 & 5 \\ | ||
+ | 6 & 8 & 6 & 5 \\ | ||
+ | 7 & 8 & 9 & 6 \\ | ||
+ | 8 & 8 & 7 & 4 \\ | ||
+ | 9 & 8 & 7 & 7 \\ | ||
+ | 10 & 8 & 6 & 6 \\ | ||
+ | 11 & 8 & 7 & 5 \\ | ||
+ | 12 & 9 & 8 & 5 \\ | ||
+ | 13 & 9 & 9 & 6 \\ | ||
+ | 14 & 9 & 8 & 5 \\ | ||
+ | 15 & 10 & 8 & 5 \\ \hline | ||
+ | \end{tabular} | ||
+ | </latex> | ||
+ | |||
+ | Para uma análise inicial da associação entre duas variáveis quantitativas, o **diagrama de dispersão** é a ferramenta indicada. O diagrama de dispersão consiste em exibir no plano cartesiano os pares de valores observados para duas variáveis quantitativas. | ||
+ | |||
+ | {{disciplinas:ce067:semana7:fig5_1.jpg|Fig 5.1 - Diagrama de dispersao entre notas de inglês e português}} | ||
+ | |||
+ | **Figura 5.1- Diagrama de dispersão entre notas de inglês e português** | ||
+ | |||
+ | Na Figura 5.1 é apresentado um diagrama de dispersão entre as notas de inglês e as notas de português dos 15 alunos. A reta tracejada indica qual seria o comportamento teórico se a associação entre as duas notas fosse perfeita, ou seja, se o alunos tivessem obtido as mesmas notas em português e inglês. A reta é referência para avaliar o comportamento dos alunos. Aqueles que tiveram desempenho melhor em português do que inglês estão acima da reta e os outros, que tiveram melhor desempenho em inglês, estão abaixo da reta. | ||
+ | |||
+ | {{disciplinas:ce067:semana7:fig5_2.jpg|Fig 5.1 - Diagrama de dispersao entre notas de inglês e matemática}} | ||
+ | |||
+ | **Figura 5.2- Diagrama de dispersão entre notas de inglês e matemática** | ||
+ | |||
+ | Um novo diagrama de dispersão (Figura 5.2) ilustra a associação entre as notas de inglês e matemática. Nesta figura, revela-se a tendência dos alunos com bom desempenho em inglês apresentarem mau desempenho em matemática. | ||
+ | |||
+ | Embora o diagrama de dispersão seja uma importante ferramenta para visualizar a associação entre duas variáveis quantitativas, há algumas limitações no seu uso. Para citar uma delas, se no conjunto de dados o par (x,y) é repetido várias vezes, este fato não é ilustrado no diagrama de dispersão, a menos da utilização de uma intervenção gráfica como registrar o número de observações correspondente ao ponto (x,y). | ||
+ | |||
+ | Para representar objetivamente o grau de associação entre valores observados para duas variáveis quantitativas, utiliza-se com frequência a medida chamada de coeficiente correlação. | ||
+ | |||
+ | === Coeficiente de correlação (para um conjunto de dados) === | ||
+ | |||
+ | Para um conjunto de dados com n pares de valores //(x,y)// para as variáveis X e Y , a dependência (grau de associação) linear é medida através do coeficiente de correlação linear definido através de: | ||
+ | |||
+ | <latex> | ||
+ | \rho_{X,Y}= \dfrac{\sum_{i=1}^n(x_i-\bar{x}_{obs})(y_i-\bar{y}_{obs})}{\sqrt{[\sum_{j=1}^n(x_j-\bar{x}_{obs})^2][\sum_{j=1}^n(y_j-\bar{y}_{obs})^2]}} | ||
+ | </latex> | ||
+ | |||
+ | de forma mais conveniente este coeficiente pode ser reexpresso como: | ||
+ | |||
+ | <latex> | ||
+ | \rho_{X,Y}= \dfrac{\sum_{i=1}^nx_iy_i -n\bar{x}_{obs}\bar{y}_{obs}}{\sqrt{[\sum_{j=1}^nx_j^2-n\bar{x}_{obs}^2][\sum_{j=1}^ny_j^2-n\bar{y}_{obs}^2]}} | ||
+ | </latex> | ||
+ | |||
+ | O coeficiente de correlação é uma medida adimensional que varia de -1 até 1. Quanto mais próximo dos extremos, maior é a evidência de asssociação entre as variáveis. Caso o coeficiente de correlação seja igual a zero, não há dependência linear entre as variáveis. | ||
+ | |||
+ | //**Exemplo 5.11:** A quantidade de chuva é um fator importante na produtividade agrícola. Para medir esse efeito foram anotados, para 8 diferentes regiões produtoras de soja, o índice pluviométrico em milímetros (X) e a produção do último ano em toneladas (Y). Vamos determinar o coeficiente de correlação.// | ||
+ | |||
+ | <latex> | ||
+ | \begin{tabular}{|c|c|c|c|c|c|c|c|c|}\hline | ||
+ | X & 120 & 140 & 122 & 150 & 115 & 190 & 130 & 118 \\ \hline | ||
+ | Y & 40 & 46 & 45 & 37 & 25 & 54 & 33 & 30 \\ \hline | ||
+ | \end{tabular} | ||
+ | </latex> | ||
+ | |||
+ | Para calcular o coeficiente de correlação entre o índice pluviométrico e a produção agrícola, através da segunda das formulações apresentadas, são necessários os seguintes somatórios: | ||
+ | |||
+ | <latex>\sum_{i=1}^8x_i=1085</latex> | ||
+ | <latex>\sum_{i=1}^8y_i=310</latex> | ||
+ | <latex>\sum_{i=1}^8x_iy_i=43245</latex> | ||
+ | <latex>\sum_{i=1}^8x_i^2=151533</latex> | ||
+ | <latex>\sum_{i=1}^8y_i^2=12640</latex> | ||
+ | |||
+ | a substituição destes resultados na fórmula, gera o coeficiente : | ||
+ | |||
+ | <latex>\rho_{X,Y}=\dfrac{43245-8 \times 135,63 \times 38,75}{\sqrt{[151533-8 \times 135,63^2][12640-8 \times 38,75^2]}}=0,73</latex> | ||
+ | |||
+ | note que o valor próximo a 1, expressa associação positiva indicando que o aumento da quantidade de chuva está associado com aumento da produção. | ||
===== Associação entre variáveis qualitativas e quantitativas ===== | ===== Associação entre variáveis qualitativas e quantitativas ===== |