====== Comandos em R mostrados durante as aulas ====== === 18/04 === ## Exemplo de aula, 18/04/2013 ## Fonte dos dados: UCI - Machine learning data-sets ## http://archive.ics.uci.edu/ml/datasets.html ## ## Importando dados escolhidos (Auto MGP) ## na.st é o código para dado faltante utilizado no arquivo ## head=F indica que as colunas do arquivo não possuem cabeçalho cars <- read.table("http://archive.ics.uci.edu/ml/machine-learning-databases/auto-mpg/auto-mpg.data", na.st="?", head=F) ## informações sobr os dados head(cars) ## primeiras linhas da tabela de dados dim(cars) ## dimensoes da tabela de dado str(cars) ## strutura de armazenamento dos dados ## atribuindo nomes para as colunas names(cars) <- c("mpg","cyl","disp","hp","wei","acc","ano","origin","Modelo") head(cars) cars$origin <- factor(cars$origin, level=1:3, label=c("US","UE","JP")) ## Resumo de dados contínuos ## I . Medidas with(cars, mean(mpg)) with(cars, min(mpg)) with(cars, max(mpg)) with(cars, range(mpg)) with(cars, fivenum(mpg)) with(cars, summary(mpg)) with(cars, var(mpg)) with(cars, sd(mpg)) ## II. Tabelas with(cars, table(cut(mpg, br=c(0, 15, 20, 25, 50)))) with(cars, prop.table(table(cut(mpg, br=c(0, 15, 20, 25, 50))))) ## III. Gráficos with(cars, hist(mpg)) with(cars, stem(mpg)) with(cars, boxplot(mpg)) ## Resumos para grupos (no caso mpg para cada ano) with(cars, tapply(mpg, year, mean)) with(cars, tapply(mpg, year, max)) with(cars, tapply(mpg, ano, mean)) with(cars, plot(unique(ano), tapply(mpg, ano, mean), type="l")) ## subconjunto dos dados with(subset(cars, origin=="EU"), plot(unique(year), tapply(mpg, year, mean), type="l")) with(subset(cars, origin=="US"), lines(unique(year), tapply(mpg, year, mean), col=2)) with(subset(cars, origin=="JP"), lines(unique(year), tapply(mpg, year, mean), col=4))