enero 10, 2017

Software estadístico: capacidad y literatura


El software libre R ofrece una inmensa oportunidad—inexistente décadas atrás—para analizar trabajos científicos con rigor. Sin embargo, antes de decidir instalarlo, y dedicar muchas horas a aprenderlo, es bueno conocer ventajas y riesgos de usos.





Investigar requiere lectura, y eso también implica leer en español e inglés. Los softwares estadísticos que emplean códigos ofrecen una ventaja más: repaso de otra lengua—sus comandos son ejecutados en inglés.






La otra virtud contemporánea de los softwares es la información existente de rápido acceso, blogs por creadores (SAS Blogs) y contribuyentes (R-bloggers), sitios de internet universitarios (idreUCLA, UC, UCA, UM) y particulares (Quick-R), tutoriales, manuales y libros. La oferta, además, han propiciado nuevas versiones y productos.






Nuestra preferencia, o quizá petulancia, por usar códigos, al contrario de iconos, es por la visualización del procedimiento de análisis y el registro permanente, accesible de ejecutar meses o años después. Como ejemplo, esta presentación la realizamos en el 2015. Ahora, 18 meses después, la ejecutamos y recordamos su significado.



bajar presentación



El análisis lo realizamos en R. Iris, son datos de una investigación clásica echa por el creador del análisis de varianza. La agregamos para mostrar algunos analísis y la capacidad del sofware. Los resultados producidos son los siguentes.



####Analysis de Varianza en R

#### PARTE I - importar datos
iris <- read.csv("C:\\Users\\Administrator\\Desktop\\iris.csv", header=TRUE)
attach(iris)

# comprobación de datos importados
names(iris)
## [1] "Sepal.Length" "Sepal.Width"  "Petal.Length" "Petal.Width" 
## [5] "Species"
head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa
tail(iris)
##     Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
## 145          6.7         3.3          5.7         2.5 virginica
## 146          6.7         3.0          5.2         2.3 virginica
## 147          6.3         2.5          5.0         1.9 virginica
## 148          6.5         3.0          5.2         2.0 virginica
## 149          6.2         3.4          5.4         2.3 virginica
## 150          5.9         3.0          5.1         1.8 virginica
# install.packages("car")
library(car)
## Warning: package 'car' was built under R version 3.3.2
some(iris, 3) # 3 random rows
##    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 57          6.3         3.3          4.7         1.6 versicolor
## 84          6.0         2.7          5.1         1.6 versicolor
## 94          5.0         2.3          3.3         1.0 versicolor
# verificando si faltan datos
sapply(iris, function(x)(sum(is.na(x))))
## Sepal.Length  Sepal.Width Petal.Length  Petal.Width      Species 
##            0            0            0            0            0
...continuar, ver resultado completobajar códigosdatos "iris" en formato CSV.



No hay comentarios:

Publicar un comentario