5 Lenguaje R
¿Por qué aprender R?
R es un lenguaje especializado en análisis estadístico y visualización de datos. A diferencia de lenguajes de propósito general, R fue creado por estadísticos para estadísticos, convirtiéndose en el estándar para la investigación científica y la Ciencia de Datos.
Principales Usos
5.1 Introducción y 5.2 Fundamentos
R trabaja con objetos. Los más comunes son vectores, matrices y dataframes.
edad <- c(25, 30, 22, 28)
# Dataframe básico
estudiantes <- data.frame(nombre=c("Ana", "Juan"), nota=c(9, 8))
5.3 Importar y Exportar Datos
La capacidad de leer archivos externos es vital:
write.csv(datos, «resultados.csv»)
5.4 Gráficas Simples y GGPLOT
R es potente visualizando información. ggplot2 utiliza una «gramática de gráficos» para capas.
ggplot(estudiantes, aes(x=nombre, y=nota)) + geom_col()
Instituto Tecnológico de Tehuacán
Ingeniería en Sistemas Computacionales
Unidad de aprendizaje: Lenguaje R
5.1 Introducción a R
R es un lenguaje y entorno para análisis estadístico y visualización de datos, ampliamente usado en ciencia de datos y bioestadística.
5.2 Fundamentos del lenguaje
5.2.1 Variables y objetos
En R, los objetos se crean asignando valores con <- o =.
5.2.2 Vectores
Un vector es una colección de elementos del mismo tipo.
5.2.3 Operadores
R incluye operadores aritméticos y lógicos.
5.2.4 Cadenas de texto
Las cadenas se manejan como objetos de tipo character.
5.2.5 Matrices
Una matriz es un arreglo bidimensional de datos.
5.2.6 Dataframes
Un dataframe es una estructura tabular similar a una tabla de base de datos.
5.2.7 Listas
Una lista puede contener objetos de distintos tipos.
5.2.8 Subconjuntos
Se pueden extraer subconjuntos de vectores, matrices y dataframes.
5.2.9 Funciones
Las funciones encapsulan código reutilizable.
5.3 Importar y exportar datos
R puede leer y escribir datos en múltiples formatos como CSV, XLS y otros.
5.4 Gráficas simples
5.4.1 Función plot()
La función plot() genera gráficas básicas de dispersión y líneas.
5.4.2 Histogramas y gráficas de barras
R incluye funciones para histogramas y barras.
5.4.3 Boxplot
El boxplot muestra la distribución y valores atípicos.
5.4.4 Visualización con la librería ggplot2
ggplot2 es una librería poderosa para visualización avanzada en R.
Introducción al Lenguaje R
5.1. Introducción a R
R es un lenguaje de programación y entorno de software estadístico y gráfico. Es una herramienta poderosa para el análisis de datos.
5.2. Fundamentos del lenguaje
5.2.1 Variables y 5.2.2 Vectores
x <- 10
# Creación de vector
mi_vector <- c(1, 2, 3, 4, 5)
5.2.6. Dataframes
Los dataframes son las estructuras más importantes para el análisis de datos en R.
5.3. Importar y exportar datos
R facilita la lectura de archivos externos como CSV:
write.csv(datos, «nuevo_archivo.csv»)
5.4. Gráficas
5.4.1. Función plot() y 5.4.4. GGPLOT
R permite desde gráficas base rápidas hasta visualizaciones complejas con ggplot2.
plot(mi_vector)
# Usando ggplot2
library(ggplot2)
ggplot(df, aes(x=nombre, y=edad)) + geom_bar(stat=»identity»)