5 Lenguaje R



¿Por qué aprender R?

R es un lenguaje especializado en análisis estadístico y visualización de datos. A diferencia de lenguajes de propósito general, R fue creado por estadísticos para estadísticos, convirtiéndose en el estándar para la investigación científica y la Ciencia de Datos.

Principales Usos

Investigación: Análisis de ensayos clínicos y estudios biológicos complejos.
Finanzas: Modelado de series temporales y análisis de riesgos.
Ciencia de Datos: Machine Learning y minería de datos avanzada.
Visualización: Creación de gráficos listos para publicaciones científicas.

5.1 Introducción y 5.2 Fundamentos

R trabaja con objetos. Los más comunes son vectores, matrices y dataframes.

# Ejemplo: Definición de variables y vectores
edad <- c(25, 30, 22, 28)
# Dataframe básico
estudiantes <- data.frame(nombre=c("Ana", "Juan"), nota=c(9, 8))

5.3 Importar y Exportar Datos

La capacidad de leer archivos externos es vital:

datos <- read.csv("mis_datos.csv")
write.csv(datos, «resultados.csv»)

5.4 Gráficas Simples y GGPLOT

R es potente visualizando información. ggplot2 utiliza una «gramática de gráficos» para capas.

library(ggplot2)
ggplot(estudiantes, aes(x=nombre, y=nota)) + geom_col()


Instituto Tecnológico de Tehuacán

Ingeniería en Sistemas Computacionales

Unidad de aprendizaje: Lenguaje R

5.1 Introducción a R

R es un lenguaje y entorno para análisis estadístico y visualización de datos, ampliamente usado en ciencia de datos y bioestadística.

# Imprimir un mensaje print(«Hola desde R»)

5.2 Fundamentos del lenguaje

5.2.1 Variables y objetos

En R, los objetos se crean asignando valores con <- o =.

x <- 10 nombre <- «Ana»

5.2.2 Vectores

Un vector es una colección de elementos del mismo tipo.

v <- c(1, 2, 3, 4) print(v)

5.2.3 Operadores

R incluye operadores aritméticos y lógicos.

a <- 5 b <- 3 a + b a > b

5.2.4 Cadenas de texto

Las cadenas se manejan como objetos de tipo character.

mensaje <- «Bienvenido a R» toupper(mensaje)

5.2.5 Matrices

Una matriz es un arreglo bidimensional de datos.

m <- matrix(1:9, nrow = 3, ncol = 3) print(m)

5.2.6 Dataframes

Un dataframe es una estructura tabular similar a una tabla de base de datos.

df <- data.frame( nombre = c(«Ana», «Luis»), edad = c(22, 25) ) print(df)

5.2.7 Listas

Una lista puede contener objetos de distintos tipos.

lista <- list( nombre = «Ana», edades = c(22, 25, 30), activo = TRUE ) print(lista)

5.2.8 Subconjuntos

Se pueden extraer subconjuntos de vectores, matrices y dataframes.

v <- c(10, 20, 30, 40) v[2:3] # elementos 2 y 3 df[df$edad > 23, ] # filas con edad > 23

5.2.9 Funciones

Las funciones encapsulan código reutilizable.

suma <- function(a, b) { return(a + b) } suma(5, 7)

5.3 Importar y exportar datos

R puede leer y escribir datos en múltiples formatos como CSV, XLS y otros.

# Leer CSV datos <- read.csv(«archivo.csv») # Escribir CSV write.csv(datos, «salida.csv», row.names = FALSE)

5.4 Gráficas simples

5.4.1 Función plot()

La función plot() genera gráficas básicas de dispersión y líneas.

x <- c(1, 2, 3, 4) y <- c(2, 4, 6, 8) plot(x, y, main = «Gráfica simple», xlab = «X», ylab = «Y»)

5.4.2 Histogramas y gráficas de barras

R incluye funciones para histogramas y barras.

valores <- c(2, 3, 3, 4, 5, 5, 6) hist(valores, main = «Histograma») categorias <- c(«A», «B», «C») frecuencias <- c(10, 5, 8) barplot(frecuencias, names.arg = categorias, main = «Gráfica de barras»)

5.4.3 Boxplot

El boxplot muestra la distribución y valores atípicos.

datos <- c(10, 12, 15, 18, 30) boxplot(datos, main = «Boxplot de datos»)

5.4.4 Visualización con la librería ggplot2

ggplot2 es una librería poderosa para visualización avanzada en R.

# install.packages(«ggplot2») # ejecutar una vez library(ggplot2) df <- data.frame( x = c(1, 2, 3, 4), y = c(2, 4, 6, 8) ) ggplot(df, aes(x = x, y = y)) + geom_point() + geom_line() + ggtitle(«Gráfica con ggplot2»)

Introducción al Lenguaje R

5.1. Introducción a R

R es un lenguaje de programación y entorno de software estadístico y gráfico. Es una herramienta poderosa para el análisis de datos.

5.2. Fundamentos del lenguaje

5.2.1 Variables y 5.2.2 Vectores

# Asignación de variable
x <- 10
# Creación de vector
mi_vector <- c(1, 2, 3, 4, 5)

5.2.6. Dataframes

Los dataframes son las estructuras más importantes para el análisis de datos en R.

df <- data.frame(nombre=c("Ana", "Luis"), edad=c(25, 30))

5.3. Importar y exportar datos

R facilita la lectura de archivos externos como CSV:

datos <- read.csv("archivo.csv")
write.csv(datos, «nuevo_archivo.csv»)

5.4. Gráficas

5.4.1. Función plot() y 5.4.4. GGPLOT

R permite desde gráficas base rápidas hasta visualizaciones complejas con ggplot2.

# Gráfica básica
plot(mi_vector)
# Usando ggplot2
library(ggplot2)
ggplot(df, aes(x=nombre, y=edad)) + geom_bar(stat=»identity»)