3. Almacenamiento y gestión de datos


Instituto Tecnológico de Tehuacán

Ingeniería en Sistemas Computacionales

Unidad de aprendizaje: Almacenamiento y Gestión de Datos

3.1 Lectura y escritura de datos

La lectura y escritura de datos consiste en obtener información desde archivos o bases de datos y guardarla en diferentes formatos para su procesamiento.

Fuente → Lectura → Procesamiento → Escritura → Archivo final

Ejercicio

Describe tres fuentes de datos que puede usar un sistema computacional.

3.2 CSV

CSV (Comma Separated Values) almacena datos en texto plano separados por comas.

nombre,edad,ciudad
Ana,22,Puebla
Luis,25,Tehuacán

Ejercicio

Crea un archivo CSV con 5 registros de estudiantes.

3.3 JSON

JSON (JavaScript Object Notation) almacena datos estructurados en formato de objetos.

{
«nombre»: «Ana»,
«edad»: 22,
«ciudad»: «Puebla»
}

Ejercicio

Representa un catálogo de 3 productos en formato JSON.

3.4 XLS

XLS es el formato de hojas de cálculo de Excel, ideal para datos tabulares.

| Nombre | Edad | Ciudad |
| Ana | 22 | Puebla |

Ejercicio

Crea una hoja de Excel con 4 columnas y 10 filas de datos.

3.5 SQL (MySQL y MongoDB)

SQL es un lenguaje para gestionar bases de datos relacionales como MySQL.
MongoDB es una base de datos NoSQL basada en documentos JSON.

MySQL: tablas, filas, columnas.
MongoDB: colecciones, documentos, campos.

Ejercicio

MySQL: crea una tabla llamada alumnos con 3 columnas.
MongoDB: crea un documento con nombre, edad y carrera.

3.6 XML

XML (Extensible Markup Language) almacena datos usando etiquetas jerárquicas.

<persona>
  <nombre>Ana</nombre>
  <edad>22</edad>
</persona>

Ejercicio

Escribe un archivo XML que contenga 2 registros de libros.


📚 Lectura y Escritura de Datos

📄 3.2 CSV (Comma Separated Values)

El formato estándar para intercambio de datos tabulares. Ligero y universal.

import pandas as pd
df = pd.read_csv('archivo.csv') # Carga datos desde un CSV

🌐 3.3 JSON (JavaScript Object Notation)

Ideal para estructuras de datos anidadas y APIs.

df.to_json('archivo.json', orient='records', indent=4)

📊 3.4 XLS / XLSX (Excel)

Formato común en entornos empresariales.

df = pd.read_excel('datos.xlsx', sheet_name='Hoja1')

💾 3.5 SQL (MySQL y MongoDB)

Uso de bases de datos para almacenamiento robusto y escalable.

# Ejemplo conceptual SQL
df = pd.read_sql('SELECT * FROM usuarios', engine)

📑 3.6 XML (eXtensible Markup Language)

Lenguaje de marcado flexible para estructurar datos complejos.

df = pd.read_xml('datos.xml')


📚 Lectura y Escritura de Datos

📄 3.2 CSV (Comma Separated Values)

El formato estándar para intercambio de datos tabulares. Ligero y universal.

import pandas as pd
df = pd.read_csv('archivo.csv') # Carga datos desde un CSV

🌐 3.3 JSON (JavaScript Object Notation)

Ideal para estructuras de datos anidadas y APIs.

df.to_json('archivo.json', orient='records', indent=4)

📊 3.4 XLS / XLSX (Excel)

Formato común en entornos empresariales.

df = pd.read_excel('datos.xlsx', sheet_name='Hoja1')

💾 3.5 SQL (MySQL y MongoDB)

Uso de bases de datos para almacenamiento robusto y escalable.

# Ejemplo conceptual SQL
df = pd.read_sql('SELECT * FROM usuarios', engine)

📑 3.6 XML (eXtensible Markup Language)

Lenguaje de marcado flexible para estructurar datos complejos.

df = pd.read_xml('datos.xml')