1 Introducción a la Ciencia de Datos



Instituto Tecnológico de Tehuacán

Ingeniería en Sistemas Computacionales

Unidad de aprendizaje: Introducción a la Ciencia de Datos

Introducción a la Ciencia de Datos

La Ciencia de Datos es una disciplina que combina matemáticas, estadística, programación y análisis para transformar datos en conocimiento útil. En Ingeniería en Sistemas Computacionales, esta área permite desarrollar soluciones tecnológicas basadas en evidencia.

Flujo general:
Datos → Recolección → Limpieza → Análisis → Modelado → Interpretación → Decisiones

1.1 Definición y conceptos

1.1.1 ¿Qué es Ciencia de Datos?

Es el conjunto de técnicas y procesos que permiten analizar datos para obtener información valiosa.

1.1.2 ¿Qué es un científico de datos?

Profesional que recolecta, procesa, analiza y comunica resultados basados en datos.

1.1.3 Aplicaciones

  • Salud
  • Finanzas
  • Marketing
  • Educación
  • Industria

1.1.4 Surgimiento

Surge por el crecimiento masivo de datos digitales y la necesidad de analizarlos.

1.2 Habilidades del científico de datos

1.2.1 Matemáticas y estadística

Probabilidad, estadística, álgebra lineal, cálculo aplicado.

1.2.2 Computación

Python, R, SQL, algoritmos, estructuras de datos, bases de datos.

1.2.3 Conocimiento del negocio

Comprender el contexto del problema para interpretar correctamente los resultados.

1.3 Técnicas y herramientas

1.3.1 Etapas del proyecto

Definición → Recolección → Limpieza → Análisis → Modelado → Evaluación → Implementación

1.3.2 Lenguajes

Python, R, SQL, Julia, Scala.

1.3.3 Entornos

Jupyter Notebook, RStudio, VS Code, Google Colab.