1 Introducción a la Ciencia de Datos
Instituto Tecnológico de Tehuacán
Ingeniería en Sistemas Computacionales
Unidad de aprendizaje: Introducción a la Ciencia de Datos
Introducción a la Ciencia de Datos
La Ciencia de Datos es una disciplina que combina matemáticas, estadística, programación y análisis para transformar datos en conocimiento útil. En Ingeniería en Sistemas Computacionales, esta área permite desarrollar soluciones tecnológicas basadas en evidencia.
Flujo general:
Datos → Recolección → Limpieza → Análisis → Modelado → Interpretación → Decisiones
Datos → Recolección → Limpieza → Análisis → Modelado → Interpretación → Decisiones
1.1 Definición y conceptos
1.1.1 ¿Qué es Ciencia de Datos?
Es el conjunto de técnicas y procesos que permiten analizar datos para obtener información valiosa.
1.1.2 ¿Qué es un científico de datos?
Profesional que recolecta, procesa, analiza y comunica resultados basados en datos.
1.1.3 Aplicaciones
- Salud
- Finanzas
- Marketing
- Educación
- Industria
1.1.4 Surgimiento
Surge por el crecimiento masivo de datos digitales y la necesidad de analizarlos.
1.2 Habilidades del científico de datos
1.2.1 Matemáticas y estadística
Probabilidad, estadística, álgebra lineal, cálculo aplicado.
1.2.2 Computación
Python, R, SQL, algoritmos, estructuras de datos, bases de datos.
1.2.3 Conocimiento del negocio
Comprender el contexto del problema para interpretar correctamente los resultados.
1.3 Técnicas y herramientas
1.3.1 Etapas del proyecto
Definición → Recolección → Limpieza → Análisis → Modelado → Evaluación → Implementación
1.3.2 Lenguajes
Python, R, SQL, Julia, Scala.
1.3.3 Entornos
Jupyter Notebook, RStudio, VS Code, Google Colab.
https://ofortiz.my.canva.site/p-gina-web-examen-ciencia-de-datos