Curso de Data Science con Python. De cero a experto (Programa detallado)

Objetivo

Al finalizar el curso podrá…

  • Dominar el lenguaje de propósito general Python desde cero, incluyendo su instalación.
  • Comprender y profundizar en el flujo completo de un proyecto de Data Science para convertirse en científico de datos.
  • Aprender todos los conceptos de estadística necesarios para poder analizar los datos que le rodean.
  • Utilizar librerías como Numpy o Pandas para la importación desde fuentes heterogéneas (CSV, Excel, texto plano, SQL, Web, redes sociales, cloud,…) y la limpieza y transformación de datos.
  • Crear potentes visualizaciones con las librerías Matplotlib y Seaborn para el análisis de la información.
  • Analizar series temporales y realizar previsiones.
  • Automatizar sus tareas cotidianas con Python

Dirigido a:

  • Toda persona que quiera potenciar su perfil adquiriendo habilidades de análisis de datos con gran futuro.
  • Estudiantes que quieran aprender desde cero una habilidad muy demandada en cualquier sector desde un punto de vista práctico.
  • Personas que quieran asombrar a su audiencia con un enfoque analítico generando conclusiones que marcan la diferencia.
  • Analistas que quieran profundizar en Python y sus librerías enfocadas en Data Science.
  • Profesionales que quieran automatizar sus tareas diarias con Python.

Requisitos:

No es necesario requisitos previos, incluso habrá un bloque introductorio al lenguaje Python desde cero.

PROGRAMA DEL CURSO

1.- Introducción al Análisis de Datos

Objetivo

Al finalizar la unidad, el alumno comprenderá en qué consiste un proyecto de Data Science y cómo Python nos ayudará a llevarlo a cabo.

Contenido

  1. Introducción al Análisis de Datos con Python
    1. ¿Qué es Python y qué nos proporciona para el análisis de datos?
    2. Instalación Python + Jupyter
    3. Importar librerías y fuentes de datos
    4. Visualización básica con Matplotlib
    5. Flujograma de un proyecto Data Science
    6. Resumen

2.- Fundamentos del lenguaje Python

Objetivo

Al finalizar la unidad, el alumno conseguirá dominar el lenguaje Python y su sintaxis.

Contenido

  1. Fundamentos del lenguaje Python
    1. Variables en Python
    2. Creación de listas y extracción de datos
    3. Conceptos avanzados de creación de listas
    4. Uso de funciones en Python (in-built)
    5. Creación de funciones en Python y argumentos flexibles
    6. Funciones lambda
    7. Métodos en Python
    8. Cómo crear diccionarios en Python
    9. Uso de función zip para creación de diccionarios en base a listas
    10. Operadores en Python
    11. Bucles en Python
    12. Comprensión de listas en python
    13. Resumen

3.- Conceptos de Estadística para el Análisis de Datos

Objetivo

Al finalizar la unidad, el alumno entenderá los fundamentos estadísticos para convertirse en científico de datos, lo cual es la base sólida para poder analizar y obtener conclusiones.

Contenido

  1. Conceptos de Estadística para el Análisis de Datos
    1. Variables y Conceptos básicos
    2. Varianza de una variable
    3. Correlación de variables
    4. Histogramas
    5. Análisis con percentiles (CDF)
    6. Funciones densidad de probabilidad
    7. Cálculo de previsiones (forecast) y media móvil
    8. Resumen

4.- Calculo numérico con Numpy

Objetivo

Al finalizar la unidad, el alumno habrá profundizado en la librería Numpy para hacer cálculos numéricos con Python.

Contenido

  1. Calculo numérico con Numpy
    1. Introducción a la librería Numpy
    2. Selección de datos con array Numpy
    3. Arrays 2D en Numpy
    4. Cálculo estadístico con NumPy
    5. Resumen

5.- Análisis de datos con Pandas

Objetivo

Al finalizar la unidad, el alumno habrá profundizado en la librería más importante para limpieza y
transformación de datos con Pandas.

Contenido

  1. Análisis de datos con Pandas
    1. Introducción a la librería Pandas ¿qué es un dataframe?
    2. Creación de un dataframe a partir de un diccionario
    3. Cómo importar datos desde un fichero de texto plano (txt, csv...)
    4. Selección de datos en un dataframe Pandas
    5. Métodos útiles de un dataframe Pandas
    6. Eliminar duplicados, valores erróneos y columnas de un dataframe Pandas
    7. Interpolación de datos
    8. Filtrar datos en un dataframe Pandas
    9. Ordenación valores en un dataframe Pandas
    10. Crear columnas en un dataframe para cadenas de texto
    11. Crear columnas en un dataframe a partir de un diccionario con map
    12. Crear columnas en un dataframe a partir de funciones lambda
    13. Crear columnas en un dataframe a partir de funciones condicionales
    14. Renombrar y reordenar columnas de un dataframe Pandas
    15. Cómo crear pivot tables en Pandas
    16. Uso de groupby en Pandas
    17. Concatenación de dataframes (union)
    18. Combinación de dataframes
    19. Resumen

6.- Importación y exportación con Pandas

Objetivo

Al finalizar la unidad, el alumno conseguirá importar y exportar desde múltiples fuentes de datos.

Contenido

  1. Importación y exportación con Pandas
    1. Cómo importar datos desde un fichero Excel
    2. Introducción a las BBDD relacionales / Modelos de datos
    3. Cómo importar datos desde una BBDD SQL
    4. Cómo importar datos desde una página web
    5. Cómo importar datos desde una página web (Web scraping)
    6. Cómo importar datos desde un fichero semi-estructurado JSON
    7. Cómo importar datos desde Redes Sociales
    8. Cómo importar datos desde Cloud (AWS / Azure / Google Cloud)
    9. Exportación de datos a csv y Excel
    10. Exportación de datos a BBDD SQL
    11. Resumen

7.- Visualización de datos en Python - Matplotlib

Objetivo

Al finalizar la unidad, el alumno conseguirá crear potentes visualizaciones con Matplotlib para poder analizar y explicar los resultados obtenidos.

Contenido

  1. Visualización de datos en Python - Matplotlib
    1. Consejos para la visualización de datos
    2. Introducción a la librería Matplotlib
    3. Creación de un gráfico de línea, bar, scatter
    4. Personalización de gráficos (título, etiquetas, ticks, leyenda, límites de ejes, anotaciones...)
    5. Creación de box & whiskers plot
    6. Creación de un histograma y CDF
    7. Gráfico de media móvil
    8. Visualización de gráficos múltiples (subplots)
    9. Aplicación de estilos
    10. Creación de gráficos a partir de objeto groupby
    11. Creación de histogramas en 2D
    12. Creación de mapas geográficos con basemap y Google maps
    13. Resumen

8.- Visualización de datos en Python - Seaborn

Objetivo

Al finalizar la unidad, el alumno conseguirá crear potentes estadísticas con la librería Seaborn para un análisis profundo de la información.

Contenido

  1. Visualización de datos en Python - Seaborn
    1. Introducción a la librería Seaborn
    2. Seaborn - Creación de Regresión Lineal
    3. Seaborn - Stripplot
    4. Seaborn - Swarmplot
    5. Seaborn - Violinplot
    6. Seaborn - Uso de jointplot
    7. Seaborn - Uso de pairplot
    8. Seaborn - Correlación con heatmap
    9. Resumen

9.- Series temporales en Python

Objetivo

Al finalizar la unidad, el alumno conseguirá explotar sus datos históricos para realizar análisis y previsiones.

Contenido

  1. Series temporales en Python
    1. Series temporales en Pandas: Extracción y parsing
    2. Series temporales: Filtrado
    3. Series temporales: Remuestreo - Diezmado (downsampling)
    4. Series temporales: Remuestreo - Interpolación (upsampling)
    5. Visualización de series temporales
    6. Previsiones basadas en datos históricos
    7. Resumen

10.- Ejecución e interconexión de Python con otras plataformas

Objetivo

Al finalizar la unidad, el alumno conseguirá generar scripts de Python para automatizar tareas e interconectar con otras herramientas de Business Intelligence.

Contenido

  1. Ejecución e interconexión de Python con otras plataformas
    1. Generación de scripts de python y automatización de tareas
    2. Uso de Python en herramienta de Business Intelligence Power BI
    3. Resumen