Proyecto IA4LEGOS

Ciencia de datos y automatización con Python

Objetivos: Resumir la información de bases de datos de forma numérica y gráfica. Automatizar procesos relacionados con la gestión de información.

Contenidos: Los contenidos del curso se han estructurado en cuatro bloques:

Bloque 1: Procesamiento de datos.

  1. Estructuras de datos con Pandas y tratamiento de valores perdidos.
  2. Gestión de datos con Pandas y tratamiento de datos anómalos.
  3. Manipulación y combinación de conjunto de datos.

Bloque 2: Análisis exploratorio de datos.

  1. Tablas de frecuencias.
  2. Análisis descriptivo de variables – Medidas de centralización y dispersión.
  3. Relación entre variables.

Bloque 3: Visualización de datos.

  1. Visualización de datos univariantes con matplotlib.
  2. Visualización de datos bivariantes con matplotlib.
  3. Visualización de datos multivariantes con Seaborn.

Bloque 4: Automatización extracción de información.

  1. Automatización hojas de cálculo.
  2. Automatización extracción información de ficheros PDF.
  3. Automatización extracción información a partir de imágenes (OCR).
  4. Automatización extracción información API WEB.
  5. Automatización extracción información WEB SCRAPING.
  6. Automatización procesos web.