Proyecto IA4LEGOS
Ciencia de datos y automatización con Python
Objetivos: Resumir la información de bases de datos de forma numérica y gráfica. Automatizar procesos relacionados con la gestión de información.
Contenidos: Los contenidos del curso se han estructurado en cuatro bloques:
Bloque 1: Procesamiento de datos.
- Estructuras de datos con Pandas y tratamiento de valores perdidos.
- Gestión de datos con Pandas y tratamiento de datos anómalos.
- Manipulación y combinación de conjunto de datos.
Bloque 2: Análisis exploratorio de datos.
- Tablas de frecuencias.
- Análisis descriptivo de variables – Medidas de centralización y dispersión.
- Relación entre variables.
Bloque 3: Visualización de datos.
- Visualización de datos univariantes con matplotlib.
- Visualización de datos bivariantes con matplotlib.
- Visualización de datos multivariantes con Seaborn.
Bloque 4: Automatización extracción de información.
- Automatización hojas de cálculo.
- Automatización extracción información de ficheros PDF.
- Automatización extracción información a partir de imágenes (OCR).
- Automatización extracción información API WEB.
- Automatización extracción información WEB SCRAPING.
- Automatización procesos web.