Profesores Docentes
Recomendable: Conocimientos medios en informática acerca de bases de datos relacionales, programación orientada a objetos y sistemas operativos (comunicación entre procesos y gestión de memoria).
Sería recomendable conocimientos en bases de datos y sistemas operativos.
Los objetivos se centrarán en:
Conocer los conceptos clave y bases de los modelos de información necesarios para entender el papel de los perfiles existentes alrededor de un sistema de información y su explotación.
Tener una visión lo más amplia posible de las distintas arquitecturas informacionales, tanto de las ya existentes y afianzadas en el mercado empresarial, como de las nuevas visiones disruptivas a partir de las nuevas tecnologías disponibles.
Aprender a recoger, transformar y procesar la información en función de su origen, volumen, formato y periodicidad de análisis.
Entender las distintas formas de Data Governance con el objetivo de comprender el aporte al día a día en el trabajo de un Data Scientist.
1. Conceptos clave y bases de modelos de información
1.1. Historia de las Bases de Datos
1.2. Figuras clave alrededor de los sistemas informacionales (Data Science, Data Analyst, Product Owner, etc.)
1.3. Roles de un Data Scientist e interacción con el resto
1.4. DBMS vs RDBMS (concepto de explotación de la información)
1.5. Teoría y ejemplos prácticos de Modelos Relacionales
1.6. Definición y concepto de ETL
2. Qué es la información y cómo le extraemos valor
2.1. Concepto de dato e información (del origen del dato hasta explotar información y conseguir valor)
2.2. ¿Business Intelligence y cómo se comprende con Data Science?
2.3. Big Data
2.3.1. ELT vs ETL
2.3.2. Concepto de arquitectura
2.4. Tipos de arquitecturas de datos
2.4.1. Lógica/Tecnológica/Física
2.4.2. Entornos de información (DEV, PRO, SandBox,
)
2.4.3. Conceptos DataLake, DWH, etc.
2.5. Arquitectura de Modelos de datos IA
2.5.1. Desarrollo
2.5.2. Validación y promoción a PRO (batch y online)
2.5.3. Monitorización
3. Explotar los distintos tipos de información
3.1. DB Estructuradas (repaso y ampliación de lo ya visto)
3.2. DB Semi-Estructuradas
3.3. DB No Estructuradas
4. Web Scraping cómo origen de datos
4.1. ¿Qué es Web Scraping?
4.2. Aspectos legales
4.3. Herramientas
5. Cloud Computing for Data Scientist
6. La importancia de la trazabilidad y fiabilidad de los datos (Data Governance)
Nota: los temas pueden ajustarse y/o modificarse a criterio de la coordinación del máster.
La metodología utilizada combina clases magistrales, participación de los estudiantes, ejercicios y prácticas. Para el alumno, esto implicará tanto trabajos individuales como en grupo, así como ejercicios conceptuales, ejercicios escritos y presentaciones orales.
Esta asignatura se evaluará de manera continuada a partir de ejercicios, trabajos, prácticas y presentaciones en clase.
Evaluación continua
Esta asignatura se evaluará de manera continuada a partir de ejercicios, trabajos, prácticas y presentaciones en clase.
La nota final será una ponderación de:
- Práctica sobre un sistema de información relacional: 30%
- Práctica sobre sistemas de datos no estructurados: 30%
- Trabajo final y presentación: 40%
Convocatoria extraordinaria
Se determinará el examen y/o trabajos de convocatoria extraordinaria desde la coordinación de la asignatura.
Normativa de copias
La asignatura se rige por la normativa de copias general de La Salle Campus BCN:
https://www.salleurl.edu/es/normativa-de-copias
Las actividades formativas se considerarán que tienen la siguiente categoría:
Ejercicios: moderadamente significativa
Proyecto: altamente significativa
Evaluación Final: altamente significativa
La bibliografía se irá detallando a lo largo de la asignatura:
Apuntes de clase
Documentación y artículos subidos a la Intranet (eStudy)
Todo el material de clase (presentaciones, ejercicios, artículos, documentos, etcétera) se compartirán en la carpeta de la asignatura de la Intranet de La Salle: eStudy.