UPC Programa Big Data Management, Technologies and Analytics

Programa del Máster en Big Data de la Universidad Politécnica de Catalunya:

Data Management

  • Contexto. La sociedad de los datos y el paradigma data-driven.
  • Casos de uso.
  • Cloud computing e Ingeniería de Servicios (XaaS).
  • La necesidad de un cambio de paradigma: NOSQL.

Principios básicos de las bases de datos no relacionales (NOSQL).

  • Fundamentos arquitectónicos.
  • Nuevos modelos de datos.

Fundamentos: nuevas arquitecturas.

  • Conceptos básicos.
  • One size does not fit all.
  • Gestión y procesamiento distribuido de los datos.
  • Gestión y procesamiento de los datos en memoria.

Principales arquitecturas de referencia.

  • Fundamentos: nuevos modelos de datos.
  • Conceptos básicos.
  • Modelos de datos no estructurados o semi-estructurados.
  • Principales modelos de datos en el mundo NOSQL: Key-Value,
  • Document-oriented, Graphs, Graphs Semantics i Streams.
  • Modelización de datos avanzada (para sistemas no relacionales).
  • Principales Families de Gestores NOSQL.
  • Gestores Key-Value.
  • Concepto y principios.
  • El ecosistema Hadoop: HDFS, HBase, MapReduce y Spark.
  • Consideraciones específicas de modelización.
  • Gestores Document-oriented.
  • Concepto y principios.
  • Ejemplo: MongoDB y Aggregation Framework.
  • Consideraciones específicas de modelización.
  • Gestores Column-oriented.
  • Concepto y Principios.
  • Ejemplo: Kudu (base de datos) y Parquet (ficheros).
  • Consideraciones específicas de modelización.
  • Gestores de Grafos.
  • Conceptos y principios.
  • Tipos de grafos y operaciones.
  • Ejemplo: Neo4J y Cypher.
  • Consideraciones específicas de modelización.
  • Gestores de Grafos Semánticos.
  • Concepto y Principios: el paradigma Open/Linked Data.
  • Como abrir los datos.
  • Arquitecturas basadas en grafos vs tecnología relacional.
  • RDF y SPARQL.
  • Consideraciones específicas de modelización.

Integración de datos.

  • Procesos intensivos de datos y ETLs.
  • Polystores y sistemas políglotas.
  • Orquestadores: Muskeeter.

Visualización.

  • Procesos de visualización.
  • Técnicas de visualización.

Data Analytics

  • ¿Qué es el knowledge discovery?
  • Estadística básica.
  • Introducción a R.

Pre-procesamiento de datos.

  • Limpieza y adecuación de los datos.
  • Transformaciones.

Técniques básicas de análisis.

  • Regresión múltiple.
  • Profiling.

Análisis Multivariante.

  • Análisis de componentes principales.
  • Clustering.
  • Árboles de decisión.

Aprendizaje Automático.

  • Concepto.
  • Fundamentos matemáticos.

Principales técnicas de aprendizaje automático.

  • Reglas de asociación.
  • Métodos lineales supervisados.
  • Redes neuronales.
  • Máquinas de vector soporte.
  • Bosques aleatorios.

Procesamiento de texto.

  • Pre-procesamiento y preparación de los datos.
  • Principales técnicas de texto analíticas.
  • Information retrieval.

Análisis de series temporales.

  • Pre-procesamiento y preparación de les datos.
  • Forecasting.
  • Detección de outliers.

Análisis de los datos avanzados.

  • Paquetes de R para el procesamiento paralelo.
  • R sobre bases de datos relacionales.
  • Análisis de los datos en entornos distribuidos utilizando HDFS y Spark.
  • Spark R.
  • Data Management and Analytics

Infraestructura.

  • Introducción a los entornos Cloud.
  • Virtualización.
  • Servicios Oracle.

Almacenamiento distribuido.

  • El Ecosistema Hadoop.
  • Sistemas Key-Value: HBase.

Procesamiento distribuido.

  • MapReduce.
  • Spark: SparkSQL. Spark Streaming. Spark Graphs.
  • Análisis de datos en entornos distribuidos: MLlib. SparkR.

Document Stores.

  • MongoDB.
  • ElasticSearch.

Bases de datos en grafo.

  • Neo4J.
    Grafos semánticos: GraphDB y SPARQL.
  • Arquitectura de sistemas Big Data.
  • Negocio y emprendimiento en Big Data

Introducción: El entorno competitivo de la empresa y Big Data.

  • Big Data Landscape.
  • Casos de éxito.

Técnicas de ideación de negocio.

  • Clientes y usuarios.
  • Definición de productos y servicios.

Herramientas de modelización de negocio: Business Model Canvas.

  • Elementos que lo conforman.
  • Casos prácticos.
  • Resolución casos: Twitter, Facebook, etc.

Proceso de financiación.

  • Finanzas.
  • Financiación privada: Business Angels y Capital Risk.
  • Financiación pública.

Márqueting.

Creación de una empresa.

  • Aspectos legales: Regulación de los datos.
  • Aspectos económicos.

Consideraciones éticas del Big Data: Negocio y Privacidad.

  • Presentaciones y pitch.
  • Proyecto

Volver al Listado de Másteres de Big Data