BIG DATA Y HADOOP: Nuevos tratamientos avanzados de la información
Información do curso
BIG DATA Y HADOOP: Nuevos tratamientos avanzados de la información
Tipo | Curso Complementario | ||||
Código | C3121401 | ||||
Nome | BIG DATA Y HADOOP: Nuevos tratamientos avanzados de la información |
|
|||
Modalidade | Presencial | ||||
Descrición | En este curso, los asistentes aprenderán cómo utilizar Hadoop para implementar soluciones para grandes volúmenes de datos. Se cubre la mayoría de los componentes para proporcionar la comprensión en profundidad de BigData y Hadoop. Los asistentes aprenderán habilidades de trabajo para el desarrollo de soluciones de grandes volúmenes de datos. |
||||
Información de contacto: | |||||
· Teléfono | 986-812244 | ||||
· Fax | |||||
· Enderezo electrónico | |||||
Compartir: |
Descrición
En este curso, los asistentes aprenderán cómo utilizar Hadoop para implementar soluciones para grandes volúmenes de datos. Se cubre la mayoría de los componentes para proporcionar la comprensión en profundidad de BigData y Hadoop. Los asistentes aprenderán habilidades de trabajo para el desarrollo de soluciones de grandes volúmenes de datos.
Entidades organizadoras
Escola de Enxeñería Industrial (en colaboración con VITAE CONSULTORES)
Información sobre o calendario (datas)
Período de preinscrición | 11/10/2013 00:00 - 31/01/2014 23:59 |
---|---|
Período de matrícula | 25/11/2013 00:00 - 31/01/2014 23:59 |
Período de docencia | 07/02/2014 - 22/02/2014 |
Prazas e créditos
Número mínimo de participantes | 18 |
---|---|
Número máximo de participantes | 25 |
Créditos teóricos | 1.7 |
Créditos prácticos | 1.3 |
Validación de libre elección | 2 |
Destinatarios/as
Estudiantes universitarios, administradores de datos, profesionales de BI (Business Intelligence) y gestión de datos que deseen conocer las nuevas herramientas para gestión avanzada de datos.
Obxectivos
Los asistentes trabajarán las siguientes competencias técnicas:
- Describir y entender qué es Big Data
- Entender y dominar las capacidades de Hadoop.
- Comprender los problemas de Big Data.
- Instalar y conf igurar Hindsight
- Entender y dominar HDFS y MAP/Reduce
- Cargar y transformar datos usando Hive / Pig / Sqoop / Flume
- Escribir aplicaciones con Map/Reduce
- Entender Data Science y los algoritmos de datos
- Administrar HDInsight
- Dominar Big Data Picture
Condicións de acceso
1.membros da comunidade universitaria, e
2.persoas alleas á mesma que acrediten uns estudios mínimos equivalentes a 2º de bacharelato.
Criterios de selección
Será condición IMPRESCINDIBLE que cada inscrito disponga de un ordenador portátil con el que asistirá a todas las clases del curso. Asimismo deberán conocer, al menos a un nivel básico, el lenguaje SQL.
Se recomienda que los asistentes tengan al menos experiencia básica en Bases de Datos, en Minería de Datos o bien en Business Intelligence.
La asignación de plazas se realizará por riguroso orden de solicitud de preinscripción y abono de las tasas de matrícula hasta agotar las plazas disponibles.
Las becas se asignarán, con posterioridad a la matrícula, entre el alumnado de la Universidade de Vigo que se matricule en el curso, en base estricta a la Nota Media de su expediente académico.
Calendario
Viernes en horario de 15.30h-20.30h y sábados en horario de 9h-14h
- 7,8,14,15,21 y 22 de febrero de 2014
Programa
MÓDULOS TEÓRICOS:
INTRODUCCIÓN A BIG DATA: Big Data y Ciencias de Datos. Motivación. Ecosistema Hadoop. Casos de uso.
CONCEPTOS BÁSICOS DE HADOOP: HDFS. Map/Reduce. Ecosistema Hadoop. API HDInsight
CLOUD HDINSIGHT: Concepto de nube. Funciones. Limitaciones. Azure Blob Storage,
INSTALACIÓN DE HDINSIGHT SERVER: Requisitos. Clusters. Limitaciones.
SISTEMA DE ARCHIVOS HADOOP (HDFS): Introducción. Optimización. Almacenamiento de datos.
MAP/REDUCE: Introducción. Entrada y salida de datos. Ejecución de programas Hadoop.
HDFS Y MAP/REDUCE: Entorno de desarrollo. Ejecución y depuración de aplicaciones.
HIVE: Movimiento y manipulación de datos. Características de Hive. HIVE ODBC e integración con Excel.
PIG Y SCOOP: Carga, transformación y descarga de datos. Transferencia de datos.
FLUME (TRANSFERENCIA DE LOGS DE GRAN TAMAÑO): Introducción. Arquitectura. Aplicaciones de análisis de datos.
INTRODUCCIÓN A DATA SCIENCE: Aprendizaje automático básico. Análisis de Datos y Métodos Estadísticos. Introducción a Mahout y Pegasus.
ALGORITMOS DATA SCIENCE: Text mining. Clasificación. Clustering. Batch base. Minería gráfica. Networks.
INTEGRACIÓN DE BIG DATA Y BUSINESS INTELLIGENCE: Hive ODBC. Data Explorer. Arquitecturas de BI.
ADMINISTRACIÓN DE HDINSIGHT: Administración y Monitorización del cluster. Ejecución de Jobs. Servicios HDInsight.
BIG DATA CON MICROSOFT: SQL Server. PDW. Cuándo usar cada uno.
TRATAMIENTO DE DATOS PROCEDENTES DE REDES SOCIALES
MÓDULOS PRÁCTICOS:
DESARROLLO DE EJERCICIOS PRÁCTICOS: Realización de casos prácticos relacionados con los contenidos teóricos del curso.
Modo de pagamento
O importe da matrícula é de 290 €. O pago farase efectivo en calquera oficina de NovaGalicia Banco (NGB), indicando o nome e código do curso.
Aqueles alumnos que sexan traballadores por conta allea, poderán lograr unha bonificación del curso a través das cotas da Seguridade Social da empresa. Información aquí.
Ofrécese a posibilidade de obter unha bolsa de 135€ que será percibida por aquel inscrito que cumpra as seguintes condicións:
- Estar a cursar actualmente estudos na Universidade de Vigo.
- Dispoñer da mellor nota media de expediente académico (licenciatura/diplomatura/grado/enxeñería) de entre os que cumpran a condición anterior.
Impartido en
AULA 8 da Escola de Enxeñería Industrial (Sede Campus)
Profesorado
Antonio Soto (SOLIDQ)
Sistema de avaliación
Consideraranse APTOS todos os matriculados no curso que asistan, cando menos, ao 75% das sesións e realicen satisfactoriamente os traballos que durante o curso se lles encomenden.