Publicador de contenidos

Diplomado en analítica de datos y Big Data

En un mundo globalizado donde cada minuto se generan enormes cantidades de datos de todo tipo (estructurados, semiestructurados y no estructurados), resultantes de las actividades cotidianas a nivel personal o de las técnicas y métodos aplicados en los procesos de producción, optimización y comercialización a nivel organizacional e institucional, es indispensable contar con diferentes metodologías y herramientas que permitan generar información de alto valor que apoye la toma de decisiones. De acuerdo con una infografía creada por domo.com, muestra que cada minuto en el mundo se generan datos resultantes del envío de 473.400 mensajes en Twitter, se consumen 97.222 horas de streaming en Netflix, se publican 2.083.333 mensajes en Snapchat, más de 120 profesionales se unen a Linkedin, Amazon sirve 1.111 productos, son vistos 4.333.560 vídeos en Youtube, Skype registra 176.220 llamadas, los usuarios comparten 49.380 imágenes en Instagram, 750.000 canciones son escuchadas en Spotify, Google ofrece 3.877.140 búsquedas en Internet. En la actualidad se considera que se generan más datos en dos días que en toda la historia contemporánea. El tratamiento y análisis de datos masivos se conoce como Big Data y es una de las claves fundamentales para la gestión eficaz en las empresas.

 

Las tecnologías Big Data se emplean actualmente en la mayoría de las áreas o disciplinas y en distintos sectores que van desde la salud hasta el sector industrial. La creciente generación de datos digitales obtenidos como resultado de las aplicaciones móviles, las redes sociales y los procesos relacionados con el internet de las cosas, constituyen una ventana para la extracción de conocimiento de manera eficiente, expedita y accesible.

 

Adicionalmente a la aplicación de las tecnologías Big Data, se ha confirmado con resultados cuantificables la eficiencia que aporta la ciencia de datos para la toma de decisiones orientadas a optimizar la rentabilidad de las empresas, acrecentar el retorno de la inversión, consolidar el posicionamiento de los productos, perfeccionar la experiencia del usuario, responder a iniciativas regulatorias y proveer productos y servicios conforme con los requerimientos, costumbres y perfiles de los diversos clientes o usuarios en general.

 

El diplomado en Big Data y analítica de datos, está  orientado a fortalecer los conocimientos, prácticas y aplicaciones en el tratamiento, procesamiento y analítica de datos en los diferentes campos del conocimiento para la toma de decisiones, mediante la integración de cinco cursos que permiten de una manera modular alcanzar los objetivos propuestos brindando la opción al usuario de realizar los cursos en forma independiente obteniendo las certificaciones de asistencia y, cuando culmine los requisitos establecidos (cinco cursos), el certificado correspondiente en Big Data y Analítica de datos.

Objetivos

  • Brindar conocimiento de los fundamentos y potencialidades que proporciona las tecnologías Big Data en la gestión y manejo de grandes volúmenes de datos de tipo estructurado, semiestructurado y no estructurado.
  • Comprender la utilidad y ventajas de las soluciones de Big Data generadas mediante las distintas aplicaciones y software para el tratamiento y análisis de datos que redunden en la generación de conocimiento.
  • Proporcionar a los participantes métodos y herramientas apropiadas para el procesamiento y análisis de datos que genere información útil para la toma de decisiones a nivel organizacional.

Dirigido a

Público en General

Duración

120 horas

Competencias

Al finalizar el diplomado, el participante habrá adquirido y generado habilidades y destrezas para:

  • Identificar los conceptos básicos de Big Data y su potencial de aplicación.
  • Aplicar las herramientas requeridas para el procesamiento de datos.
  • Emplear los métodos apropiados para el análisis de datos.
  • Interpretar la información generada del análisis de datos para la toma de decisiones.
  • Realizar procesos de gestión basado en la toma de decisiones.
  • Explorar diversas aplicaciones y software para la extracción, tratamiento,  visualización y análisis de datos para la toma de decisiones

Contenido

Módulo 1: Fundamentos de Big Data y sistema de almacenamiento de datos (20 horas)

    • Definición y generalidades

    • Tipos de datos

    • Calidad de los datos

    • Gestión de los datos

      • Generación de datos

      • Adquisición de datos

      • Almacenamiento

      • Análisis de los datos

    • Tecnologías de los Big Data

      • Hadoop

      • Hadoop Distributed File System (HDFS)

      • MapReduce

      • Hadoop Ecosystem

  • Las nuevas BBDD

  • Características de las BBDD NoSQL

  • Tipos de Bases de Datos NoSQL

    • Bases de datos Clave ¿ Valor

    • Bases de datos documentales

    • Bases de datos en grafo

    • Bases de datos orientada a objetos

    • Bases de datos orientadas en columna

    • Modelo híbrido

    • Comparación principal BBDD NoSQL

  • Ejemplos de bases de datos NoSQL

  • Hbase

  • DynamoBD

  • MongoBD

  • Casandra

  • Redis

  •  

    Módulo 2: Diseño de un proyecto Big Data y casos de uso (20 horas)

  • Metodología PMBOK

  • Etapas en el diseño de un proyecto Big Data

  • Gestión del proyecto y seguimiento

  • Reelección de OBMA en 2012

  • Amazon y sus empleados

Módulo 3: Ciencia de datos (20 horas)

  • Naturaleza de los datos masivos

    • Fuentes de generación de datos masivos

    • Características y valor de los datos

    • Dificultades computacionales

  • Visualización de datos masivos

    • Gráficas

    • Coordenadas paralelas

    • Gráficas interactivas

    • Proyecciones

  • Métodos de clasificación de datos

    • Análisis discriminante

    • Algoritmo de k- vecinos más cercanos

    • Modelos de regresión

    • Redes bayesianas

    • Árboles de decisión

  • Técnicas de Machine Learning

    • Métodos kernel

    • Máquinas de soporte vectorial

    • Algoritmo EM

    • Modelo de mezclas gaussianas

    • Redes neuronales

 

Módulo 4: Análisis estadístico - Software R y RStudio (30 horas)

  • Introducción

  • Características de R y RStudio

  • Operaciones en R
  • Tipos de datos
  • Wal-Mart

  • Usos de Big Data

    • Carga de datos estructurados

    • Carga de datos no estructurados

  • Análisis de datos

    • Distribuciones de frecuencia

    • Herramientas de visualización de datos

    • Análisis descriptivo de datos

    • Principios de estadística inferencial

    • Análisis gráfico

  • Manipulación de texto

    • Web scraping

    • Manipulación básica de texto

    • JSOM y XML

    • Representación gráfica

Módulo 5: Aplicación del software Knime ¿ Power BI (30 horas)

 

  • Introducción a Knime ¿ Power BI

    • Entorno de Knime ¿ Power BI

    • Repositorio de nodos

    • Acciones básicas

    • Construcción de un flujo de datos

  • Acceso a datos

    • Leer datos de archivos

    • Carga de bases de datos

    • Servicios en línea

    • Otras fuentes de datos

  • ETL y manipulación de datos

    • Filtrado de filas y columnas

    • Agregaciones

    • Trabajo y concatenación

    • Transformación: conversión, reemplazo, estandarización

    • Preparación de datos para análisis

  • Exportar datos

    • Escribir en un archivo

    • Generar informes

  • Análisis y visualización de datos

    • Histogramas

    • Datos paralelos

    • Matriz de puntos

    • Gráfico lineal

  • Análisis predictivo

    • Conceptos básicos de minería de datos

    • Regresiones

    • Elaboración del modelo (Clúster y árboles de decisión)

    • Evaluación del modelo

    • Control de flujo

       

      • Parametrización del flujo de trabajo: Variables de flujo

      • Ejecución de partes del flujo: Bucles

      • Limpiar el flujo de trabajo

       

Estrategia metodológica

Para el logro de los objetivos planteados, el programa del diplomado contempla:

  • Exposición de conceptos por parte del profesor
  • Guías y talleres de soporte aplicados
  • Desarrollo de ejercicios prácticos en el computador dirigidos por el docente. Trabajo de retroalimentación y exploración para realizar fuera de clase
  • Computadores personales
  • Talleres de ejercicios
  • Software RStudio, Power BI y Knime
  • Aula virtual

Criterios de evaluación

El estudiante debe demostrar competencias en el manejo de cada herramienta con el desarrollo de los talleres y guías de trabajos de las clases y los trabajos que se le soliciten. Adicionalmente, debe asistir mínimo al 80% de las horas de clase programadas.

La evaluación mide el:

  •    Desarrollo Cognitivo (conocimiento)
  •    Desarrollo de Habilidades (operativo)

Al finalizar el diplomado, se entregará una certificación de asistencia y aprobación.

Al finalizar el diplomado, se entregará una certificación de asistencia y aprobación.

Valor del diplomado

Inscripción: $ 56.000

Institucional: $ 2.325.000

Particulares: $ 2.800.000


 

Solicita más información

Departamento de Tecnologías del Conocimiento

PBX: 650 0000 - Extensiones:

Bogotá, Villa Académica: 1220-1221-1222

Bogotá, Facultad de Medicina: 2127

Cajicá, Campus: 3042

e-mail: tecnologias.conocimiento@unimilitar.edu.co tecnologias.conocimientocampus@unimilitar.edu.co