Publicador de contenidos

Analítica Estratégica de Datos

Las tecnologías Big Data se emplean actualmente en la mayoría de las áreas o disciplinas y en distintos sectores que van desde la salud hasta el sector industrial. La creciente generación de datos digitales obtenidos como resultado de las aplicaciones móviles, las redes sociales y los procesos relacionados con el internet de las cosas, constituyen una ventana para la extracción de conocimiento de manera eficiente, expedita y accesible.

El software libre R y su interfaz de entorno Rstudio se constituyen en un referente estadístico para el análisis de datos masivos, ya que provee diversos métodos que aportan a la ciencia de datos herramientas útiles para la toma de decisiones orientadas a optimizar la rentabilidad de las empresas, acrecentar el retorno de la inversión, consolidar el posicionamiento de los productos, perfeccionar la experiencia del usuario, responder a iniciativas regulatorias y proveer productos y servicios conforme con los requerimientos, costumbres y perfiles de los diversos clientes o usuarios en general.

Objetivos

  • Identificar las principales características de los tipos de datos y su carga.
  • Emplear las diferentes herramientas y métodos para la representación y análisis de los datos.
  • Aplicar los distintos métodos para la manipulación y análisis de texto incorporando procesos de minería de datos
  • Explorar las diversas técnicas de Machine Learning empleadas para el análisis de los datos.

Dirigido a

Público en General

Duración

30 horas

Competencias

Al finalizar el curso el estudiante deberá estar en capacidad de:

  • Identificar las principales características de los tipos de datos y su carga.
  • Emplear las diferentes herramientas y métodos para la representación y análisis de los datos.
  • Aplicar los distintos métodos para la manipulación y análisis de texto incorporando procesos de minería de datos
  • Explorar las diversas técnicas de Machine Learning empleadas para el análisis de los datos.

Contenido

Módulo 1: Introducción - 6 horas

  •  Características de R y RStudio
  • Operaciones en R
  • Tipos de datos
  • Carga de datos estructurados
  • Carga de datos no estructurados

Módulo 2: Análisis de los datos - 8 horas

  • Análisis de datos
  • Distribuciones de frecuencia
  • Herramientas de visualización de datos
  • Análisis descriptivo de datos
  • Principios de estadística inferencial
  • Análisis gráfico

Módulo 3: Manipulación de texto ¿ 8 horas

  • Manipulación de texto
  • Web scraping
  • Manipulación básica de texto
  • JSOM y XML
  • Representación gráfica

Módulo 4: Estadística y ciencia de datos con R - 8 horas

  • Árboles de decisión
  • Igualdad de medias
  • Modelos de regresión
  • Clústering con k - medias

Estrategia metodológica

Durante las clases:

Instrucciones previas por parte del profesor, desarrollo de talleres con ejercicios prácticos sobre cada uno de los temas, dirigidos por el docente, trabajo para realizar fuera de clase, monitoreado por el aula virtual.

En ayudas didácticas:

  • Sala de sistemas con computador para cada participante.
  • Pantalla interactiva para proyección de imagen.

Criterios de evaluación

El participante debe demostrar competencias en el manejo de cada uno de los módulos desarrollados mediante la presentación de evaluaciones y asistir mínimo al 80% de las horas de clases programadas.

La evaluación debe medir el:

  • Desarrollo Cognitivo (conocimiento)
  • Desarrollo de Habilidades (operativo)

Al finalizar el curso, el departamento de tecnologías del conocimiento de la Universidad Militar Nueva Granada le entregará una certificación de asistencia y aprobación.

Valor del curso

 


 

Solicita más información

Departamento de Tecnologías del Conocimiento

PBX: 650 0000 - Extensiones:

Bogotá, Villa Académica: 1220-1221-1222

Bogotá, Facultad de Medicina: 2127

Cajicá, Campus: 3042

e-mail: tecnologias.conocimiento@unimilitar.edu.co tecnologias.conocimientocampus@unimilitar.edu.co