Curso de Introducción al Análisis de Datos con R
Martes de 18.00 a 20.30 hs, desde el 7 de mayo al 18 de junio.
Arancel (en pesos argentinos)
Inscripción temprana (hasta el 24/04/2019) $4500
Inscripción tardía (desde el 25/04/2019) $5000
Descuento para socios de SADIO 50%
La vacante se reserva con el pago del arancel y los cupos son limitados.
Para inscribirse o recibir más información, comunicarse a informacion@sadio.org.ar o al (011) 4371-5755. (Consulte por descuentos para grupos)
Duración: 7 clases
Modalidad
Las clases serán teórico – prácticas. Se invita a los alumnos a traer sus computadoras portátiles. Se recomienda a los participantes que instalen previamente R (http://www.r-project.org/) y RStudio (http://www.rstudio.com/) en las notebooks que vayan a utilizar en el curso.
Carga Horaria
17,5 horas, distribuidas en 7 clases de 2,5 horas.
Fundamentos
R comenzó como un software para análisis gráfico y estadístico de datos, con los años se fue extendiendo a otras áreas y hoy en día es la herramienta de elección de estadísticos y también para científicos de datos, analistas financieros, bioinformáticos, etc.
Esta popularidad se origina en que desde su origen se lo concibió como una plataforma gratuita de código abierto, a la que numerosos grupos aportaron bibliotecas para realizar diferentes tipos de tareas, que incluyen, por ejemplo, el análisis de textos, de imágenes, la interacción con bases de datos o herramientas para paralelismo.
Esta gran versatilidad requiere un uso intensivo de la línea de comandos en la interfaz de usuario, por la cual muchos potenciales usuarios evitan aprender R, ya que en una primera aproximación lo encuentran difícil de usar.
Objetivo
Facilitar a los alumnos los primeros pasos en R. Brindarles entrenamiento en las tareas básicas de lectura, escritura y manipulación de datos, análisis exploratorio y estadístico básico. Se trabajará con funciones de R base y con las más nuevas del conjunto de paquetes tidyverse. El curso incluye un tutorial para aprender a instalar R y RStudio.
Temario y Contenidos
Las diferentes unidades del programa del curso contarán con material e instrucciones en un sitio web preparado por el docente responsable del curso. A continuación se detalla el programa del curso:
1. Instalación de R y RStudio. Instalación de bibliotecas en R
2. Tipos de datos básicos: numéricos, carácter, lógicos y factores
3. Sintaxis: asignaciones, expresiones
4. Tipos de datos complejos: filtrado, selección y modificación de conjuntos de datos
5. Análisis exploratorio de datos. Estadística descriptiva. Construcción de tablas y resúmenes de datos.
6. Gráficos en R
7. Lectura de datos desde archivos y url
8. Introducción al modelado estadístico: regresión lineal básica.
Conocimientos previos
Los interesados no requieren conocimientos previos de R. Es recomendable contar con un conocimiento inicial de estadística, aunque en el curso se hará un repaso de estos temas.
Destinatarios
El curso está dirigido a quienes requieran utilizar R para el análisis de datos y que no cuentan con experiencia previa. El curso estará orientado al uso de R para resolver problemas básicos de preparación de datos, análisis exploratorio y análisis estadístico básico.
Instructor
Marcelo A. Soria:
Director de la maestría de explotación de datos y descubrimiento del conocimiento de la Universidad de Buenos Aires (UBA) y profesor de la Facultad de Agronomía (UBA). Realiza tareas de investigación en bioinformática y ciencia de datos en biología, ha publicado más de cuarenta trabajos de investigación en revistas internacionales. Ha dictado cursos y conferencias sobre ciencia de datos, bioinformática y R en instituciones públicas y privadas del país y del exterior.