Cómo combinar y analizar datos complejos
Offered By: University of Maryland, College Park via Coursera
Course Description
Overview
En este curso, aprenderás a usar las ponderaciones de las encuestas para estimar estadísticas descriptivas (como medias y totales) y cantidades más complejas (como parámetros de modelos para regresiones lineales y logísticas). Se explicarán las capacidades de software, haciendo especial hincapié en R®. El curso también abarcará nociones básicas sobre vinculación de registros y búsqueda de coincidencias estadísticas, dos procesos que son cada vez más importantes para combinar datos de fuentes distintas. En el curso, también se exploran los problemas éticos que suscrita la combinación de conjuntos de datos. Es posible que haga falta obtener el consentimiento informado de las personas para que permitan la vinculación de sus datos. Conocerás las diferencias entre los requisitos legales de distintos países.
Syllabus
- Estimación básica
- Tras completar los módulos 1 y 2 de este curso, entenderás cómo estimar estadísticas descriptivas, generales y de subgrupos de los datos de encuestas. Revisaremos el software usado para la estimación (R, Stata o SAS) con ejemplos sobre cómo estimar determinados valores, como medias, proporciones y totales. También aprenderán a estimar parámetros en modelos lineales, logísticos y de otro tipo, y conocerán las opciones de software, haciendo especial hincapié en R. En los módulos 3 y 4, se hablará sobre cómo agregar datos a los análisis. Esto supone conocer de técnicas de vinculación de registros y saber qué se requiere a fin de obtener los permisos necesarios para vincular datos.
- Modelos
- En el módulo 2, se explica cómo estimar parámetros de modelos lineales y logísticos mediante datos de encuestas. Tras completar este módulo, entenderás cómo los métodos utilizados son distintos de los que se usan en datos que no son de encuestas. También hablaremos sobre las características de los conjuntos de datos de encuestas que deben tenerse en cuenta cuando se estiman errores estándar de parámetros de modelos estimados.
- Vinculación de registros
- El módulo empieza con el debate actual en torno al uso de más registros administrativos (vinculados) en el Sistema Estadístico Federal de los EE. UU. y una motivación general para vincular registros. Se ofrecerán numerosos ejemplos que explican por qué es útil vincular datos. Se analizarán los desafíos de la vinculación de registros. También se incluye un resumen breve sobre las técnicas clave de vinculación.
- Ética
- En este módulo, se mencionarán los problemas clave a la hora de obtener el consentimiento para la vinculación de registros. La falta de consentimiento puede provocar sesgos en las estimaciones. Se darán ejemplos de investigaciones actuales, así como sugerencias prácticas sobre cómo obtener el consentimiento de vinculación.
Taught by
Richard Valliant, Ph.D.
Tags
Related Courses
Análise de Segmentação de MercadoFundação Instituto de Administração via Coursera Aprendiendo Python con estadística descriptiva
Coursera Project Network via Coursera Basic Descriptives using R Cmdr
Coursera Project Network via Coursera Basic Statistics
University of Amsterdam via Coursera Introduction to Business Analysis Using Spreadsheets: Basics
Coursera Project Network via Coursera