Imputación de datos faltantes del Censo de Población y Vivienda de Uruguay utilizando técnicas de estadística espacial

María Eugenia Riaño

Resumen


En general, la calidad y cobertura del Censo de Población y Vivienda de Uruguay del año 2011 fue calificada como positiva. Sin embargo, su implementación no estuvo exenta de inconvenientes. La omisión se concentró en zonas socioeconómicamente más vulnerables, lo que afectaría el mecanismo utilizado por el gobierno para seleccionar la población beneficiaria de programas de transferencias monetarias. El patrón de la población elegible y de la propia omisión hace necesaria una regionalización previa a la imputación, dada la distribución espacial heterogénea en el mapa de la variable de interés. Las regiones se construyen mediante el algoritmo de árboles oblicuos de decisión. Se ajustan modelos autorregresivos espaciales en cada región que son evaluados utilizando validación cruzada, y se comparan los resultados con el de un modelo global. Los modelos con menor error dentro de cada región muestran un rezago similar medido en distancia, a excepción de un caso. El modelo global presenta un error del mismo orden que los modelos locales, pero presenta autocorrelación espacial en los residuos, por lo que se decide trabajar con los modelos obtenidos por región. Los resultados de la imputación muestran una subestimación de la población elegible de un 5% sobre el total estimado con datos censales.

Palabras clave


Árboles de decisión; Modelos SAR autorregresivos; Validación cruzada

Texto completo:

PDF



Licencia Creative Commons
Licencia Creative Commons Atribución-CompartirIgual 4.0 Internacional.