encuestasbo 0.1.0 (en desarrollo)
Primera versión. Encuesta de Hogares (EH) 2012–2024 procesada y funcional de punta a punta.
Datos
-
EH 2012–2024 (13 años). Además de
personayvivienda, ahora se incluyen todas las bases temáticas del INE según disponibilidad por año:equipamiento,gastos_alimentarios,gastos_no_alimentarios,seguridad_alimentaria,discriminacion,turismo,culturaydefunciones. Se acceden conget_eh(anio, tabla = "..."); ver las tablas de cada año concatalogo_eh(). -
ECE 4T-2015 a 3T-2025 (40 trimestres, serie completa), nivel persona, procesados desde el repositorio abierto del INE (
nube.ine.gob.bo). En 2020 (T2–T4) la ECE fue de cobertura solo urbana por la pandemia: esos trimestres se marcan concobertura = "urbana"encatalogo_ece()y emiten un aviso al usarse. -
catalogo_encuestas: inventario maestro de EH y ECE. -
codebook_eh_metaycodebook_ece_meta: diccionarios extraídos de las etiquetas SPSS. -
variable_canonica_map: mapa de armonización de la EH a nombres canónicos. -
metadata_encuestas+ficha_tecnica(): ficha técnica oficial del INE (universo, cobertura, marco y diseño muestral, factor de expansión, tasa de respuesta) extraída de la metadata DDI de ANDA para los 32 estudios.
Acceso
-
get_eh()/get_ece()y atajos (get_personas_eh(),get_viviendas_eh(),get_personas_ece(),get_viviendas_ece()), con filtros por departamento y área y modos"arrow"/"tibble"/"duckdb". -
catalogo_eh()/catalogo_ece(). - Caché:
encuestasbo_cache_dir(),_info(),_clear(),update_encuestasbo().
Armonización entre años
-
armonizar_eh(),get_eh_armonizada(),variables_armonizadas(),grupos_variables(). Apoyada en variables derivadas del INE (ingresos, pobreza, educación, empleo) con nombres estables entre años. -
get_eh_armonizada()se respalda en un único Parquet armonizado precalculado (~5 MB, 13 años, esquema consistente) y admiteas = "tibble"/"arrow"/"duckdb"para consultas cross-año perezosas (DuckDB por debajo). Corrige además el apilado de años con tipos mixtos (p. ej.estratotexto/numérico). - Las variables categóricas armonizadas tienen etiquetas estables entre años;
etiquetar_valores()las detecta automáticamente en datos armonizados (sin indicar año). Además se unifican valores que cambiaban de código entre años (nivel_edu: “Otros” era 4/5/9 según el año → ahora siempre 4). -
etiquetar_valores()ahora también etiquetadeptocon los nombres de los nueve departamentos (1 = Chuquisaca … 9 = Pando) en datos armonizados. - Nuevas variables armonizadas de vivienda y salud:
tipo_vivienda,tenencia_vivienda(recodificada a un esquema canónico; el INE usó dos órdenes de códigos, 2012-2015 vs 2016+) ytiene_seguro_salud(afiliación a algún seguro, 0/1). Las de vivienda se unen a la capa persona porfolio. Nuevos grupos"vivienda"y"salud"engrupos_variables(). Validadas contra ARU (tenencia propia ~62 %, casa ~75 %, sin seguro 2023 = 14,3 %).
Indicadores con diseño muestral
- Nuevos atajos que envuelven el diseño +
srvyry devuelven la estimación con intervalo de confianza, con desagregación opcional víapor =:tasa_pobreza()(EH),tasa_desempleo(),tasa_subocupacion()yempleo_vulnerable()(ECE). Utilidadgrupo_edad()para cohortes etarias. - Validados contra estudios de terceros (Fundación ARU) que usan los mismos microdatos del INE: pobreza por área, subocupación por sexo/departamento y empleo vulnerable coinciden con las cifras publicadas.
Armonización de la ECE
-
armonizar_ece()ahora añade variables canónicas estables entre versiones del cuestionario (cambió en 2019):sexo,categoria_ocupacional(mapeada desdes2_20hasta 2018 ys2_18desde 2019, con codificaciones distintas),ocupado,desocupadoysubocupado. Esto hace comparables indicadores como el empleo vulnerable a lo largo de toda la serie.
Diseño muestral
-
diseno_eh()/diseno_ece(): devuelven un diseñosrvyrlisto (ids = upm,strata = estrato,weights = factor,nest = TRUE,survey.lonely.psu = "adjust"). La tasa de pobreza 2023 estimada coincide con la cifra oficial del INE.
Documentación
- Sitio pkgdown con 6 viñetas: primeros pasos; catálogo, diccionario y ficha técnica (interactivo con DT); la Encuesta de Hogares (pobreza, ingresos, empleo); diseño muestral; armonización entre años; y empleo trimestral (ECE).
