Si querés procesar datos de la Encuesta Permanente
de Hogares (EPH) elaborada por el Instituto Nacional de Estadística y
Censos de la República Argentina (INDEC) mediante el lenguaje de
programación R, la librería
eph
tiene por objeto facilitar tu trabajo.
El paquete cumple un rol fundamental en la democratización de la posibilidad de procesar los datos publicados por INDEC y así obtener conclusiones independientes de aquellas publicadas en los informes elaborados por el organismo. Dado que la información de la EPH constituye una de las principales fuentes para el análisis de las problemáticas sociales presentes en Argentina, el paquete no sólo posibilita investigaciones académicas y periodísticas, sino que también contribuye a la formulación de políticas públicas fundamentadas en evidencia.
Algunas de sus funciones son:
get_microdata()
: Descarga las bases
de microdatos,
organize_panels()
: Permite armar un
pool de datos en panel de la EPH continua,
organize_cno()
: Clasifica las
ocupaciones según el Clasificador Nacional de Ocupaciones (CNO)
2001
organize_caes()
: Clasifica las
actividades económicas según el Clasificador de Actividades Economicas
para encuestas Sociodemograficas (CAES) Mercosur 1.0 y el CAES
Mercosur
organize_labels()
: Etiqueta las
bases siguiendo el último diseño
de registro
map_agglomerates()
: Mapa de
indicadores por aglomerado
El paquete también cuenta con dataframes útiles para el trabajo con la EPH. Algunos de estos son:
diccionario_regiones
: Diccionario
de regiones según el diseño de registro de la EPH
diccionario_aglomerados
:
Diccionario de aglomerados según el diseño de registro de la
EPH
centroides_aglomerados
: Tabla de
centroides de los aglomerados (basado en https://www.indec.gob.ar/indec/web/Nivel4-Tema-1-39-120)
adulto_equivalente
: Tabla de
valores de adulto equivalente segun sexo y edad (ver
definición mtodológica)
Para descargar la versión estable desde CRAN:
install.packages("eph")
Para descargar desde R-universe:
install.packages("eph", repos = "https://ropensci.r-universe.dev")
Para la versión en desarrollo:
# install.packages('devtools')
# si no tiene instalado devtools
::install_github("holatam/eph") devtools
Ejemplo de descarga de microdatos
# Cargo la libreria
library(eph)
<- get_microdata(
base_individual year = 2018:2019, # especifco el año
trimester = 1, # el trimestre
type = "individual", # y el tipo de base
vars = c("PONDERA", "ESTADO", "CAT_OCUP")
# opcionalmente, puedo especificar las variables que deseo utilizar.
)
base_individual#> # A tibble: 117,320 × 3
#> PONDERA ESTADO CAT_OCUP
#> <int> <int> <int>
#> 1 684 4 0
#> 2 1008 3 0
#> 3 1008 1 1
#> 4 1008 2 0
#> 5 886 1 2
#> 6 594 3 0
#> 7 594 3 0
#> 8 546 3 0
#> 9 509 1 3
#> 10 509 1 3
#> # ℹ 117,310 more rows
Podés citar este paquete como “se obtuvieron y/o normalizaron los datos de la Encuesta Permanente de Hogares (EPH-INDEC) utilizando el paquete de R ‘eph’ (Kozlowski et al, 2020)”.
La referencia completa para incluir en la bibliografía es:
Carolina Pradier, Guido Weksler, Pablo Tiscornia, Natsumi Shokida, Germán Rosati, & Diego Kozlowski. (2023). ropensci/eph V1.0.0 (1.0.0). Zenodo. https://doi.org/10.5281/zenodo.8352221
Si necesitás la entrada bib:
@software{carolina_pradier_2023_8352221,
author = {Carolina Pradier and
Guido Weksler and
Pablo Tiscornia and
Natsumi Shokida and
Germán Rosati and
Diego Kozlowski},
title = {ropensci/eph V1.0.0},
month = sep,
year = 2023,
publisher = {Zenodo},
version = {1.0.0},
doi = {10.5281/zenodo.8352221},
url = {https://doi.org/10.5281/zenodo.8352221}
}
Este paquete se propone incorporar cualquier función de propósitos generales que utilice como base los datos de la Encuesta Permanente de Hogares. Todos los aportes en este sentido son bienvenidos.
Si trabajas con la EPH y querés agregar tu función, te recomendamos que leas los siguientes consejos sobre cómo como colaborar