Metodología

Dónde van mis impuestos se ha levantado sobre dos piezas: la primera es un parser que recorre las páginas publicadas por el Ministerio de Hacienda y Administraciones Públicas, extrae la información que queremos tratar y la convierte en reutilizable. Sobre esta parte trabaja la segunda pieza del proyecto, una web que lee esos presupuestos en formato abierto y los visualiza.

Extrayendo los datos

El código del parser, desarrollado en Ruby, está disponible en Github.

Los Presupuestos Generales del Estado (PGE) se encuentran disponibles en la web del Ministerio de Hacienda y Administraciones Públicas. Antes de comenzar a trabajar con las cuentas públicas es muy recomendable leer el Libro Azul, que ofrece una visión general de la estructura de los mismos.

En Dónde van mis impuestos hemos trabajado con la versión de los presupuestos que no está en tomos estructurados en distintos PDF, sino en un archivo comprimido que contiene un enorme conjunto de ficheros .HTM con nombres aparentemente crípticos. De hecho, trabajamos con datos desde 2007 porque ese fue el primer año en el que los PGE se publicaron no sólo en PDF, sino también en html.

Hemos utilizado la Serie Verde para extraer la información sobre gastos porque es la que contiene un mayor nivel de detalle. Los gastos de la Seguridad Social, eso sí, están en la Serie Roja. De hecho, todos los ingresos que mostramos en la web salen también de la Serie Roja.

En ocasiones nos hemos encontrado con algunas inconsistencias en los PGE. Algunas partidas de la Seguridad Social, por ejemplo, se muestran a un nivel menos desglosado que la información que ofrecen los ministerios. Por esa razón, puede que te encuentres con subtotales en la página web cuyo desglose en categorías inferiores no es completo.

Otro de los problemas con los que nos hemos encontrado es que, aunque la descripción de las grandes categorías económicas es constante, hay una parte que no es igual en todos los organismos, la que va más allá de las dos cifras de código. Por ejemplo, 480 significa algo distinto según de qué ministerio estemos hablando. Para asegurarnos de que esas diferencias no afecten al análisis, al exportar los datos los hemos marcado por organismo de origen.

Los ingresos y gastos mostrados incluyen los del Estado, los organismos autónomos adscritos a ministerios, las agencias estatales, la Seguridad Social y otras entidades con presupuesto limitativo. Esto es lo que se conoce como presupuesto consolidado, que no incluye a fundaciones o empresas del sector público como Radio Televisión Española.

El resultado de la extracción de los datos para los distintos ejercicios presupuestarios está en estas carpetas. En cada una de ellas (por ejemplo, la de 2022), los datos están organizados en varios ficheros: uno para ingresos, otro para gastos y otros tres para las tres categorías del presupuesto: económica, orgánica y funcional. Esta organización en distintos archivos ahorra espacio y resulta más clara, en nuestra opinión, que la creación de un único fichero de gastos y otro de ingresos.

Además, para asegurarnos de que todo es correcto, cada una de esas carpetas anuales incluye una comprobación automática que verifica que las sumas de determinados datos de nuestros archivos dan como resultado las cifras de los resúmenes oficiales de las cuentas que aparecen en la Serie Roja.

Mostrando los datos

La página web está desarrollada en Python (Django) y es una adaptación de la que David Cabo realizó originalmente para el Gobierno de Aragón con el diseño de La Personnalité. Todas las visualizaciones están hechas en D3.js. El código actual está disponible en Github.

En Dónde van mis impuestos mostramos la evolución temporal de la estructura económica (¿cómo se gasta/ingresa?) y funcional (¿en qué se gasta?), pero no la división orgánica. Esto es: no mostramos el gasto, por ejemplo, de un ministerio a lo largo de los años. Esto es así porque los cambios de nombres, fusiones de organismos, divisiones… que se suelen producir en las administraciones públicas hacen que sea muy difícil cruzar esos datos y la información que podríamos ofrecer no sería rigurosa.

Así, a diferencia de otras visualizaciones, la división por defecto del gasto es la funcional, porque creemos que es la que mejor muestra en qué se emplea el dinero público. Lo importante no es qué ministerio gestione un gasto, sino cuál es el objetivo de esa política. En el apartado de ingresos utilizamos la división económica.

En la visión global de ingresos y gastos mostramos solo los capítulos del 1 al 7, esto es, el gasto no financiero. Lo hacemos así para evitar que la amortización de la deuda distorsione los datos. Es decir, nos quedamos sólo con el pago de intereses. Esto práctica es común: así aparecen, por ejemplo, las cifras generales que publica el Ministerio de Hacienda y Administraciones Públicas en el Libro Amarillo que acompaña a los PGE.

La visualización del reparto del presupuesto tampoco incluye los capítulos 8 y 9. Una vez que bajas un escalón y, por ejemplo, visualizas la distribución de una de las políticas, sí aparecen todos los capítulos en los totales.

Para que la información fuera completa, deberíamos mostrar no sólo el presupuesto, sino la ejecución presupuestaria, como hicimos en las webs de Aragón, Navarra o Castilla La Mancha. El problema es que no podemos comparar los PGE con su ejecución porque el ministerio publica los datos en un PDF con mucho menos nivel de detalle y estructurados de tal forma que impide cruzarlos con los presupuestos. Por eso, en los próximos meses vamos a trabajar para reclamar al Gobierno que la ejecución presupuestaria, esto es, la aplicación efectiva del presupuesto, se publique de forma detallada y en formatos reutilizables. Sólo así podremos realizar un seguimiento completo a la gestión del dinero público.

Agradecimientos

Dónde van mis impuestos es un proyecto de Civio al que se han sumado:

  • Juan Elosua (@jjelosua) adaptó al mapa de comunidades autónomas español la visualización sobre presupuestos regionales que VISup había realizado para Italia.
  • Jacobo Elosua (@ezaromedia) escribió los textos de la primera versión de la web, que se publicó en diciembre de 2010, y apoyó moralmente desde el principio.

Thanks to BrowserStack for providing us with a free account to test Intenet Explorer compatibility!