Volver al blog
5 de febrero de 2026 · 10 min · Técnico

El dataset: 26 años de contratación pública española

44M+ registros desde el año 2000. Fuentes, cobertura, normalización y los retos de construir un dataset longitudinal de esta escala.

El valor de un sistema de inteligencia depende directamente de la calidad y profundidad de sus datos. Este artículo describe las características del dataset que alimenta elicita_ sin revelar las fuentes específicas ni los procesos propietarios de construcción.

Escala

El dataset contiene más de 55 millones de registros de contratación pública española desde el año 2000. Incluye contratos de todos los niveles administrativos: estatal, autonómico, provincial y municipal.

Cobertura

Estimamos una cobertura superior al 90% del gasto público publicable español. La cobertura no es uniforme en el tiempo — los datos más recientes tienen mayor completitud que los históricos, especialmente para administraciones locales de pequeño tamaño.

Normalización

El reto principal de construir un dataset longitudinal de esta escala es la normalización. Los formatos de publicación han cambiado múltiples veces. Los identificadores de organismos no son consistentes entre fuentes. Los códigos CPV han evolucionado.

El sistema de normalización resuelve estas inconsistencias mediante técnicas de vinculación de entidades y reconciliación de esquemas. El resultado es un dataset donde es posible trazar la historia completa de contratación de un organismo a lo largo de décadas.

Actualización

El dataset crece cada día. Los procesos de ingestión automatizados incorporan nuevos registros y actualizan los existentes. Cada nuevo dato alimenta los modelos predictivos y mejora la precisión de las estimaciones.

Limitaciones

Ningún dataset es perfecto. Existen contratos menores que no se publican. Hay organismos con prácticas de transparencia deficientes. Los datos históricos anteriores a 2010 tienen mayor tasa de registros incompletos. El sistema documenta estas limitaciones y las incorpora en los intervalos de confianza de sus predicciones.

Equipo Elicita

Análisis e inteligencia sobre contratación pública española

Compartir

Prueba Elicita gratis

65M registros de contratación pública. Predicción de renovaciones. Inteligencia competitiva.

Empezar gratis