Calidad de los datos

La calidad de los datos es nuestra prioridad. En esta página explicamos cómo medimos y garantizamos la fiabilidad de la información que publicamos.

Metodología de validación

Cada dato que ingresa en nuestro sistema pasa por un proceso de validación multinivel antes de ser publicado. Este proceso combina verificaciones automáticas y evaluación semántica mediante modelos de lenguaje.

Nivel 1 — Validación de formato

  • Comprobación de campos obligatorios (título, fecha, fuente, identificador).
  • Verificación de tipos de datos (fechas válidas, importes numéricos, URLs accesibles).
  • Detección de registros duplicados.

Nivel 2 — Validación de coherencia

  • Contraste de valores contra rangos históricos (detección de outliers).
  • Verificación de relaciones entre campos (por ejemplo, fecha de fin posterior a fecha de inicio).
  • Comprobación de integridad referencial entre categorías relacionadas.

Nivel 3 — Evaluación semántica (LLM scoring)

  • Análisis de la calidad del texto: claridad, coherencia y adecuación del resumen generado.
  • Clasificación temática automática y verificación de la categoría asignada.
  • Puntuación global de calidad de 0 a 100 para cada registro.

Indicadores de calidad

Para cada categoría de datos, monitorizamos los siguientes indicadores:

Indicador Descripción
Completitud Porcentaje de campos rellenados respecto al total de campos esperados.
Frescura Tiempo transcurrido desde la última actualización exitosa de la fuente.
Cobertura Porcentaje de registros de la fuente original que hemos procesado correctamente.
Precisión Tasa de registros que pasan todas las validaciones sin errores.
Puntuación LLM Media de la puntuación de calidad semántica (0-100) de los registros de la categoría.

Panel de calidad

Panel de calidad en desarrollo

Estamos trabajando en un panel interactivo que mostrará los indicadores de calidad en tiempo real para cada categoría de datos. Estará disponible próximamente.

Reportar un error

Si detectas un dato incorrecto, incompleto o desactualizado, te agradeceremos que nos lo comuniques. Puedes escribirnos a info@datos-publicos.es con el asunto «Error de datos», indicando la URL de la página y la fuente oficial de referencia. Los reportes de errores son nuestra máxima prioridad.