Proceso editorial

La credibilidad de datos-publicos.es depende de la calidad y fiabilidad de la información que publicamos. En esta página describimos cómo seleccionamos las fuentes, con qué frecuencia actualizamos los datos, cómo los validamos y qué hacemos cuando detectamos errores.

1. Selección de fuentes

Solo utilizamos fuentes oficiales e institucionales. Esto significa que cada dato publicado en el sitio procede de un organismo público español reconocido. Nuestras fuentes incluyen, entre otras:

  • Boletín Oficial del Estado (BOE) y boletines autonómicos.
  • Base de Datos Nacional de Subvenciones (BDNS).
  • Plataforma de Contratación del Sector Público.
  • Portal de subastas del BOE.
  • Ministerios y agencias estatales (SEPE, MUFACE, Agencia Tributaria, etc.).
  • Instituto Nacional de Estadística (INE).
  • Dirección General del Catastro.
  • Portales de datos abiertos de la Administración General del Estado y de las Comunidades Autónomas.

Criterios de inclusión: la fuente debe ser un organismo público oficial, disponer de datos en formato accesible (web, API o datos abiertos) y publicar información de interés general para los ciudadanos.

Criterios de exclusión: no utilizamos medios de comunicación, blogs, redes sociales, foros ni fuentes sin verificar, por oficiales que puedan parecer.

2. Frecuencia de actualización

Cada categoría tiene su propio ritmo de actualización, adaptado a la frecuencia con la que la fuente original publica nuevos datos:

Categoría Frecuencia aproximada
Legislación / BOE Diaria (días hábiles)
Subvenciones (BDNS) Diaria
Oposiciones Diaria (días hábiles)
Contratación pública Diaria
Subastas judiciales Diaria
Carburantes Diaria
Calendario fiscal Mensual / según publicación AEAT
Prestaciones Semanal
Jurisprudencia Semanal
Sanidad Variable (según publicación)
Catastro Variable
Transparencia Variable
Cuentas públicas Trimestral / anual
Vivienda Mensual / trimestral
Extranjería Variable

3. Validación de calidad

Cada dato que entra en nuestro sistema pasa por un proceso de validación en varias etapas:

3.1. Validación automática

  • Formato: comprobación de que los campos obligatorios están presentes y en el formato correcto (fechas, importes, identificadores).
  • Coherencia: detección de duplicados, valores fuera de rango y contradicciones internas.
  • Completitud: porcentaje de campos rellenados respecto al total esperado.

3.2. Puntuación de calidad (LLM scoring)

Para determinadas categorías, empleamos modelos de lenguaje (LLM) para evaluar la calidad del contenido textual: claridad de los resúmenes generados, coherencia de las clasificaciones temáticas y adecuación del lenguaje. Este sistema asigna una puntuación de calidad a cada registro.

3.3. Revisión de alertas

Los registros que no superan los umbrales de calidad se marcan para revisión manual. Los datos con errores graves se excluyen de la publicación hasta que se resuelva el problema.

4. Gestión de errores

A pesar de nuestros controles, pueden producirse errores. Cuando detectamos un dato incorrecto — ya sea por nuestros sistemas de monitorización o por aviso de un usuario — seguimos este protocolo:

  1. Verificación: comprobamos el dato contra la fuente original.
  2. Corrección inmediata: si el error está en nuestro lado, lo corregimos lo antes posible.
  3. Reporte al usuario: si nos lo reportó un usuario, le informamos de la resolución.
  4. Mejora del pipeline: si el error revela un fallo sistemático, actualizamos las reglas de validación para evitar su recurrencia.

Si encuentras un dato incorrecto, te agradeceríamos que nos lo comuniques a info@datos-publicos.es indicando la URL de la página afectada y, si es posible, una referencia a la fuente oficial.

5. Trazabilidad

Cada dato publicado incluye, siempre que sea posible, una referencia a su fuente original y la fecha de última actualización. Esto permite al usuario verificar la información directamente en la fuente institucional.