Open Data para el Gobierno de Aragón (2017)

Datos generales del proyecto

  • Descripción: ORDEN IIU/776/2017, de 25 de mayo, por la que se encomienda al Instituto Tecnológico de Aragón la realización en 2017 de actividades relativas a la apertura de datos del Gobierno de Aragón.
  • Nº de Boletín: 111.
  • Órgano emisor: Departamento de Innovación, Investigación y Universidad.
  • Fecha de concesión: 25/05/2017.
  • Fecha de publicación: 13/06/2017.
  • Fechas de ejecución: 13/06/2017 – 31/12/2017.

Presentación y objetivos

Con los objetivos de crear valor económico en el sector TIC a través de la reutilización de la información pública, aumentar la transparencia en la Administración, fomentar la innovación, mejorar los sistemas de información de la Administración y generar interoperabilidad de datos entre webs del sector público, se atribuyen al Departamento de Innovación, Investigación y Universidad las competencias de elaboración y gestión de proyectos y programas para el diseño y la coordinación de la apertura de datos en el Gobierno de Aragón y su implantación en colaboración con los diferentes Departamentos y organismos de la Administración autonómica, así como la difusión de dichos datos a través del portal de datos abiertos del Gobierno de Aragón (opendata.aragon.es).

Aragón Open Data inició el proyecto de apertura de datos públicos por Acuerdo de 17 de julio de 2012 del Gobierno de Aragón, y el 6 de febrero de 2013 se presentó el Portal opendata.aragon.es. A lo largo de este tiempo se han realizado numerosos trabajos que permiten la incorporación de nuevos datos e información disponible a terceros (ciudadanos, empresas, etc.).

A día de hoy, la compleja casuística que presenta la administración pública autonómica en la generación de datos e información se refleja en la proliferación de un gran número de webs, subdominios y portales bajo aragon.es o no relacionados con este dominio, circunstancias que dificultan el acceso y uso de la información por parte de usuarios y por los propios servicios del Gobierno de Aragón.

Por este motivo, dado el número de webs, dominios y portales actuales del Gobierno de Aragón y en virtud de las competencias de mejorar los sistemas de información de la Administración; de generar interoperabilidad de datos entre webs del sector público y de adopción de estándares técnicos en materia de sociedad de la información, y en particular, de los relacionados con la interoperabilidad, se considera necesario que toda la información institucional y relacionada con la administración autonómica existente en la web, se pueda recopilar para ser ofrecida desde un único punto, independientemente del dominio, estructura, o posibilidades de los diferentes portales actuales.

En base a este planteamiento, y de la competencia de la apertura de datos en el Gobierno de Aragón, surge dentro de la Dirección General de Administración Electrónica y Sociedad de la Información, la necesidad de recuperar toda la información institucional ofrecida en la web para que pueda ser explotada, analizada y reutilizada, y que sirva a terceros (otras webs institucionales, medios de comunicación, desarrolladores, o ciudadanos) de manera estructurada y controlada, siendo Aragón Open Data el punto de acceso para este fin.

Asimismo, se pretende que la información obtenida sirva poder comprobar, y en su caso enriquecer, mediante casos reales y prácticos el funcionamiento del Esquema de Información Interoperable de Aragón (EI2A), desarrollado a través de la encomienda al Instituto Tecnológico de Aragón para la realización en 2016 de actividades relativas al proyecto de apertura de datos del Gobierno de Aragón, formalizada mediante la Orden IIU/461/2016, de 9 de mayo, y cuyos trabajos dieron como resultado, entre otros, el Esquema de Información Interoperable de Aragón (EI2A).

Con este planteamiento se conseguiría aplicar el EI2A sobre procesos y datos reales. Estos datos que se pretenden relacionar con el Esquema provienen de aplicar técnicas de web crawling, spidering o araña sobre los dominios existentes del Gobierno de Aragón en la web, técnicas consistentes en rastrear, capturar y almacenar la información y datos existentes en las diferentes páginas y portales institucionales de la administración autonómica. Este proceso de rastreo y captura implica aportar los parámetros adecuados en herramientas relacionadas con el rastreo de páginas web (web crawlers) para que de acuerdo a determinados criterios indexen y reconozcan su contenido, capturando aquella información más relevante de la misma, por ejemplo su título, textos, y ubicación en la web (URL).

Toda esa información y datos capturados se almacenarán para su posterior explotación de acuerdo al EI2A, convirtiendo así la información, datos y contenido institucional rastreado y capturado que se encuentra en la web de manera dispersa, no homogénea, no controlada y no explotable, en datos estructurados, analizables en conjunto y servidos bajo Aragón Open Data, a disposición de terceros, aplicaciones, servicios y ciudadanos.

Estas tareas requieren identificar, estudiar y analizar las tendencias actuales, el desarrollo tecnológico necesario y los procesos a ejecutar sobre los portales y dominios web del Gobierno de Aragón, y todo ello amparado en un marco legal que permita el uso de técnicas de web crawling, así como un importante conocimiento sobre interoperabilidad y ontologías semánticas. Tareas, que siguiendo en parte la línea relativa al desarrollo del EI2A y complementando las actividades relativas al proyecto de apertura de datos del Gobierno de Aragón, han sido encomendadas al Instituto Tecnológico de Aragón (ITAINNOVA).

Entidades a la que se encomienda la realización de las tareas

Resultados del proyecto

Las actuaciones de ITAINNOVA en este proyecto centran en

  • Coordinación, gestión, planificación y dirección de forma eficaz de los trabajos de la encomienda durante todo su desarrollo, para asegurar que la ejecución y la entrega de resultados se realizan en el tiempo preestablecido y dentro de los presupuestos pactados, para asegurar la calidad del trabajo y de la documentación entregada y para coordinar la cooperación entre los miembros del equipo.
  • Elaboración de una metodología a seguir para la extracción de la información de las webs designadas de acuerdo al marco técnico-jurídico aplicable al uso de técnicas de web crawling, seguimiento a las acciones de extracción de la información y elaboración de un informe que estudiará la posibilidad de publicar la información obtenida como datos abiertos y las condiciones bajo las cuales podrá reutilizarse.
  • Elaboración de un informe de vigilancia tecnológica sobre tecnologías, software y servicios de web crawling que permitan la recuperación de información institucional ofrecida en webs, dominios y portales actuales del Gobierno de Aragón.
  • Elaboración de documentos que recojan los requisitos y el diseño de la arquitectura del sistema a desarrollar, con el objetivo de capturar información proporcionada por webs, subdominios y portales del Gobierno de Aragón y estructurarla de acuerdo al modelo semántico del Esquema de Información Interoperable de Aragón (EI2A) extendido para facilitar la estandarización de la información y facilitar su acceso y reutilización.
  • Desarrollo de la solución semántica o sistema de acuerdo al estudio de Vigilancia Tecnología, requisitos y diseño de la arquitectura. La solución semántica se encarga de la puesta en marcha del software y servicios de web crawling, del procesamiento de la información no estructurada textual capturada, de la categorización de webs, de la aplicación de técnicas de minería de datos y tratamiento de textos para la extracción de conceptos, y del almacenamiento de la información procesada a través de tecnologías/bases de datos Big Data que permiten el tratamiento de grandes cantidades de información de forma dinámica y escalable.
  • Adaptación y mejora del modelo semántico Esquema de Información Interoperable de Aragón (EI2A) para estructurar de manera homogénea datos básicos recopilados de las webs, subdominios y portales del Gobierno de Aragón previamente seleccionadas y definir relaciones entre ellos, con el objeto de estandarizar información, automatizar su acceso y reutilizarla.
  • Elaboración del Catálogo técnico de estándares utilizados en el EI2A para que su uso repercuta en la mejora de la capacidad del Gobierno de Aragón para cooperar con otras Administraciones y con la ciudadanía, facilitando el ejercicio del derecho de acceso a la información pública y el desarrollo socioeconómico de Aragón.
  • Análisis de la información extraída a través de los software y servicios de web crawling seleccionados.
  • Análisis de la forma en la que poder integrar y publicar datos a través de la API de Aragón Open Data.
  • Realización de pruebas para verificar y validar que todas las funcionalidades definidas y desarrolladas satisfacen las necesidades del Gobierno de Aragón.
  • Despliegue del sistema e infraestructura de Big Data (software y/o servicios de web crawling, bases de datos NoSQL, framework Moriarty, clúster de Big Data de procesamiento y almacenado de la información a través del uso de tecnología Spark, etc.) en servidores de ITAINNOVA.
  • Transferencia del sistema a través de la elaboración de un informe de plan de datos donde se especifica el modo en que los datos recopilados se van a ceder, almacenar y gestionar, así como los requerimientos de las máquinas en producción.
  • Difusión del sistema a través de la realización de dos jornadas de difusión en el entorno del Gobierno de Aragón para dar a conocer el trabajo realizado.

A lo largo de este tiempo se han realizado numerosos trabajos para conseguir la automatización en la publicación de la información para asegurar que terceros puedan reutilizarla de la mejor manera. Dado el volumen de datos que empieza a existir, dentro de la línea de trabajo de la automatización en la gestión de la información, están empezando a tener una especial relevancia todos aquellos elementos que ayuden en la mejora de la estructuración de la información y en la estandarización de los datos que contienen las bases de datos.

Presupuesto

  • Presupuesto de ITAINNOVA: 81.757,00 €.

Para el desempeño de las tareas encomendadas, el Departamento de Innovación, Investigación y Universidad asignará a ITAINNOVA la cantidad de 81.757 € (ochenta y un mil setecientos cincuenta y siete), que irán con cargo a las aplicaciones presupuestarias:

  • 17040 G/5424/609000/91001 (PEP 2012/000354) por importe de 40.878,50 €.
  • 17040 G/5424/609000/14201 (PEP 2012/000354) por importe de 40.878,50 €.

del Presupuesto de gastos de la Comunidad Autónoma de Aragón para el ejercicio 2017.

Esta actuación es susceptible de financiación dentro del Programa Operativo FEDER 2014-2020, en el eje prioritario 2 de Mejorar el uso y la calidad de las TIC y el acceso a las mismas.

Skip to content