“Alexa, abre Cibeles”. Con esta simple orden comienza Prototipo Cibeles+, uno de los desarrollos más innovadores del Ayuntamiento de Madrid y que permite, a través del lenguaje natural, acceder a toda información urbanística de la ciudad.

Conocer el uso de un determinado local, su edificabilidad o la normativa que se le aplica ya es posible gracias Prototipo Cibeles+, el último proyecto de la Subdirección General de Innovación e Información Urbana del Ayuntamiento de Madrid y que tiene como base la Inteligencia Artificial.

Una evolución de Prototipo Cibeles y que supone una importante mejora en el acceso a la información urbanística al contar con la habilidad de leer textos normativos responder utilizando voz o escritura mediante procesamiento del lenguaje natural.

Un desarrollo de Saturno Labs, una startup muy especializada en lenguaje natural y en español, algo que resultó decisivo, bajo la dirección de José María Boyano Sánchez, subdirector General de Innovación e Información Urbana, y Jesús Cerezo Arillo, jefe de Servicio de Integración de Procesos y que ha dado como resultado un completo servicio de información urbanística las 24 horas del día, los 7 días de la semana y los 365 días al año y mejora la comodidad y eficiencia de la interacción con la Administración, apoyándose en un lenguaje natural y sencillo.

El nuevo desarrollo del Ayuntamiento madrileño se basa en Alexa y Twitter como canales para recibir la pregunta sobre la normativa urbanística y responder los datos extraídos de los textos normativos del Plan General.

La Inteligencia Artificial contesta

“El usuario lanza la pregunta a través de estos canales y el sistema, automáticamente, detecta qué le están preguntando y para qué localización; en función de esa posición, localiza la información dentro del articulado y elabora una respuesta que incluye tanto el dato concreto solicitado como el número y epígrafe del artículo de las Normas Urbanísticas en que se encuentra. Además, invita a su interlocutor a que reciba en su correo electrónico un resumen con enlaces a la documentación”, explica José María Boyano Sánchez.

Conocer el uso de un determinado local, su edificabilidad o la normativa que se le aplica ya es posible gracias Prototipo Cibeles+

Un proceso muy sencillo para el usuario pero tras el que se esconde un complejo sistema tecnológico. “Conocer el uso de un determinado local, su edificabilidad o la normativa que se le aplica ya es posible gracias Prototipo Cibeles+”, apunta Jesús Cerezo Arillo.

Rapidez era uno de los requerimientos del desarrollo, explican, pero además que el sistema fuera capaz de entender las preguntas que el usuario podía hacer sobre un texto redactado hace más de 25 años, “con unas normas lingüísticas legales. Hoy, si hemos aprendido algo, es que si tuviéramos que redactar de nuevo un texto así, deberíamos hacerlo de un modo muy diferente, acercándonos mucho más a datos concretos que una máquina pueda interpretar”, explican.

Lenguaje natural en español

Uno de los grandes desafíos a la hora de definir el proceso de Cibeles+ se encuentra en el idioma, pues no existen grandes proyectos globales de investigación para potenciar el procesamiento del lenguaje natural en lengua castellana.

De hecho, explican es la primera vez que se realiza un proyecto de esta complejidad en español. “La falta de conjuntos de datos bien estructurados en esta lengua no permite el entrenamiento de modelos similares, lo que convierte al proyecto en todo un reto a la hora de combinar el uso de la voz y el procesamiento del lenguaje natural con los servicios municipales y con el objetivo de localizar la información en tiempo real y mediante cualquier dispositivo”.

Para ello, Prototipo Cibeles+ toma como texto de partida las Normas Urbanísticas del Plan General de 1997 en su edición consolidada actual; el sistema somete e textos a un proceso de extracción y limpieza para obtener de forma automatizada un documento en formato CSV que, tras ello, se atomiza de forma automática este documento con el fin de integrar subestructuras más pequeñas y fáciles de indexar, eliminando extractos de textos no útiles, como las notas a pie de página.

Como explican los responsables de Prototipo Cibeles+, para realizar esta indexación se sigue la jerarquía más común para los textos normativos basada en Título, Capítulo, Sección y Artículo. Una vez extraído, limpiado e indexado el texto de forma automática, se obtiene un dataset con el que ya puede trabajar el resto del sistema.

Dada la volatilidad de las normas urbanísticas, con constantes actualizaciones, una de las máximas del prototipado ha sido conseguir que el uso de la herramienta de acceso a la normativa sea universal, sin programar reglas o contemplar casuísticas específicas, permitiendo así su uso inmediato sobre cualquier otro texto normativo, sin más labor que una nueva ingesta del texto.

ElasticSearch para las búsquedas

Las búsquedas se realizan mediante ElasticSearch, un software open source con el que se ha conseguido un porcentaje del 100% de acierto en las pruebas realizadas para la detección del artículo concreto al que se refiere una pregunta.

Obtenido ese dato, el sistema debe ser capaz de generar una respuesta con la información pedida. Para ello se han probado y analizado los ocho modelos de inteligencia artificial más potentes en el ámbito de la Question Answering, obteniendo resultados desiguales. La estrategia planteada ha consistido en medir el desempeño de cada modelo para un tipo de respuesta a través de una puntuación numérica y elegir la mejor opción para cada caso. Algunos modelos son capaces de ofrecer respuestas completas, otros las dan más cortas y específicas con la información requerida, otros disponen un texto más elaborado, pero ninguno de ellos llega a ser capaz de dar una solución que abarque toda la problemática de una manera totalmente eficiente.

Para su desarrollo, se probaron y analizaron los ocho modelos de inteligencia artificial más potentes en el ámbito de la Question Answering

Ese análisis tan exhaustivo ha permitido elaborar un documento de directrices que habrá que tener en cuenta a la hora de redactar unas normas urbanísticas. Básicamente, se debe huir de los formalismos propios de este tipo de textos (por ejemplo, el empleo tan común del modo subjuntivo), deben tener una redacción técnica y deben ofrecer valores únicos por frase para los parámetros regulados (no yuxtaponiendo valores distintos dentro de frases condicionales).

Innovar desde el seno de la AA.PP

Tan solo tres meses y 9.000 euros han hecho posible Prototipo Cibeles+ que, como sus responsables explican, ha sido posible porque es precisamente un prototipo, “ahora el desafío sería escalarlo” y el hecho de apoyarse en Saturno Labs, una startup, “que tiene una estructura empresarial mucho más sencilla y, por lo tanto, resultan más accesibles a nivel económico”.

“Un proyecto soñado hace meses por la Subdirección General de Innovación e Información Urbana se ha convertido hoy en una realidad. Su habilidad mostrada para leer los textos normativos supone un gran paso en la innovación para brindar a la ciudadanía una información urbanística fácil y prestar unos servicios públicos de calidad y con un alineamiento tecnológico pleno con la sociedad”, afirma Boyano Sánchez.

Ese sería el segundo paso y el más difícil: escalar y llevar al mercado el proyecto, convertirlo en un servicio. Una nueva etapa que José María Boyano Sánchez y Jesús Cerezo Arillo saben que son muchos los obstáculos a salvar, especialmente por temas administrativos y de contratación propios de la Administración Pública.

Aunque, poco a poco, confían en que estas barreras se solventen, haciendo posible que sean muchos más los ejemplos de innovación como Prototipo Cibeles+ que surgen desde el seno de la Administración con el propósito último de mejorar el servicio al ciudadano.

“La AA.PP. tiene más datos que Google y Prototipo Cibeles demuestra cómo sí es posible extraer el valor a esa información. Es necesario seguir avanzando en desarrollos tecnológicos innovadores como este, que permiten ser proactivos, mejorar la atención al ciudadano”, afirman al unísono.

Deja una respuesta

Ya puedes descargar totalmente gratis el Nº8 de nuestra revista

Revista número 8 de ByTIC: ¿Qué aporta la tecnología 5G a la Administración Pública?

ByTIC Media