Diagnosticar cáncer o prever el resultado de la inspección de un edificio: así usa la inteligencia artificial el Gobierno vasco

En Osakidetza ya hay dos patologías que se diagnostican desde hace unos pocos meses con apoyo de la inteligencia artificial, el cáncer de mama y el de piel. En Lanbide se “perfila” a los demandantes de empleo con un algoritmo para conocer sus opciones de encontrar trabajo. Y el área de Vivienda lleva desde 2019 con herramientas predictivas para saber, por ejemplo, el número de demandantes de ayudas o si un edificio va a pasar la inspección.
La consejera de Gobernanza, Administración Digital y Autogobierno, María Ubarretxena, ha informado al Parlamento Vasco en respuesta a una pregunta de la representante de EH Bildu Lore Martínez Axpe, que hace seguimiento de los asuntos tecnológicos, que existe ya un catálogo de estos algoritmos de inteligencia artificial utilizados por el Gobierno. Son trece, los tres últimos de este mismo 2025. ¿Tienen riesgos? Sí. El Eustat, por ejemplo, dice tener una herramienta para ayudar a responder a encuestas que se “inventa” cosas y que hasta puede descargar 'malware'. Éste es el listado completo.
1 - K-Means Sckikit-Learn
Desde 2019, el área de Vivienda cuenta con un algoritmo llamado K-Means Scikit-Learn que “segmenta los solicitantes de vivienda de protección pública en función de sus características”. Lo proporciona la empresa Ayesa. Con él, se logra “conocer las necesidades de vivienda de la ciudadanía y considerarlas en el diseño de políticas de vivienda”, ya que repasa variables como la edad, los ingresos o el tipo de familia. Aunque el 'boom' de la inteligencia artificial es reciente, esto viene de lejos. “El proyecto fue iniciado en 2007 por David Cournapeau como parte de un proyecto de Google Summer of Code. Más tarde, otros desarrolladores como Matthieu Brucher, Fabian Pedregosa, Gaël Varoquaux, Alexandre Gramfort y Vincent Michel se unieron y ayudaron a lanzar la primera versión pública en 2010”, se indica. ¿Tiene riesgo usarlo o puede discriminar a determinadas personas en las políticas que se desarrollan? “El sistema no tiene ningún grado de autonomía en la toma de decisiones que puedan afectar al diseño de las políticas de vivienda, todos los resultados que ofrece son evaluados por personas con más de 25 años de experiencia en la dirección y diseño de políticas de vivienda”, agrega el Gobierno.
2 - Gradient Boosted Trees de Sckikit-Learn
También desde 2019 y también de la mano de Ayesa, Vivienda tiene una herramienta automatizada para “determinar cuántas solicitudes con derecho subjetivo de vivienda y prestación económica de vivienda [la ayuda de 300 euros mensuales] habrá en el futuro”. Bebe de similares fuentes de programación que el anterior e igualmente está “supervisado”. “El algoritmo GBT (Gradient Boosted Trees) es un tipo de método de aprendizaje supervisado que pertenece a la familia de los modelos de ensamblado. Más específicamente, es un método de boosting basado en árboles de decisión”, se apunta. “Entendemos que no hay riesgos asociados con el sistema y los métodos utilizados, ya que son procesos sin autonomía propia para la toma de decisiones, sino de apoyo a los técnicos. Además, no es la única fuente de este tipo de información, dentro del Observatorio de la Vivienda hay varios más”, se insiste desde el Gobierno.
3 - Random Forest, Decission Tree, Logistic Regression de Sckikit-Learn
Otra herramienta estrenada en 2019 por el área de Vivienda -y también de Ayesa- fue la “predicción del resultado de inspecciones técnicas de edificio (ITE)”. “El algoritmo determina qué viviendas superarán la inspección técnica y qué viviendas no. Y los motivos. Utilizamos Random Forest, Decission Tree, Logistic Regression de Sckikit-Learn”, explica el Ejecutivo. ¿Sustituye a funcionarios? “El sistema no tiene ningún grado de autonomía en la toma de decisiones porque las inspecciones técnicas de edificios se realizan vivienda a vivienda por personas de forma presencial, independientemente de la información obtenida del sistema”.
4 - Deep Learning con Transformers de LayoutLM
Vivienda implantó en 2022, con Inetum y Vicomtech, un sistema de “extracción inteligente de contenido de documentos”. “El algoritmo extrae de los documentos datos que son necesarios para la verificación del cumplimiento de requisitos de las solicitudes de ayudas para la rehabilitación de viviendas. Utilizamos Deep Learning con Transformers de LayoutLM”, indica el catálogo de inteligencia artificial del Gobierno. Esta base de datos se nutre de “documentación relacionada con la rehabilitación de viviendas: presupuestos, honorarios, escrituras, licencias, certificado, actas o facturas”. “La librería LayoutLMv3 fue desarrollada por un equipo de investigadores de Microsoft, incluyendo a Yiheng Xu, Minghao Li, Lei Cui, Shaohan Huang, Furu Wei y Ming Zhou12”, se puntualiza. Y se agrega: “LayoutLM es una tecnología de 'deep learning' que utiliza transformadores para la comprensión de imágenes de documentos. BERT (Bidirectional Encoder Representations from Transformers) es otro modelo de transformadores que se utiliza ampliamente en el procesamiento del lenguaje natural (NLP)”. También hay una tramitación “manual” posterior de las solicitudes, por lo que no se ven sesgos o problemas de discriminación por la automatización.
5 - MarianNMT, traductor de euskera
El área de Euskera promovió con Vicomtech en 2020 un “servicio de traducción de textos entre varias lenguas” con aplicaciones de euskera a castellano, francés o inglés... y viceversa. “Marian es un marco eficaz y libre de la Máquina de Traducción Neuronal, escrito en C++, con dependencias mínimas. Está siendo desarrollado principalmente por el grupo Microsoft Translator. Muchos académicos (sobre todo la Universidad de Edimburgo y en el pasado la Universidad Adam Mickiewicz de Poznaouse) y muchos colaboradores comerciales contribuyen a su desarrollo. En la actualidad, Microsoft Translator es el motor detrás de los servicios de Neural Machine Translation y es desplegado por muchas empresas, organizaciones y proyectos de investigación (ver lista incompleta a continuación)”, informa el Gobierno. ¿Es fiable? “Las traducciones se basan en varios textos y en la mayoría de los textos se han tenido en cuenta criterios de igualdad y discriminación, pero no en todos ellos (sobre todo si son antiguos). Por lo general, las traducciones de textos tienen criterios correctos, pero cuando se detecta que no se han seguido, se hace llegar a la empresa proveedora una solicitud de entrenamiento del modelo para que las traducciones tengan en cuenta estos criterios. Con la respuesta de la empresa, se realizan pruebas en EJIE hasta asegurarse de que se siguen los criterios. Se han tenido en cuenta las necesidades de los discapacitados por la disponibilidad de servicios de transcripción y síntesis de voz”, se explica. EJIE es la sociedad informática autonómica.
6 - Kaldi, trascripción de textos
En 2020 y de nuevo con Vicomtech, la Administración implementó un “servicio de transcripción escrita de textos desde la voz (textos dictados) en euskera, castellano, francés e inglés”. “Kaldi es una herramienta para conocer el idioma, escrita en formato C++ y licenciada en Apache v2.0. Kaldi está pensado para ser utilizado por investigadores para conocer el lenguaje. Subraya los algoritmos genéricos y las recetas universales. Con algoritmos genéricos nos referimos a 'transformaciones lineales' y no, de alguna manera, a las que se refieren al discurso. Pero no queremos ser demasiado dogmáticos si algoritmos más precisos son útiles. Nos gustaría recetas que se pueden hacer en cualquier set de fechas, más de las que hay que personalizar. Se prefieren algoritmos correctos. Al diseñar las recetas, en principio no debían fracasar. Se ha tratado de evitar recetas y algoritmos que quizá podrían fracasar, aunque 'en el caso normal' no fallan (un ejemplo: el impulso del peso FST, que normalmente ayuda pero que en algunos casos puede empeorar o empeorar la cosa). El código Kaldi está muy demostrado. El objetivo es que todos o casi todos los códigos sean rutinas de prueba”, describe el Ejecutivo. Y se añade: “La transcripción transcribe lo que se dicta por voz. Si el texto oral original sigue criterios de igualdad y discriminación, el texto escrito también seguirá todos los criterios. El propio servicio está pensado para facilitar el uso de aplicaciones a las que pueden acceder los discapacitados”.
7 - Perfilado estadístico de los usuarios de Lanbide
Con la empresa Zylk, Lanbide desarrolló en 2022 un “perfilado estadístico de los datos de demandantes [de empleo] utilizando tecnología de IA para su categorización y segmentación y probabilidad de acceso al empleo”. Se deja claro que es “de uso interno de los orientadores” del Servicio Vasco de Empleo para “mejorar la oferta de Lanbide y cumplir las directrices de empleo”. Los datos solamente se entregarían para una “auditoría independiente”, nunca públicamente. “El sistema es para el apoyo a la decisión, no es capaz de tomar decisiones por sí solo”, agrega el Ejecutivo sobre posibles riesgos de la herramienta.
8 - Forecast de ofertas de trabajo
En 2023, también con Zylk, Lanbide contrató un “sistema ayuda al análisis del estado de la demanda”. De nuevo es para “mejorar” la atención a los demandantes de empleo y, además, bebe también del perfilado automatizado. Hace un “forecast” de la “evolución del empleo por áreas y sectores”. “Es un sistema estadístico y predictivo en la parte de ofertas de empleo. El sesgo del sistema está relacionado con las ofertas de empleo publicadas, pero no con temas de nacionalidad, creencia, etc.”, promete el Servicio Vasco de Empleo.
9 - Copilot Zuzenean
En 2024, el servicio de atención ciudadana de la Administración vasca, conocido como Zuzenean, dispuso un “chat sobre Teams que da soporte a los agentes de Zuzenean sobre la información publicada en Euskadi.eus del catálogo de trámites”. La herramienta la presta OpenAI, es decir, la creadora de Chat GPT. “El sistema consume la información publicada en el catálogo de trámites que es procesada a través de OpenAI para ir alimentando la base del conocimiento que posteriormente utiliza el asistente conversacional. A través del sistema se recogen las peticiones del chat que se tratan con un modelo de lenguaje generativo para entender la preguntar y generar la respuesta (GTP-3.5)”, indica el Ejecutivo. Está todavía en fase de “evaluación” como “apoyo” a la atención prestada por Zuzenean.
10 - Chatbot Canal Web de Encuestas
El Chatbot Canal Web de Encuestas es una “herramienta informática que utiliza la inteligencia artificial generativa para mantener una conversación con los usuarios en tiempo real y ayudar en las dudas a la hora de rellenar una encuesta de Eustat a la ciudadanía o empresas de Euskadi”. Es otra variante de Chat GPT ya que está proporcionada por OpenAI. “Utilizaremos el modelo de lenguaje extendido (LLM) de OpenAI para que este interactúe con el usuario y le facilite información relativa a la encuesta en curso. Para ello, previamente se le pasa un conjunto de datos que conformará su base de conocimiento y se configura el modelo para que sólo responda sobre esta información”, se abunda. “El chatbot de Eustat ha sido probado y entrenado por nuestro personal, para intentar que conteste sólo a las preguntas que sean pertinentes en el rellenado de la encuesta. No obstante, el sistema es generativo por lo que puede inferir a partir de la base de conocimiento facilitada y contestar a preguntas no previstas. Asimismo, está prevista la creación de un log de las conversaciones, que será revisado por el responsable de la encuesta para mejorar las respuestas del chatbot e inmediatamente eliminado. El modelo generativo de respuestas a partir de preguntas es obtenido mediante aprendizaje por refuerzo de personal en OpenAI. En caso de cualquier problema con el chatbot, el encuestado puede contactar con Eustat por los medios habituales (correo electrónico, formulario, ...)”, explica el Gobierno. En este caso, el Ejecutivo sí admite riesgos. “Se han identificados una serie de riesgos y se han tomado medidas para mitigarlos”, se indica. Por ejemplo, “se ha minimizado la base de conocimientos del modelo para que no 'invente' y en sus respuestas sólo se puede ceñir a lo existente en ella”. Además de falsear la respuesta, la herramienta podría “descarga malware” en el equipo del usuario. “Se ha firmado con WeAreClickes un contrato y con OpenAI un acuerdo de procesamiento de datos, de forma que las conversaciones se usen sólo para responder a las personas usuarias (no para entrenar sus modelos). En Eustat se ha establecido un supervisión de los logs y realización de pruebas anual, para garantizar un mínimo de calidad en las respuestas del chatbot”, se informa, asimismo.
11 - Quantus Mama
Osakidetza estrenó Quantus Mama en 2024. Es de la empresa Transmural Biotech. ¿Qué es? “Ayuda a la priorización de pacientes con posibles patologías mamarias por parte de los radiólogos. Su tecnología está basada en el análisis cuantitativo de la textura de la imagen mamaria. Clasifica las imágenes y les otorga una categoría basándose en el sistema conocido como BI-RADS (Breast Imaging-Reporting and Data System) que determina la probabilidad de malignidad de la mama analizada, basadas en valores de sensibilidad en vez de en valores del valor predictivo positivo. Diseñado como una herramienta de ayuda a los clínicos, especialmente en procesos masivos de cribado de pacientes con factores de riesgo, en la detección temprana de patologías mamarias; y priorización de listas de espera”, explica el área de Salud. Hay más detalles técnicos: “El algoritmo consiste en la aplicación de la red ResNet50 tanto para micro calcificaciones como para nódulos, tras ser entrenada con un subconjunto de las 12.960 imágenes proveídas en el dataset”. Si la herramienta da un diagnóstico, ¿es lo que se transmite a la paciente? “Sólo es una ayuda para priorizar listas de trabajo. La decisión final siempre es del radiólogo”, promete Osakidetza. Es para que el profesional “pueda prestar mayor y anterior atención a las imágenes catalogadas por la IA como mayor riesgo de presentar nódulos o microcalcificaciones”. Tiene un riesgo “mínimo”.
12 - Quantus Skin
En 2025, y todavía en fase de “desarrollo”, Osakidetza ha recurrido de nuevo a Transmural Biotech para otra herramienta de apoyo al diagnóstico, Quantus Skin. “Ayuda a la priorización de pacientes con posibles patologías de lesiones dermatológicas malignas a partir de imágenes dermatoscópicas y/o fotográficas. Con sólo analizar y clasificar las imágenes, determina el riesgo de malignidad (melanoma, basal cell carcinoma o squamous cell carcinoma), siendo de gran ayuda en el cribado de pacientes con factores de riesgo y priorización de listas de espera”, se indica. ¿Cómo opera? “El médico de Atención Primaria puede enviar fotos a su dermatóloga de referencia. La especialista recibe las imágenes con un porcentaje de posible malignidad, que le ayudará a priorizar”. Según los datos aportados, “el total de imágenes usadas en el entrenamiento fueron 37.688”. ¿Problemas? “El uso previsto es determinar la probabilidad de que exista un riesgo de cáncer de piel. El resultado proporcionado por Quantus Skin no es un resultado de diagnóstico directo, sino una cuantificación de imagen utilizada como herramienta de ayuda para establecer el riesgo de cáncer de piel. El producto sólo puede causar daño o lesión al paciente en caso de mal uso clínico o confianza excesiva en la información proporcionada”, explica Osakidetza.
13 - Agente de personal: servicio de atención al profesorado
En 2025, Educación ha confiado a Sopra “un nuevo servicio especial de atención al profesorado, que trabaja con la inteligencia artificial”. “Está basado en un Agente de Copilot M365 que trabaja sus respuestas en base a la documentación publicada por el Departamento de Educación en Euskadi.eus, dentro del contexto del profesorado y recursos humanos”, se indica. “Se ha creado un agente con Copilot Studio, y este agente se ha configurado para que responda a las preguntas que le realizan al personal de soporte telefónico, que forma parte del Centro de Soporte Funcional de Hezkuntza (CSF), y que atiende al teléfono habilitado a tal efecto, para el personal docente del Departamento. El agente es capaz de responder en castellano y en euskera, y además devuelve en su respuestas información de qué urls o de qué forma puede resolver el demandante su petición o duda”, explica Educación. “El personal que usa la IA ha recibido una formación específica en la materia y con su conocimiento es capaz de discernir si la respuesta es correcta o no. En cualquier caso, el personal del Soporte Funcional de Hezkuntza (CSF) es el que usa el componente IA y filtra la respuesta. No está pensado para que interactúe directamente con las personas llamantes. El sistema responde correctamente a preguntas generales, no a casos muy concretos que se escalan, según el protocolo establecido en las delegaciones o se le indica a la persona llamante que puede usar otras medios como Komunikabide o Tramitagune”, abunda el área dirigida por Begoña Pedrosa.
0