Small Language Models for Legislative Summarization: An Empirical Evaluation of Performance and Suitability

Medina Ramírez, Miguel Ángel; Estupiñán Ojeda, Cristian David; Torres Rodríguez, Victoria; Sánchez-Nielsen, Elena; Guerra Artal, Cayetano; Hernández Tejera, Francisco Mario

Identificador persistente para citar o vincular este elemento: https://accedacris.ulpgc.es/jspui/handle/10553/163430

Campo DC	Valor	idioma
dc.contributor.author	Medina Ramírez, Miguel Ángel	en_US
dc.contributor.author	Estupiñán Ojeda, Cristian David	en_US
dc.contributor.author	Torres Rodríguez, Victoria	en_US
dc.contributor.author	Sánchez-Nielsen, Elena	en_US
dc.contributor.author	Guerra Artal, Cayetano	en_US
dc.contributor.author	Hernández Tejera, Francisco Mario	en_US
dc.date.accessioned	2026-04-16T10:38:35Z	-
dc.date.available	2026-04-16T10:38:35Z	-
dc.date.issued	2026	en_US
dc.identifier.issn	2169-3536	en_US
dc.identifier.uri	https://accedacris.ulpgc.es/jspui/handle/10553/163430	-
dc.description.abstract	Parliamentary institutions generate extensive, domain-specific legislative documents, including normative texts and parliamentary debate transcripts. These documents differ in content and linguistic complexity, making automatic summarization essential for producing coherent summaries aligned with institutional standards. While large language models (LLMs) achieve high summarization quality, their computational requirements limit deployment in parliamentary and public-sector environments. In contrast, small language models (SLMs) offer a more resource-efficient alternative, but their capabilities and performance relative to LLMs, extractive methods, and other SLMs remain underexplored. In this work, we present the first comprehensive evaluation of SLMs for legislative summarization, assessing their effectiveness across document types and languages. We use two complementary datasets: EUR-LexSum, a multilingual corpus of normative texts covering six European languages, and ParcanDeb-Sum, a Spanish dataset of parliamentary debate records aligned with expert-written summaries. Summary quality is evaluated through a three-tier framework combining automatic metrics (ROUGE and BERTScore), LLMbased qualitative assessment, and expert-guided evaluation formalizing parliamentary debate summarization criteria. Our results show that: 1) instruction-tuned SLMs consistently outperform extractive baselines and, in several settings, rival LLMs with seven to eight billion parameters; 2) performance differs by document type, with fine-tuning being critical for debate transcripts, whereas instruction-tuning alone suffices for normative texts; and 3) for normative texts, SLMs establish a new benchmark for multilingual performance, while for parliamentary debates, fine-tuned SLMs achieve performance comparable to domain experts. These findings provide empirical evidence that high-quality legislative summarization can be achieved with SLMs, offering actionable guidance for selecting models that balance performance with computational constraints.	en_US
dc.language	eng	en_US
dc.relation.ispartof	IEEE Access	en_US
dc.subject	33 Ciencias tecnológicas	en_US
dc.subject.other	Small language models	en_US
dc.subject.other	long document summarization	en_US
dc.subject.other	normative text summarization	en_US
dc.subject.other	parliamentary debate summarization	en_US
dc.subject.other	legislative natural language processing	en_US
dc.title	Small Language Models for Legislative Summarization: An Empirical Evaluation of Performance and Suitability	en_US
dc.type	Article	en_US
dc.identifier.doi	10.1109/ACCESS.2026.3679718	en_US
dc.investigacion	Ingeniería y Arquitectura	en_US
dc.utils.revision	Sí	en_US
dc.identifier.ulpgc	Sí	en_US
dc.contributor.buulpgc	BU-INF	en_US
dc.description.sjr	0,849
dc.description.jcr	3,6
dc.description.sjrq	Q1
dc.description.jcrq	Q2
dc.description.scie	SCIE
dc.description.miaricds	10,4
item.grantfulltext	open	-
item.fulltext	Con texto completo	-
crisitem.author.dept	GIR SIANI: Inteligencia Artificial, Redes Neuronales, Aprendizaje Automático e Ingeniería de Datos	-
crisitem.author.dept	IU de Sistemas Inteligentes y Aplicaciones Numéricas en Ingeniería	-
crisitem.author.dept	GIR SIANI: Inteligencia Artificial, Redes Neuronales, Aprendizaje Automático e Ingeniería de Datos	-
crisitem.author.dept	IU de Sistemas Inteligentes y Aplicaciones Numéricas en Ingeniería	-
crisitem.author.dept	Departamento de Informática y Sistemas	-
crisitem.author.dept	GIR SIANI: Inteligencia Artificial, Redes Neuronales, Aprendizaje Automático e Ingeniería de Datos	-
crisitem.author.dept	IU de Sistemas Inteligentes y Aplicaciones Numéricas en Ingeniería	-
crisitem.author.dept	Departamento de Informática y Sistemas	-
crisitem.author.dept	GIR SIANI: Inteligencia Artificial, Redes Neuronales, Aprendizaje Automático e Ingeniería de Datos	-
crisitem.author.dept	IU de Sistemas Inteligentes y Aplicaciones Numéricas en Ingeniería	-
crisitem.author.dept	Departamento de Informática y Sistemas	-
crisitem.author.orcid	0000-0001-6734-2257	-
crisitem.author.orcid	0000-0003-1381-2262	-
crisitem.author.orcid	0000-0001-9717-8048	-
crisitem.author.parentorg	IU de Sistemas Inteligentes y Aplicaciones Numéricas en Ingeniería	-
crisitem.author.parentorg	IU de Sistemas Inteligentes y Aplicaciones Numéricas en Ingeniería	-
crisitem.author.parentorg	IU de Sistemas Inteligentes y Aplicaciones Numéricas en Ingeniería	-
crisitem.author.parentorg	IU de Sistemas Inteligentes y Aplicaciones Numéricas en Ingeniería	-
crisitem.author.fullName	Medina Ramírez, Miguel Ángel	-
crisitem.author.fullName	Estupiñán Ojeda, Cristian David	-
crisitem.author.fullName	Torres Rodríguez, Victoria	-
crisitem.author.fullName	Guerra Artal, Cayetano	-
crisitem.author.fullName	Hernández Tejera, Francisco Mario	-
Colección:	Artículos

Adobe PDF (4,8 MB)

Vista resumida

Adobe PDF (4,8 MB)

Google Scholar^TM

Altmetric

Comparte

Exporta metadatos

Dirección

Contacto

Legal

De interés

Adobe PDF (4,8 MB)

Google ScholarTM

Altmetric

Comparte

Exporta metadatos

Dirección

Google Scholar^TM