Identificador persistente para citar o vincular este elemento: http://hdl.handle.net/10553/120994
Título: Computational analysis of adjuncts in ASD-STE100 for the NLP parser ARTEMIS
Autores/as: Cortés Rodríguez, Francisco José
Rodríguez Juárez, Carolina 
Clasificación UNESCO: 5701 Lingüística aplicada
570104 Lingüística informatizada
Palabras clave: Adjuncts
Airbus corpus
ARTEMIS
ASD-STE100
Parsing rules, et al.
Fecha de publicación: 2023
Publicación seriada: VIAL - Vigo International Journal of Applied Linguistics 
Resumen: Texts written in Simplified Technical English present semantic and syntactic restrictions with respect to standard English that should be considered in the implementation of natural language processing systems dealing with controlled natural languages. This paper explores the syntax and semantics of adjuncts in a controlled natural language, namely, the Simplified Technical English (ASD-STE100) used in the Airbus corpus with a view to observing how the peculiarities identified in the behaviour of Airbus adverbials should be reflected in the computational treatment of these constituents. Thus, our main aim is to contribute to the computational implementation of the prototype ARTEMIS by designing the parsing rules and the catalogue of feature-bearing matrixes that encode the grammatical constraints of Airbus adjuncts. The parsing rules reflect the positional preferences of the various peripheral types and capture the semantic variability of adjuncts in the corpus. In addition, they provide a weight factor that predicts the scale of markedness of these constituents with respect to the different positions that they occupy in the clause. On the whole, these properties offer a precise description of the syntactic features of adverbials that will facilitate their automatic processing.
Los documentos escritos en Inglés Técnico Simplificado (ASD-STE100) muestran determinadas restricciones semánticas y sintácticas que deben tenerse en cuenta para la creación de sistemas de procesamiento de lenguaje natural aplicados a lenguajes controlados naturales. En este trabajo se exploran los rasgos sintácticos y semánticos de los adverbiales en uno de estos lenguajes controlados naturales, el ASD-STE100, utilizado en el corpus Airbus. El propósito de este análisis es establecer el modo en que las peculiaridades del comportamiento de los adverbiales en este corpus deben encontrar reflejo en el tratamiento computacional de dichos constituyentes. Con ello pretendemos contribuir a la implementación del prototipo ARTEMIS mediante el diseño de las reglas para el análisis sintáctico (reglas de parseado) y las matrices atributo-valor de este prototipo, las cuales codifican las restricciones gramaticales de los adjuntos del corpus de Airbus. Las reglas de parseado reflejan las preferencias posicionales de los diferentes tipos de periferias adverbiales y capturan la variabilidad semántica de los adjuntos en el corpus. Además, ofrecen un factor de peso que predice la escala de marcado de estos constituyentes con respecto a las diferentes posiciones que ocupan en la cláusula. Estas propiedades ofrecen en conjunto una descripción precisa de los rasgos sintácticos de los adverbiales que facilitará el procesamiento automático de los mismos.
URI: http://hdl.handle.net/10553/120994
ISSN: 1697-0381
DOI: 10.35869/vial.v0i20.4356
Fuente: VIAL - Vigo International Journal of Applied Linguistics [ISSN 1697-0381], n. 20, p. 107-147, (2023)
Colección:Artículos
Adobe PDF (887,19 kB)
Vista completa

Google ScholarTM

Verifica

Altmetric


Comparte



Exporta metadatos



Los elementos en ULPGC accedaCRIS están protegidos por derechos de autor con todos los derechos reservados, a menos que se indique lo contrario.