Please use this identifier to cite or link to this item: http://hdl.handle.net/10553/65566
Title: Nessie : integración y puesta en marcha
Authors: Torrero Marijnissen, Rubén Francesco
Director: Quesada Arencibia, Francisco Alexis 
UNESCO Clasification: 120317 Informática
Issue Date: 2013
Abstract: “Nessie: A News Media Exhaustive Surveillance Software” comienza a desarrollarse en 2008 como un ambicioso proyecto al que tres alumnos dedican sus proyectos de fin de carrera: una librería de segmentación de periódicos dedicada al análisis y separación de las áreas que forman parte de cada noticia, una librería de reconocimiento óptico de caracteres (OCR) dedicada a la obtención de caracteres en forma de datos tratables a partir de los segmentos de noticias y un controlador encargado de ser el director de orquesta de Nessie, obteniendo noticias digitalizadas a partir de las dos librerías para posteriormente clasificarlas según temáticas. Es por la naturaleza del desarrollo de Nessie por lo que aparece el primer problema a la hora de llevarlo a explotación: Al haber sido desarrollado en proyectos separados, con distintas fechas de entrega y documentación separada, la integración de los sistemas como un único Software se convierte en una tarea no trivial. Además, la dependencia entre proyectos hace que en ciertos momentos, partes del código tuvieran que ser ejecutadas en base a simulaciones de resultados de comunicación entre módulos -en vez de llegar a hacer esa comunicación realmente-, dificultando aún más la realización de pruebas en entornos realistas. Por todo ello, previo a la realización de este proyecto, Nessie era funcional sólo para casos simulados, teniendo que introducir modificaciones en el código para lograr la ejecución correcta con un periódico dado; no por la ausencia de la lógica encargada de hacerlo, sino por la ausencia de la lógica encargada de coordinar el sistema para cualquier caso posible.
“Nessie: A News Media Exhaustive Surveillance Software”, started its development in 2008 as an ambitious project to which 3 students devoted their DFP (Degree's Final Project): a newspaper segmentation library with the objective of analysing and identifying the several areas that form news articles, an optical character recognition (OCR) library with the objective of obtaining the digitalized data from the previously identified text regions of each article, and a controler, in charge of obtaining digitalized news and classifying it by the usage of the two other modules. It's because of the nature of how Nessie was developed why the first problem appears when trying to get Nessie to a production-ready state: Having been developed in separate projects, with different schedules and different documentation, integrating three separate systems as a single Software turns out to be a non-trivial task. In addition, because of the modules having a heavy interdependence, some of the core features of each project where tested with simulated data and methods due to not having the needed code at the time. For that reasons, previously to the present project, Nessie was only functional for simulated cases, having to introduce hard-coded modifications to achieve the correct processing of a given newspaper sample; not because of the absence of the code for processing the data, but because of the absence of the needed logic to coordinate the system for any possible input.
Department: Departamento de Informática y Sistemas
Faculty: Escuela de Ingeniería Informática
Degree: Grado en Ingeniería Informática
URI: http://hdl.handle.net/10553/65566
Rights: Acceso restringido para la comunidad universitaria de la ULPGC
Appears in Collections:Trabajo final de grado
Restringido ULPGC
Thumbnail
Adobe PDF (1,25 MB)
This file is reserved to the following groups: autenticados

En el caso de que no encuentre el documento puede ser debido a que el centro o las/os autoras/es no autorizan su publicación. Si tiene verdadero interés en el contenido del mismo, puede dirigirse al director/a o directores/as del trabajo cuyos datos encontrará más arriba.

Show full item record

Page view(s)

76
checked on Aug 12, 2023

Download(s)

20
checked on Aug 12, 2023

Google ScholarTM

Check


Share



Export metadata



Items in accedaCRIS are protected by copyright, with all rights reserved, unless otherwise indicated.