Please use this identifier to cite or link to this item:
http://hdl.handle.net/10553/65566
Title: | Nessie : integración y puesta en marcha | Authors: | Torrero Marijnissen, Rubén Francesco | Director: | Quesada Arencibia, Francisco Alexis | UNESCO Clasification: | 120317 Informática | Issue Date: | 2013 | Abstract: | “Nessie: A News Media Exhaustive Surveillance Software” comienza a desarrollarse en 2008 como
un ambicioso proyecto al que tres alumnos dedican sus proyectos de fin de carrera: una librería de
segmentación de periódicos dedicada al análisis y separación de las áreas que forman parte de cada
noticia, una librería de reconocimiento óptico de caracteres (OCR) dedicada a la obtención de
caracteres en forma de datos tratables a partir de los segmentos de noticias y un controlador
encargado de ser el director de orquesta de Nessie, obteniendo noticias digitalizadas a partir de las
dos librerías para posteriormente clasificarlas según temáticas.
Es por la naturaleza del desarrollo de Nessie por lo que aparece el primer problema a la hora de
llevarlo a explotación: Al haber sido desarrollado en proyectos separados, con distintas fechas de
entrega y documentación separada, la integración de los sistemas como un único Software se
convierte en una tarea no trivial. Además, la dependencia entre proyectos hace que en ciertos
momentos, partes del código tuvieran que ser ejecutadas en base a simulaciones de resultados de
comunicación entre módulos -en vez de llegar a hacer esa comunicación realmente-, dificultando
aún más la realización de pruebas en entornos realistas.
Por todo ello, previo a la realización de este proyecto, Nessie era funcional sólo para casos
simulados, teniendo que introducir modificaciones en el código para lograr la ejecución correcta
con un periódico dado; no por la ausencia de la lógica encargada de hacerlo, sino por la ausencia de
la lógica encargada de coordinar el sistema para cualquier caso posible. “Nessie: A News Media Exhaustive Surveillance Software”, started its development in 2008 as an ambitious project to which 3 students devoted their DFP (Degree's Final Project): a newspaper segmentation library with the objective of analysing and identifying the several areas that form news articles, an optical character recognition (OCR) library with the objective of obtaining the digitalized data from the previously identified text regions of each article, and a controler, in charge of obtaining digitalized news and classifying it by the usage of the two other modules. It's because of the nature of how Nessie was developed why the first problem appears when trying to get Nessie to a production-ready state: Having been developed in separate projects, with different schedules and different documentation, integrating three separate systems as a single Software turns out to be a non-trivial task. In addition, because of the modules having a heavy interdependence, some of the core features of each project where tested with simulated data and methods due to not having the needed code at the time. For that reasons, previously to the present project, Nessie was only functional for simulated cases, having to introduce hard-coded modifications to achieve the correct processing of a given newspaper sample; not because of the absence of the code for processing the data, but because of the absence of the needed logic to coordinate the system for any possible input. |
Department: | Departamento de Informática y Sistemas | Faculty: | Escuela de Ingeniería Informática | Degree: | Grado en Ingeniería Informática | URI: | http://hdl.handle.net/10553/65566 | Rights: | Acceso restringido para la comunidad universitaria de la ULPGC |
Appears in Collections: | Trabajo final de grado Restringido ULPGC |
En el caso de que no encuentre el documento puede ser debido a que el centro o las/os autoras/es no autorizan su publicación. Si tiene verdadero interés en el contenido del mismo, puede dirigirse al director/a o directores/as del trabajo cuyos datos encontrará más arriba.
Show full item recordPage view(s)
76
checked on Aug 12, 2023
Download(s)
20
checked on Aug 12, 2023
Google ScholarTM
Check
Share
Export metadata
Items in accedaCRIS are protected by copyright, with all rights reserved, unless otherwise indicated.