Identificador persistente para citar o vincular este elemento: http://hdl.handle.net/10553/65566
Título: Nessie : integración y puesta en marcha
Autores/as: Torrero Marijnissen, Rubén Francesco
Director/a : Quesada Arencibia, Francisco Alexis 
Clasificación UNESCO: 120317 Informática
Fecha de publicación: 2013
Resumen: “Nessie: A News Media Exhaustive Surveillance Software” comienza a desarrollarse en 2008 como un ambicioso proyecto al que tres alumnos dedican sus proyectos de fin de carrera: una librería de segmentación de periódicos dedicada al análisis y separación de las áreas que forman parte de cada noticia, una librería de reconocimiento óptico de caracteres (OCR) dedicada a la obtención de caracteres en forma de datos tratables a partir de los segmentos de noticias y un controlador encargado de ser el director de orquesta de Nessie, obteniendo noticias digitalizadas a partir de las dos librerías para posteriormente clasificarlas según temáticas. Es por la naturaleza del desarrollo de Nessie por lo que aparece el primer problema a la hora de llevarlo a explotación: Al haber sido desarrollado en proyectos separados, con distintas fechas de entrega y documentación separada, la integración de los sistemas como un único Software se convierte en una tarea no trivial. Además, la dependencia entre proyectos hace que en ciertos momentos, partes del código tuvieran que ser ejecutadas en base a simulaciones de resultados de comunicación entre módulos -en vez de llegar a hacer esa comunicación realmente-, dificultando aún más la realización de pruebas en entornos realistas. Por todo ello, previo a la realización de este proyecto, Nessie era funcional sólo para casos simulados, teniendo que introducir modificaciones en el código para lograr la ejecución correcta con un periódico dado; no por la ausencia de la lógica encargada de hacerlo, sino por la ausencia de la lógica encargada de coordinar el sistema para cualquier caso posible.
“Nessie: A News Media Exhaustive Surveillance Software”, started its development in 2008 as an ambitious project to which 3 students devoted their DFP (Degree's Final Project): a newspaper segmentation library with the objective of analysing and identifying the several areas that form news articles, an optical character recognition (OCR) library with the objective of obtaining the digitalized data from the previously identified text regions of each article, and a controler, in charge of obtaining digitalized news and classifying it by the usage of the two other modules. It's because of the nature of how Nessie was developed why the first problem appears when trying to get Nessie to a production-ready state: Having been developed in separate projects, with different schedules and different documentation, integrating three separate systems as a single Software turns out to be a non-trivial task. In addition, because of the modules having a heavy interdependence, some of the core features of each project where tested with simulated data and methods due to not having the needed code at the time. For that reasons, previously to the present project, Nessie was only functional for simulated cases, having to introduce hard-coded modifications to achieve the correct processing of a given newspaper sample; not because of the absence of the code for processing the data, but because of the absence of the needed logic to coordinate the system for any possible input.
Departamento: Departamento de Informática y Sistemas
Facultad: Escuela de Ingeniería Informática
Titulación: Grado en Ingeniería Informática
URI: http://hdl.handle.net/10553/65566
Derechos: Acceso restringido para la comunidad universitaria de la ULPGC
Colección:Trabajo final de grado
Restringido ULPGC
miniatura
Adobe PDF (1,25 MB)
Inicia sesión para acceder

En el caso de que no encuentre el documento puede ser debido a que el centro o las/os autoras/es no autorizan su publicación. Si tiene verdadero interés en el contenido del mismo, puede dirigirse al director/a o directores/as del trabajo cuyos datos encontrará más arriba.

Vista completa

Google ScholarTM

Verifica


Comparte



Exporta metadatos



Los elementos en ULPGC accedaCRIS están protegidos por derechos de autor con todos los derechos reservados, a menos que se indique lo contrario.