Please use this identifier to cite or link to this item: http://hdl.handle.net/10553/55628
DC FieldValueLanguage
dc.contributor.advisorSánchez Medina, Javier Jesúses
dc.contributor.advisorOcón Carreras, Antonio Andréses
dc.contributor.authorGubern González, Santiago Migueles
dc.date.accessioned2019-06-03T13:00:22Z-
dc.date.available2019-06-03T13:00:22Z-
dc.date.issued2019-
dc.identifier.urihttp://hdl.handle.net/10553/55628-
dc.description.abstractDiseño, configuración y evaluación de un clúster de Big Data basado en Apache Hadoop Yarn y Apache Spark para el procesamiento y análisis de datos de movilidad, y visualización de datos en R. Utilizando datos de movilidad de vehículos sonda proporcionados por el CICEI, han sido preprocesados en R para poder crear grafos a partir de ellos gracias a la librería GraphX de Apache Spark. Utilizando el lenguaje de programación Scala se crean los grafos, se calculan diferentes métricas de centralidad de manera distribuída, y se realiza un análisis de speed-up comparando diferentes configuraciones del clúster. Creando un script en R, se realiza el análisis de los tiempos de ejecución y la representación de las métricas en mapas geográficos.en_US
dc.description.abstractDesign, configuration and evaluation of a Big Data cluster based on Apache Hadoop Yarn and Apache Spark, for the processing and analysis of mobility data. Using a probe vehicles mobility dataset provided by CICEI, after some preprocessing in R, the corresponding graphs are loaded int the Spark cluster by using the Apache Spark GraphX library. Then some graph centrality measurements are calculated distributedly. Afterwards, a Speed-up analysis is developed comparing several cluster configurations. Finally, R is used to analyse the Speed-up and to do some data GIS visualization of the centrality measurements obtained.en_US
dc.languagespaen_US
dc.subject120317 Informáticaen_US
dc.subject.otherHadoopes
dc.subject.otherSparkes
dc.subject.otherGraphXes
dc.subject.otherGrafoses
dc.subject.otherRes
dc.subject.otherTesalonicaes
dc.subject.otherBig Dataes
dc.subject.otherBetweenness Centralityes
dc.subject.otherEigenvector Centralityes
dc.subject.otherPage Rankes
dc.subject.otherSpeedupes
dc.subject.otherClusteres
dc.titleDiseño e implementación de Clúster Spark y análisis de datos de tráfico mediante el uso de la librería Graphxes
dc.title.alternativeSpark cluster design and implementation, and analysis of traffic data using the GraphX librayen_US
dc.typeinfo:eu-repo/semantics/bachelorThesisen_US
dc.typeBachelorThesisen_US
dc.contributor.departamentoDepartamento de Informática y Sistemases
dc.contributor.facultadEscuela de Ingeniería Informáticaen_US
dc.identifier.absysnet757076-
dc.investigacionIngeniería y Arquitecturaen_US
dc.type2Trabajo final de gradoen_US
dc.utils.revisionen_US
dc.identifier.matriculaTFT-48403es
dc.identifier.ulpgcen_US
dc.contributor.buulpgcBU-INFes
dc.contributor.titulacionGrado en Ingeniería Informáticaes
item.grantfulltextopen-
item.fulltextCon texto completo-
crisitem.advisor.deptGIR IUCES: Centro de Innovación para la Empresa, el Turismo, la Internacionalización y la Sostenibilidad-
crisitem.advisor.deptIU de Cibernética, Empresa y Sociedad (IUCES)-
crisitem.advisor.deptDepartamento de Informática y Sistemas-
crisitem.advisor.deptDepartamento de Informática y Sistemas-
Appears in Collections:Trabajo final de grado
Código
ZIP (1,04 MB)
Thumbnail
Adobe PDF (1,53 MB)
Show simple item record

Google ScholarTM

Check


Share



Export metadata



Items in accedaCRIS are protected by copyright, with all rights reserved, unless otherwise indicated.