Please use this identifier to cite or link to this item: https://hdl.handle.net/10953.1/5948
Title: Implementacion de Modelos de Data Science utilizando
Authors: Martinez-Jimenez, Javier
metadata.dc.contributor.advisor: Rivera-Rivas, Antonio
Perez-Godoy, Maria-Dolores
metadata.dc.contributor.other: Universidad de Jaén. Informática
Abstract: [ES] El volumen, la velocidad y la vatiedad de los datos que se generan diariamente, hacen dificil el uso de herramientas tecnicas tradicionales para la extraccion de conocimiento. COn el fin de solucionar este tipo de problemas Big Data, surge el tremino Data Science, el cual define tecnicas que son capaces de obtener conocimiento en este marco de trabajo. En el presente trabajo, se implementan dos modelos basicos de aprendizaje automatico y mineria de datos sobre Apache Spark y MLlib. Para este objetivo, se realiza un estudio del estado del arte de la mineria de datos, el Big Data y la ciencia de datos. Ademas, se realiza un profundo analisis tecnico de Apache Hadoop y Apache Spark. Como parte final del trabajo, se lleva a cabo un estudio de compracion entre los modelos desarrollados sobre Spark y estos mismos modelos implementados sobre Keel, un software de extraccion de conocimiento tradicional. Este estudio, permite exponer los beneficios e inconvenientes de utilizar herramientas Big Data.
[EN] The volume, the speed and the vatitude of the data that are generated daily, make difficult the use of traditional technical tools for the extraction of knowledge. In order to solve this type of Big Data problem, the Data Science term emerges, which defines techniques that are capable of obtaining knowledge in this framework. In the present work, two basic models of automatic learning and data mining are implemented on Apache Spark and MLlib. For this purpose, a study of the state of the art of data mining, Big Data and data science is carried out. In addition, a thorough technical analysis of Apache Hadoop and Apache Spark is carried out. As a final part of the work, a purchase study is carried out between the models developed on Spark and these same models implemented on Keel, a traditional knowledge extraction software. This study allows to expose the benefits and disadvantages of using Big Data tools.
Keywords: Sistemas de la Informacion
Issue Date: 2-Mar-2017
Publisher: Jaén: Universidad de Jaén
Appears in Collections:Grado en Ingeniería Informática (E.P.S. Jaén)

Files in This Item:
File Description SizeFormat 
TFG_MARTINEZ_JIMENEZ_JAVIER.pdf2,87 MBAdobe PDFThumbnail
View/Open


This item is protected by original copyright