Plataforma de HPC portable de bajo consumo energético para aplicaciones de minerÃa de datos / Portable low-power High Performance Computing (HPC) Platform for data mining applications
Resumen
La necesidad de plataformas computacionales que proporcionen soporte a las aplicaciones denominadas intensivas ha estado incrementándose en muchas organizaciones debido al surgimiento de una serie de aplicaciones que requieren de manejo intensivo de datos y tiempos de respuesta cortos. Un ejemplo pueden ser las aplicaciones que utilizan la minerÃa de datos. El hardware ha evolucionado de manera acelerada para satisfacer estas necesidades del cómputo intensivo. Por otro lado, pequeñas computadoras montadas en tarjetas denominadas SoC (System on Chip) (R., G., y M., 2013) han aparecido a partir de la miniaturización de componentes y la popularización de los sistemas embebidos, El ejemplo más significativo es Raspberry Pi (raspberrypi, 2016), una alternativa de bajo costo y consumo energético reducido que permite realizar tareas de cómputo. Debido a su popularidad, los fabricantes se han dedicado a incrementar su desempeño generando modelos con mayores prestaciones, los cuales se han vuelto una opción viable para el procesamiento intensivo de datos. Aquà analizamos dicho aspecto. Para ello se describe la construcción de una plataforma de HPC basada en tarjetas SoC, lo que permite desarrollar y ejecutar aplicaciones de minerÃa de datos. Los resultados obtenidos en las diferentes pruebas de operación y tolerancia a fallas muestran que dicha plataforma ofrece el rendimiento y la robustez necesarios para ser utilizada en el desarrollo de aplicaciones de minerÃa de datos orientadas a la educación y también para la enseñanza de la disciplina antes mencionada, con una inversión que es posible alcanzar en instituciones académicas y pequeñas organizaciones.Citas
A. Petitet, R. C. Whaley, J. Dongarra, A. Cleary (15 de Diciembre de 2016). HPL - A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers. Obtenido de HPL - A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers: http://www.netlib.org/benchmark/hpl/
Apache. (05 de Octubre de 2016). Apache Hadoop. Obtenido de Apache Hadoop: http://hadoop.apache.org/
Apache. (15 de 01 de 2017). Apache Pig. Obtenido de https://pig.apache.org/
Barr, M., & Massa, A. (2006). Programming Embedded Systems: With C and GNU Development Tools. O'REILLY.
Conaway, S. (03 de 07 de 2014). High Performance Data Analysis: Big Data Meets HPC. High Performance Data Analysis: Big Data Meets HPC. Recuperado el 14 de 02 de 2017, de http://www.scientificcomputing.com/blog/2014/03/high-performance-data-analysis-big-data-meets-hpc
Cubieboard. (9 de Septiembre de 2016). Obtenido de cubieboard: http://cubieboard.org/
DÃaz, G. (31 de Mayo de 2016). Modelos de Programación Paralela. Merida, Venezuela.
F. Cloutier, M., Paradis, C., & M. Weaver, V. (2014). Design and Analysis of a 32-bit Embedded High-Performance Cluster Optimized for Energy and Performance. Hardware-Software Co-Design for High Performance Computing (Co-HPC), 2014. doi:10.1109/Co-HPC.2014.7
Garcia Nocetti, F. (Junio de 2014). Cómputo de Alto Rendimiento (HPC) & Big Data. Obtenido de Cómputo de Alto Rendimiento (HPC) & Big Data: http://www.inegi.org.mx/eventos/2014/big-data/doc/P-DemetrioGarcia.pdf
Google. (15 de 10 de 2016). https://www.android.com/. Obtenido de https://www.android.com/
HADOOP. (2014). HADOOP big data analysis framework. tutorialspoint.
J. Greaves, D. (2011). System on Chip Design and Modelling. System on Chip Design and Modelling. Cambridge, Inglaterra.
Lubuntu. (05 de Octubre de 2016). Obtenido de Lubuntu: http://lubuntu.net/
Pérez López, C. (2008). MinerÃa de Datos Técnicas y Herramientas. Madrid: Thomson.
R, R., G, M., & M, A. P. (2013). System on Chip (SoC) for Telecommand System Design. International Journal of Advanced Research in Computer and Communication Engineering, 1580-1585.
Rajovic, N. R.-J.-F. (2016). The Mont-Blanc prototype: An Alternative Approach for HPC Systems.
Rajovic, N., Rico, A., Puzovic, N., Adeniyi Jones, C., & Ramirez, A. (2014). Making the Case for an ARM-Based HPC System. ELSEVIER, 322-334.
Ramos, J. A. (23 de Abril de 2014). https://www.adictosaltrabajo.com. Recuperado el 15 de Enero de 2017, de https://www.adictosaltrabajo.com: https://www.adictosaltrabajo.com/tutoriales/pig-first-steps/
Raspberrypi. (9 de Septiembre de 2016). Obtenido de raspberrypi: https://www.raspberrypi.org/
Solano, H. L., & Ã?lvarez, C. R. (2005). EstadÃstica descriptiva y distribuciones de probabilidad. Barranquilla: Ediciones Uninorte.
Srisuruk, W., & Kaewkasi, C. (s.f.). Low-Power Big Data Cluster. Low-Power Big Data Cluster. Suranaree, Tailandia. Obtenido de https://indico.cern.ch/event/311156/contributions/1684547/attachments/595776/819978/aiyara_cluster.pdf
Valero, M., Rajovic, N., M. Carpenter, P., Gelado, I., Puzovic, N., & Ramirez, A. (2013, Noviembre 17-22). Supercomputing with Commodity CPUs: Are Mobile SoCs Ready for HPC? 2013 SC - International Conference for High Performance Computing, Networking, Storage and Analysis (SC), 1-12. Denver,Co: IEEE. doi:10.1145/2503210.2503281
Wu, X., Zhu, X., Wu, G.-Q., & Ding, W. (2013). Data mining with big data. IEEE Transactions on Knowledge and Data Engineering, 97 - 107. doi:10.1109/TKDE.2013.109
Con el propósito de promover el desarrollo y divulgación de la investigación en educación en América Latina, en La RECI Revista Iberoamericana de las Ciencias Computacionales e Informática se adhirió a la Iniciativa de Acceso Abierto de Budapest, por lo que se identifica como una publicación de acceso abierto. Esto significa que cualquier usuario puede leer el texto completo de los artículos, imprimirlos, descargarlos, copiarlos, enlazarlos, distribuirlos y usar los contenidos para otros fines. Las licencias Creative Cummons, permiten especificar los derechos de uso de una revista de acceso abierto disponible en Internet de tal manera que los usuarios conocen las reglas de publicación.
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la licencia de atribución de Creative Commons, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
Se permite y recomienda a los autores/as a publicar su trabajo en Internet (por ejemplo en páginas institucionales o personales) antes y durante el proceso de revisión y publicación, ya que puede conducir a intercambios productivos y a una mayor y más rápida difusión del trabajo publicado