Plataforma de HPC portable de bajo consumo energético para aplicaciones de minerÃa de datos / Portable low-power High Performance Computing (HPC) Platform for data mining applications
Abstract
La necesidad de plataformas computacionales que proporcionen soporte a las aplicaciones denominadas intensivas ha estado incrementándose en muchas organizaciones debido al surgimiento de una serie de aplicaciones que requieren de manejo intensivo de datos y tiempos de respuesta cortos. Un ejemplo pueden ser las aplicaciones que utilizan la minerÃa de datos. El hardware ha evolucionado de manera acelerada para satisfacer estas necesidades del cómputo intensivo. Por otro lado, pequeñas computadoras montadas en tarjetas denominadas SoC (System on Chip) (R., G., y M., 2013) han aparecido a partir de la miniaturización de componentes y la popularización de los sistemas embebidos, El ejemplo más significativo es Raspberry Pi (raspberrypi, 2016), una alternativa de bajo costo y consumo energético reducido que permite realizar tareas de cómputo. Debido a su popularidad, los fabricantes se han dedicado a incrementar su desempeño generando modelos con mayores prestaciones, los cuales se han vuelto una opción viable para el procesamiento intensivo de datos. Aquà analizamos dicho aspecto. Para ello se describe la construcción de una plataforma de HPC basada en tarjetas SoC, lo que permite desarrollar y ejecutar aplicaciones de minerÃa de datos. Los resultados obtenidos en las diferentes pruebas de operación y tolerancia a fallas muestran que dicha plataforma ofrece el rendimiento y la robustez necesarios para ser utilizada en el desarrollo de aplicaciones de minerÃa de datos orientadas a la educación y también para la enseñanza de la disciplina antes mencionada, con una inversión que es posible alcanzar en instituciones académicas y pequeñas organizaciones.References
A. Petitet, R. C. Whaley, J. Dongarra, A. Cleary (15 de Diciembre de 2016). HPL - A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers. Obtenido de HPL - A Portable Implementation of the High-Performance Linpack Benchmark for Distributed-Memory Computers: http://www.netlib.org/benchmark/hpl/
Apache. (05 de Octubre de 2016). Apache Hadoop. Obtenido de Apache Hadoop: http://hadoop.apache.org/
Apache. (15 de 01 de 2017). Apache Pig. Obtenido de https://pig.apache.org/
Barr, M., & Massa, A. (2006). Programming Embedded Systems: With C and GNU Development Tools. O'REILLY.
Conaway, S. (03 de 07 de 2014). High Performance Data Analysis: Big Data Meets HPC. High Performance Data Analysis: Big Data Meets HPC. Recuperado el 14 de 02 de 2017, de http://www.scientificcomputing.com/blog/2014/03/high-performance-data-analysis-big-data-meets-hpc
Cubieboard. (9 de Septiembre de 2016). Obtenido de cubieboard: http://cubieboard.org/
DÃaz, G. (31 de Mayo de 2016). Modelos de Programación Paralela. Merida, Venezuela.
F. Cloutier, M., Paradis, C., & M. Weaver, V. (2014). Design and Analysis of a 32-bit Embedded High-Performance Cluster Optimized for Energy and Performance. Hardware-Software Co-Design for High Performance Computing (Co-HPC), 2014. doi:10.1109/Co-HPC.2014.7
Garcia Nocetti, F. (Junio de 2014). Cómputo de Alto Rendimiento (HPC) & Big Data. Obtenido de Cómputo de Alto Rendimiento (HPC) & Big Data: http://www.inegi.org.mx/eventos/2014/big-data/doc/P-DemetrioGarcia.pdf
Google. (15 de 10 de 2016). https://www.android.com/. Obtenido de https://www.android.com/
HADOOP. (2014). HADOOP big data analysis framework. tutorialspoint.
J. Greaves, D. (2011). System on Chip Design and Modelling. System on Chip Design and Modelling. Cambridge, Inglaterra.
Lubuntu. (05 de Octubre de 2016). Obtenido de Lubuntu: http://lubuntu.net/
Pérez López, C. (2008). MinerÃa de Datos Técnicas y Herramientas. Madrid: Thomson.
R, R., G, M., & M, A. P. (2013). System on Chip (SoC) for Telecommand System Design. International Journal of Advanced Research in Computer and Communication Engineering, 1580-1585.
Rajovic, N. R.-J.-F. (2016). The Mont-Blanc prototype: An Alternative Approach for HPC Systems.
Rajovic, N., Rico, A., Puzovic, N., Adeniyi Jones, C., & Ramirez, A. (2014). Making the Case for an ARM-Based HPC System. ELSEVIER, 322-334.
Ramos, J. A. (23 de Abril de 2014). https://www.adictosaltrabajo.com. Recuperado el 15 de Enero de 2017, de https://www.adictosaltrabajo.com: https://www.adictosaltrabajo.com/tutoriales/pig-first-steps/
Raspberrypi. (9 de Septiembre de 2016). Obtenido de raspberrypi: https://www.raspberrypi.org/
Solano, H. L., & Ã?lvarez, C. R. (2005). EstadÃstica descriptiva y distribuciones de probabilidad. Barranquilla: Ediciones Uninorte.
Srisuruk, W., & Kaewkasi, C. (s.f.). Low-Power Big Data Cluster. Low-Power Big Data Cluster. Suranaree, Tailandia. Obtenido de https://indico.cern.ch/event/311156/contributions/1684547/attachments/595776/819978/aiyara_cluster.pdf
Valero, M., Rajovic, N., M. Carpenter, P., Gelado, I., Puzovic, N., & Ramirez, A. (2013, Noviembre 17-22). Supercomputing with Commodity CPUs: Are Mobile SoCs Ready for HPC? 2013 SC - International Conference for High Performance Computing, Networking, Storage and Analysis (SC), 1-12. Denver,Co: IEEE. doi:10.1145/2503210.2503281
Wu, X., Zhu, X., Wu, G.-Q., & Ding, W. (2013). Data mining with big data. IEEE Transactions on Knowledge and Data Engineering, 97 - 107. doi:10.1109/TKDE.2013.109
With the purpose of promoting the development and dissemination of research in education in Latin America, the RECI Ibero-American Journal of Computational and Informatic Sciences adhered to the Budapest Open Access Initiative, which is why it is identified as an open access publication. open. This means that any user can read the full text of the articles, print them, download them, copy them, link to them, distribute them and use the contents for other purposes. Creative Cummons licenses allow you to specify the rights of use of an open access journal available on the Internet in such a way that users know the publication rules. The authors who publish in this journal accept the following conditions: The authors retain the copyright and give the journal the right of first publication, with the work registered with the Creative Commons attribution license, which allows third parties to use what is published as long as they mention the authorship of the work and the first publication in this The authors may make other independent and additional contractual agreements for the non-exclusive distribution of the version of the article published in this journal (eg, include it in an institutional repository or publish it in a book) provided that they clearly indicate that the work was published for the first time in this journal. Authors are allowed and recommended to publish their work in I Internet (for example on institutional or personal pages) before and during the review and publication process, as it can lead to productive exchanges and a greater and faster dissemination of published work