Affine Shape Descriptor Algorithm for Image Matching and Object Recognition in a Digital Image/Algoritmo para clasificación de formas invariante a transformaciones afines para objetos rÃgidos en una imagen digital
Resumen
The use of shape, as a mean to discriminate between object classes extracted from a digital image, is one of the major roles in machine vision. The use of shape has been studied extensively in recent decades, because the shape of the object holds enough information for its correct classification; additionally, the quantity of memory used to store a border is much less than that of the whole region within it. In this paper, a novel shape descriptor is proposed. The algorithm demonstrates that it has useful properties such as: invariance to affine transformations that are applied to the border (e.g., scales, skews, displacements and rotations), stability in the presence of noise, and good differentiability between different object classes. A comparative analysis is included to show the performance of our proposal with respect to the state of the art algorithms.Citas
Abbasi, S., Mokhtarian, F., & Kittler, J. (1999, November). Curvature scale space image in shape similarity retrieval. Multimedia Syst., 7 (6), 467–476. Retrieved from http://dx.doi.org/ 10.1007/s005300050147 doi: 10.1007/s005300050147
Alcantarilla, P. F., Bergasa, L. M., & Davison, A. J. (2013, January). Gauge-surf descriptors. Image Vision Comput., 31 (1), 103–116. Retrieved from http://dx.doi.org/10.1016/j.imavis .2012.11.001 doi: 10.1016/j.imavis.2012.11.001
Artzy, R. (2008). Linear geometry (first ed.). Dover.
Bay, H., Ess, A., Tuytelaars, T., & Van Gool, L. (2008, June). Speeded-up robust features (surf). Comput. Vis. Image Underst., 110 (3), 346–359. Retrieved from http://dx.doi.org/ 10.1016/j.cviu.2007.09.014 doi: 10.1016/j.cviu.2007.09.014
Chuang, G.-H., & Kuo, C.-C. (1996, Jan). Wavelet descriptor of planar curves: theory and applica-tions. Image Processing, IEEE Transactions on, 5 (1), 56-70. doi: 10.1109/83.481671
Ekombo, P. L. E., Ennahnahi, N., Oumsis, M., & Meknassi, M. (2009). Application of affine invariant fourier descriptor to shape based image retrieval. International Journal of Computer Science and Network Security, 9 (7), 240–247.
Frejlichowski, D. (2012). Application of the curvature scale space descriptor to the problem of general shape analysis. Przeglad Elektrotechniczny, 88 (10b), 209–212.
Gonzalez, R. C., & Woods, R. E. (2008). Digital image processing (third ed.). Prentice Hall. Guney, N., & Ertuzun, A. (2006). Undoing the affine transformation using blind source separation.
In J. Rosca, D. Erdogmus, J. PrÃŋncipe, & S. Haykin (Eds.), Independent component analysis and blind signal separation (Vol. 3889, p. 360-367). Springer Berlin Heidelberg.
Haralick, R. M., & Shapiro, L. G. (1992). Computer and robot vision (first ed., Vol. 1). Addison Wesleyl.
Huang, X., Wang, B., & Zhang, L. (2005, July). A new scheme for extraction of affine invariant descriptor and affine motion estimation based on independent component analysis. Pattern Recogn. Lett., 26 (9), 1244–1255. Retrieved from http://dx.doi.org/10.1016/j.patrec
.2004.11.006 doi: 10.1016/j.patrec.2004.11.006
Kazmi, I., You, L., & Zhang, J. J. (2013, Aug). A survey of 2d and 3d shape descriptors. In Computer graphics, imaging and visualization (cgiv), 2013 10th international conference (p. 1-10). doi: 10.1109/CGIV.2013.11
Krig, S. (2014). Computer vision metrics (first ed.). Apress. manual in preparation, P. (2016). Mpeg7 data set. http://rduin.nl/manual/PRTools_9.html. (Accesed: 2016-04-20)
Leutenegger, S., Chli, M., & Siegwart, R. Y. (2011, Nov). Brisk: Binary robust invariant scalable keypoints. In 2011 international conference on computer vision (p. 2548-2555). doi: 10.1109/ ICCV.2011.6126542
Mei, Y., & Androutsos, D. (2008, Dec). Affine invariant shape descriptors: The ica-fourier descriptor and the pca-fourier descriptor. In Pattern recognition, 2008. icpr 2008. 19th international conference on (p. 1-4). doi: 10.1109/ICPR.2008.4761381
Mei, Y., & Androutsos, D. (2009, May). Pca-whitening css shape descriptor for affine invariant image retrieval. In Electrical and computer engineering, 2009. ccece ’09. canadian conference on (p. 235-238). doi: 10.1109/CCECE.2009.5090127
Ming, D., Zhang, C., Bai, Y., Wan, B., Hu, Y., & Luk, K. D. K. (2009, May). Gait recognition based on multiple views fusion of wavelet descriptor and human skeleton model. In 2009 ieee inter-national conference on virtual environments, human-computer interfaces and measurements systems (p. 246-249). doi: 10.1109/VECIMS.2009.5068902
Nanni, L., Lumini, A., & Brahnam, S. (2010, June). Local binary patterns variants as texture descriptors for medical image analysis. Artif. Intell. Med., 49 (2), 117–125. Retrieved from http://dx.doi.org/10.1016/j.artmed.2010.02.006 doi: 10.1016/j.artmed.2010.02.006
Noble, B., & Daniel, J. W. (1988). Applied linear algebra (third ed.). Prentice Hall.
Ortiz, R. (2012). Freak: Fast retina keypoint. In Proceedings of the 2012 ieee conference on computer vision and pattern recognition (cvpr) (pp. 510–517). Washington, DC, USA: IEEE Computer Society. Retrieved from http://dl.acm.org/citation.cfm?id=2354409.2354903
Pietikainen, M., Hadid, A., Zhao, G., & Ahonen, T. (2011). Computer vision using local binary pat-terns. London: Springer Verlag. Retrieved from http://opac.inria.fr/record=b1133835
Pillai, C. (2013). A survey of shape descriptors for digital image processing. IRACST- International Journal of Computer Science and Information Technology and Security, 3 (1).
Pratt, W. K. (2001). Digital image processing, piks inside (third ed.). Wiley.
Press, W. H., Teukolsky, S. A., Vetterling, W. T., & Flannery, B. P. (2007). Numerical recipes (third ed.). Cambridge.
Rajput, G., & Mali, S. (2010). Fourier descriptor based isolated marathi handwritten numeral recognition. International Journal of Computer Applications, 3 (4), 9–13.
Sener, S., & Unel, M. (2006). A new affine invariant curve normalization technique using independent component analysis. In Pattern recognition, 2006. icpr 2006. 18th international conference on
(Vol. 2, p. 48-48). doi: 10.1109/ICPR.2006.111
Simon, D. (2013). Evolutionary optimization algorithms (first ed.). Wiley. Strang, G. (2003). Introduction to linear algebra (third ed.). Wellesley Cambridge.
Con el propósito de promover el desarrollo y divulgación de la investigación en educación en América Latina, en La RECI Revista Iberoamericana de las Ciencias Computacionales e Informática se adhirió a la Iniciativa de Acceso Abierto de Budapest, por lo que se identifica como una publicación de acceso abierto. Esto significa que cualquier usuario puede leer el texto completo de los artículos, imprimirlos, descargarlos, copiarlos, enlazarlos, distribuirlos y usar los contenidos para otros fines. Las licencias Creative Cummons, permiten especificar los derechos de uso de una revista de acceso abierto disponible en Internet de tal manera que los usuarios conocen las reglas de publicación.
Los autores/as que publiquen en esta revista aceptan las siguientes condiciones:
Los autores/as conservan los derechos de autor y ceden a la revista el derecho de la primera publicación, con el trabajo registrado con la licencia de atribución de Creative Commons, que permite a terceros utilizar lo publicado siempre que mencionen la autoría del trabajo y a la primera publicación en esta revista.
Los autores/as pueden realizar otros acuerdos contractuales independientes y adicionales para la distribución no exclusiva de la versión del artículo publicado en esta revista (p. ej., incluirlo en un repositorio institucional o publicarlo en un libro) siempre que indiquen claramente que el trabajo se publicó por primera vez en esta revista.
Se permite y recomienda a los autores/as a publicar su trabajo en Internet (por ejemplo en páginas institucionales o personales) antes y durante el proceso de revisión y publicación, ya que puede conducir a intercambios productivos y a una mayor y más rápida difusión del trabajo publicado