Clasificación de turistas asistentes a reuniones utilizando análisis multivariado con variables mixtas

Victoria Dowbley, Gastón Miguel de la Cruz

Resumen


El objetivo de este trabajo es proponer una metodología multivariada que considere un conjunto de variables simultáneamente para clasificar asistentes turistas a reuniones a partir de una base de datos de gran dimensión con variables de naturaleza mixta. La base de datos corresponde a la Encuesta de Demanda llevada a cabo por el Observatorio Económico de Turismo de Reuniones de Argentina correspondiente al año 2015. Se propone una estrategia de análisis en tres etapas que tiene en cuenta las características de la base de datos. Estas etapas son: preparación de la base de datos (relacionada con el objetivo de la clasificación y su marco teórico), aplicación del Análisis de Cluster con el algoritmo de clasificación no jerárquico k-medias, caracterización y validación de los grupos obtenidos. Dado que el algoritmo k-medias es eficiente para grandes bases de datos pero solo funciona con unas pocas variables numéricas, primero se reducen dimensiones aplicando Análisis de Componentes Principales para variables mixtas y luego se aplica el algoritmo sobre unas pocas componentes numéricas. Se plantean criterios para seleccionar una solución entre un conjunto de soluciones posibles acorde al objetivo de la clasificación. El software utilizado es: primera y tercera etapa SPSS versión 20, segunda etapa R versión 3.1. Como resultado se obtuvo una solución de siete grupos validada estadísticamente. Con este trabajo se espera contribuir a la comprensión de la diversidad de turistas asistentes a reuniones e incentivar el uso de los métodos estadísticos multivariados en esta área de investigación.

Palabras clave


Análisis multivariado, Análisis de cluster, Turistas asistentes a reuniones, Variables mixtas.

Texto completo:

PDF

Referencias


Ahmad, A. & Dey, L. (2011). A K-Means Type Algorithm for Subspace Clustering of Mixed Numeric and Categorical Datasets. Pattern Recognition Letters, 32, 1062-1069.

Anderberg, M.R. (1973). Cluster Analysis for Applications. Academic Press.

Berdegué, J.; Escobar, G. (1990). Tipificación de Sistemas de Producción Agrícola. RIMISP. Chile, p. 13-44.

Chatzis, S. P. (2011). A Fuzzy C-Means-Type Algorithm for Clustering of Data with Mixed Numeric and Categorical Attributes Employing a Probabilistic Dissimilarity Functional. Expert Systems with Applications, 38, 8684-8689.

Chian Hsu, C.; Long Chen, C. & Wei Su, Y. (2007). Hierarchical Clustering of Mixed Data Base with Distance Hierarchy. Information Sciences, 177, 4474-4492.

Dray, S.; Dufour, A. B. (2007). The Ade4 Package: Implementing The Duality Diagram for Ecologists. Journal of Statistical Software, 22 (4).

Duong, T. (2007). Ks: Kernel Density Estimation and Kernel Discriminant Analysis for Multivariate Data in R. Journal of Statistical Software, 21 (7).

Escobar, M. (1998). Las aplicaciones de análisis de segmentación: el procedimiento CHAID. Revista Metodología de las Ciencias Sociales, 1, 13 – 49.

Everitt, B.; Landau, S. & Leese M. (2001). Cluster Analysis. Londres. Editorial Arnold, 2001.

Getz, D. (2005). Event management and event tourism (2nd ed.). New York: Cognizant.

Getz, D. (2008). Event Tourism: Definition, Evolution and Research. Tourism Management, 29(3), 403-428.

Getz, D. (2012). Event Studies: Theory, Research and Policy for Planned Events (2nd ed.). Abingdon: Routledge.

González, P. R., & Molina, Ó. M. (2007). La segmentación de la demanda turística española. Metodología de encuestas, 9(1), 57-92.

Hair, J.F.; Anderson, R.E; Tatham, R.L. (1999). Análisis Multivariante. España: Prentice Hall.

Hill, M.O.; Smith, A. J. E. (1976). Principal Component Analysis of Taxonomic Data with Multi-State Discrete Characters. Taxon, 25, 249-255.

Horner, S., & Swarbrooke, J. (2016). Consumer Behaviour In Tourism. Routledge.

Huang, Z. (1997). Clustering Large Data Sets with Mixed Numeric and Categorical Values. Australia: CSIRO Mathematical and Information Sciences.

Köbrich, C. Rehman, T.; Khan M. (2003). Typification of Farming

Systems for Constructing Representative Farm Models: Two Illustrations of the Application of Multivariate Analyses in Chile and Pakistan. Agricultural Systems,76, 146-157.

Kotler, P.; García De Madariaga M., J.; Flores Zamora, J.; Bowen, J. T. & Makens, J. C. (2013). Marketing turístico (5a ed.). Madrid: Pearson

Lebart, J.L.; Morineau, A. & Piron, M. (1995). Statistique exploratoire multidimensionnelle. Dunod.

Lebart, L.; Morineau, A & Warwick, K. (1984). Multivariate Descriptive Statistical Analysis. US: John Wiley & Sons, Inc.

Page, S. & Connell, J. (Eds.). Routledge Handbook of Events. London: Routledge.

Peña D. (2002). Análisis de datos multivariantes. España: Mac Graw-Hill.

R Core Team (2012). R: A Language and Environment for Statistical Computing. Viena, Austria: R Foundation for Statistical Computing. Recuperado de: http://www.R-project.org/.

Shaw, G., Agarwal, S. & Bull, P. (2000). Tourism Consumption and Tourist Behaviour: A British Perspective. Tourism Geographies, 2(3), 264-289.

Talaya, Á. E. & Lara, E. M. R. (1996). La investigación de la demanda turística en España: recopilación y análisis. Estudios turísticos, (129), 81-104.

Tang, Q., & Turco, D. M. (2001). Spending Behaviors of Event Tourists. Journal of Convention & Exhibition Management, 3(2), 33-40.

Tkaczynski, A., & Rundle-Thiele, S. R. (2011). Event Segmentation: A Review and Research Agenda. Tourism Management, 32(2), 426-434.

UNWTO (2016). UNWTO Tourism Highlights. Madrid: UNWTO.

Young, F. W. (1981). Quantitative Analysis Of Qualitative Data. Psychometrica, 4, 357-388.

Young, F.W.; Takane, Y. & Leeuw, J. (1978). The Principal Components of Mixed Measurement Level Multivariate Data: An Alternating Least Squares Method with Optimal Scaling Features. Psychometrica, 2, 279-281


Enlaces refback

  • No hay ningún enlace refback.


TRANSITARE, Año 3, Número 1, enero-junio 2017, es una publicación semestral en línea editada por la Universidad Anáhuac de Oaxaca, S.C. a través de la Coordinación de Investigación y la Coordinación de Publicaciones, con domicilio ubicado en Blvd. Guadalupe Hinojosa de Murat No. 1100. San Raymundo Jalpan, Oaxaca, México. CP 71248.: +52 (951)5016250. transitare@anahuac.mx. Editor responsable: Martín Alberto Rodríguez Brindis. Reserva de Derechos al Uso Exclusivo 04-2013-110613222500-203, ISSN: 2395-9835, ambos otorgados por el Instituto Nacional del Derecho de Autor.

Responsable de la última actualización de este Número, Departamento de Servicios de Tecnología de la Universidad Anáhuac de Oaxaca, S.C., Ing. José Ángel Jiménez Canseco, Blvd. Guadalupe Hinojosa de Murat No. 1100. San Raymundo Jalpan, Oaxaca, México. CP 71248, fecha de última modificación, 03 de abril de 2017.

Los contenidos de los artículos son responsabilidad de los autores y una vez publicado, las consideraciones a los mismos serán turnados a los autores para que ellos resuelvan las posibles controversias con respecto de sus trabajos. La reproducción total o parcial está autorizada siempre y cuando se cite la fuente.

 

Licencia de Creative Commons
Este obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.