Documento sin título

Adaptación al español del Cuestionario de Usabilidad de Sistemas Informáticos CSUQ

Spanish adaptation of Computer System Usability Questionnaire CSUQ

María Isolde Hedlefs Aguilar
Universidad Autónoma de Nuevo León, México
lab.cognitive@gmail.com

Arturo de la Garza González
Universidad Autónoma de Nuevo León, México
agarza7@gmail.com

Martha Patricia Sánchez Miranda
Universidad Autónoma de Nuevo León, México
Marpa30@gmail.com

Andrea Abigail Garza Villegas
Universidad Autónoma de Nuevo León, México
agarza.v@hotmail.com

Resumen
Se adaptó el cuestionario CSUQ en una población mexicana donde se habla el español, con el propósito de que pudiera ser utilizado en investigaciones posteriores. Se aplicó el cuestionario CSUQ versión 3 a una muestra de 237 estudiantes de una universidad pública mexicana a través de Internet. Los resultados mostraron que el coeficiente de alfa de Cronbach fue de .96, que indica que el cuestionario tiene una muy buena confiabilidad. El análisis factorial manifestó la presencia de tres factores como se menciona en la literatura, los cuales fueron Calidad del Sistema, Calidad de la información y Calidad de la interfaz, cumpliendo así con la validez de constructo. El cuestionario quedó conformado por 13 ítems. Se concluye que el CSUQ adaptado al español cuenta con la adecuada validez y confiabilidad para ser utilizado como un instrumento apto para medir la usabilidad general de una plataforma.

Palabras clave: usabilidad, CSUQ, adaptación, confiabilidad, validez.

Abstract
The CSUQ questionnaire was adapted to Spanish language in a Mexican population, with the purpose to be used in further research. The version 3 of the CSUQ questionnaire was applied to a 237 students of a Mexican public university, through the Internet. The results show a Cronbach’s alpha of .96, indicating a good statistical reliability. The factorial analysis indicated a 3 factor structure: System quality, information quality and interface quality, fulfilling with the construction validity. The questionnaire was integrated with 13 ítems. In conclusion, the Spanish adaptation of the CSUQ have the appropriate validity and reliability to be used as an instrument to measure the general usability of a system.

Key words: usability, CSUQ, adaptation, reliability, validity.
Fecha recepción: Enero 2015 Fecha aceptación: Junio 2015

Introducción
Uno de los problemas que hemos enfrentado los investigadores latinos en el área de la evaluación de la usabilidad a través de los cuestionarios, es que no contamos con este tipo de herramientas adaptadas a la lengua española. Es por esto que el objetivo de la investigación, fue la adaptación del Cuestionario de Usabilidad en Sistemas Informáticos CSUQ (Computer System Usability Questionnaire) en una población mexicana donde se habla el español.

El Cuestionario CSUQ surgió de otro denominado Estudio Posterior del Cuestionario de Usabilidad en Sistemas Informáticos PPSUQ (de sus siglas en inglés Post-Study System Usability Questionnaire), (Lewis, 1995). La construcción de los ítems del cuestionario PPSUQ fue a partir de un grupo de evaluadores de usabilidad, donde ellos seleccionaron los más adecuados de acuerdo a su contenido sobre la base de lo que ellos consideraban usabilidad. Para esto tomaron en cuenta las características del sistema, como son facilidad de uso, facilidad de aprendizaje, sencillez, eficacia, información e interfaz de usuario.

El instrumento PPSUQ fue diseñado para evaluar la satisfacción percibida de los usuarios con sus sistemas informáticos (Lewis, 2002) y este fue un proyecto interno de IBM llamado SUMS (System Usability MetricS), encabezado por Suzanne Henry (Sauro & Lewis, 2012).
A partir de este cuestionario surgieron tres versiones, la primera versión contaba con 18 ítems, la segunda versión contaba con 19 y en esta misma versión, Lewis encontró que tres ítems (3, 5, 13) no contribuyeron para la confiabilidad de la escala; por lo cual surgió la versión número 3, en donde el cuestionario PPSUQ cuenta con tan solo 16 ítems (Lewis, 2002). Otro punto importante a mencionar, es el hecho que este cuestionario fue aplicado en un laboratorio de usabilidad, es decir, los usuarios tenían que manipular la interfaz a través de una serie de escenarios y al final responder este cuestionario. Lo que menciona la literatura es que en la primera versión solo lograron aplicar a 48 participantes, ya que la muestra fue muy pequeña y esta fue aplicada en un laboratorio de usabilidad, Lewis en 1995 desarrolló el cuestionario CSUQ, que es casi igual al PPSUQ que se aplicó a 325 participantes.
Con respecto al análisis factorial que se realizó de la tercera versión del PSSUQ, se encontraron los mismos tres factores localizados en las versiones anteriores (Sauro & Lewis, 2012):

Calidad del sistema: conformado por los ítems del 1 al 6.
Calidad de la información: conformado por los ítems del 7 al 12.
Calidad de la interfaz: conformado por los ítems del 13 al 15.

El CSUQ fue desarrollado para poder recopilar un mayor número de cuestionarios aplicados y así observar si la estructura factorial encontrada para el PSSUQ en un entorno de pruebas de usabilidad (laboratorio), era el mismo para un cuestionario enviado por correo (en el campo) (Sauro & Lewis, 2012).
Los cuestionarios PPSUQ y el CSUQ han presentado niveles altos de confiabilidad a través del tiempo, lo cual es evidencia de una buena estabilidad en su consistencia interna a través de las diferentes versiones (PPSUQ v1 .97, PPSUQ v2 .96, PPSUQ v3 .94 y el CSUQ .95) (Lewis, 1995, 2002; Sauro & Lewis, 2012).
Se ha podido observar en las investigaciones de Lewis (1995), que tanto el cuestionario CSUQ y el PPSUQ muestran una muy buena validez de constructo. Por lo cual, con estos resultados se demuestra que se pueden utilizar estos dos cuestionarios para realizar evaluaciones con respecto a la satisfacción general que tienen los usuarios con una interfaz. Por lo tanto, el CSUQ y PPSUQ son cuestionarios que evalúan en general la satisfacción del usuario.
En un estudio comparativo entre diferentes instrumentos de evaluación de usabilidad, Tullis y Stetson (2004), encontraron que el CSUQ tiene un buen desempeño midiendo las reacciones de los participantes a un sitio web, en comparación con otros instrumentos, como son: el Words (Benedek & Miner, 2002), el QUIS (Chin, Diehl, & Norman, 1988), el SUS (Brooke, 1996) y uno desarrollado por Tullis y Stetson (2004). Además, encontraron que realizaba evaluaciones válidas aun con muestras pequeñas. Esto demuestra la capacidad del instrumento en el ámbito de los estudios de usabilidad.
La diferencia que marca Lewis (1995) entre los dos cuestionarios, es que el PPSUQ es adecuado para utilizarse en situaciones de pruebas de usabilidad en el entorno controlado de un laboratorio, mientras que el CSUQ es adecuado para utilizarlo en pruebas de campo, es decir, donde el participante pueda responder el cuestionario sin que necesite realizar ninguna tarea con la interfaz, solo se requiere que haya interactuado anteriormente con ella.
Otro punto importante a notar con los dos cuestionarios, es que hay unos pequeños cambios en la redacción de los ítems, ya que el PPSUQ se refiere a situaciones de pruebas de usabilidad, mientras que el CSUQ no hace referencia a ello, sino a la calidad del sistema como la satisfacción general.
La escala utilizada por los autores en la presente investigación, fue la de CSUQ Versión 3 (Sauro & Lewis, 2012), la cual se encuentra en el apéndice. En esta investigación se les pidió a los participantes que evaluaran la plataforma NEXUS, la cual es utilizada para facilitar la comunicación y colaboración entre alumnos y maestros dentro del proceso de enseñanza y aprendizaje, en las tres modalidades que son: presencial, a distancia y mixto.

Método

Participantes
Se aplicó a 237 participantes, 129 del sexo femenino y 108 del sexo masculino, con una media de edad de 21 años. Fueron obtenidos de cuatro carreras, 119 de Ingeniero Administrador de Sistemas (IAS), 3 de Ingeniero en Tecnología de Software (ITS), 26 de Ingeniero Mecánico Administrador (IMA) y 89 de Licenciado en Psicología.
Instrumento
Se aplicó el CSUQ versión 3 que consta de 16 ítems (Sauro & Lewis, 2012), el cual presentó una confiabilidad de .89 y validez de constructo de tres factores (calidad de sistema, calidad de la información y calidad de la interfaz). Para la adaptación, se utilizó el procedimiento de traducción inversa, con tres expertos bilingües en usabilidad, donde dos de ellos tradujeron al español el cuestionario, después estos dos cotejaron sus traducciones y el tercer experto realizó la traducción al inglés del cuestionario traducido. A continuación, los tres expertos cotejaron sus versiones hasta llegar a un acuerdo, para así obtener la versión final.
Esta traducción se implementó en línea a través de la plataforma de Google Forms, con la intención de poder capturar las respuestas de los participantes. Se utilizó una escala Likert de 7 niveles de respuesta, donde iban de totalmente en desacuerdo (1) a totalmente de acuerdo (7), aunque en el cuestionario en inglés se utilizaba al revés, de totalmente de acuerdo en 1 y totalmente en desacuerdo en 7 (Lewis, 1995, 2002; Tullis & Stetson, 2004; Sauro & Lewis, 2012). Sauro y Lewis (2012) indicaron que la escala utilizada en el cuestionario es apta para poder ser invertida en sus respuestas, sin que se vea afectada su efectividad. Se tomó la decisión de cambiar de orden de escala por la familiaridad que se tiene en nuestro contexto cultural, donde se está acostumbrado que del extremo derecho se encuentra de acuerdo y del extremo izquierdo en desacuerdo.
Se agregaron algunas preguntas a la sección de los datos de los participantes, relacionadas con su edad, tiempo de experiencia en el uso de la plataforma y la carrera que estaban cursando.
Procedimiento
Se invitó a los asistentes a participar de manera voluntaria en la investigación a través de la red Facebook, así como por correo electrónico. A través de estos medios electrónicos se les envió una dirección web desde la cual ellos accedían a la plataforma Google Forms, donde se encontraban los ítems a contestar. Para responder este cuestionario los participantes tardaron menos de diez minutos.

Resultados

Se obtuvieron los siguientes resultados del cuestionario CSUQ. En el cuestionario global de 16 ítems se encontró que el coeficiente alpha de Cronbach fue de .97, en la prueba de esfericidad de Bartlett salió significativo p < .001 y el índice de Kaiser-Meyer-Olkin (KMO) fue de .95, lo cual significa que es viable realizar el análisis factorial. A continuación se procedió a realizar el análisis factorial exploratorio (AFE) y se encontró un solo factor; su porcentaje de varianza explicada fue de 66.98 %. Por último, se realizó el AFE forzando este análisis a tres factores, ya que en la literatura marca su existencia, por lo tanto se quería comprobar. En AFE nos arrojó que sí se presentan los factores antes mencionados (ver figura 1), y que la varianza explicada fue de 77.48 %. En el análisis factorial exploratorio se encontraron los tres factores con sus respectivos ítems, los cuales se pueden observar en la tabla I.

Figura 1. Gráfica de sedimentación del Cuestionario CSUQ de 16 ítems

Tabla I. Matriz de componentes rotados con los 16 ítems

Matriz de Componentes Rotados
ÍTEM	Componentes
ÍTEM	FACTOR 1	FACTOR 2	FACTOR 3
2	.30	.43	.71
5	.35	.27	.81
6	.34	.23	.79
7	.74	.30	.22
8	.73	.36	.21
9	.74	.29	.41
10	.69	.34	.42
11	.70	.35	.42
12	.70	.42	.36
13	.46	.71	.23
14	.35	.81	.28
15	.55	.63	.20
16	.47	.73	.34
1	.29	.59	.58
3	.23	.62	.52
4	.35	.70	.39

En el factor 1 (calidad de la información) el coeficiente alpha de Cronbach fue de .93, en el factor 2 (calidad de la información) el coeficiente de alpha fue de .94 y en el factor 3 (calidad del sistema) su coeficiente fue de .88.
Por tanto, se observó que tres ítems (1, 3 y 4), según los antecedentes (Lewis & Sauro, 2012), se encuentran agrupados en el factor 3 (calidad del sistema) y en nuestro estudio estos tres ítems cargaron en el factor 2 (calidad de la interfaz). Esto lo podemos observar en la tabla II de la matriz de correlación, donde los ítems 4 y 14 muestran una correlación de .78 y los ítems 4 y 16 tienen correlación de .79 (en negritas).

Tabla II Matriz de correlación.

	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16
1	-
2	.77	-
3	.70	.67	-
4	.69	.63	.70	-
5	.68	.73	.61	.62	-
6	.61	.67	.58	.60	.78	-
7	.57	.54	.52	.60	.52	.47	-
8	.58	.58	.52	.60	.49	.53	.70	-
9	.63	.63	.57	.63	.68	.58	.68	.64	-
10	.61	.62	.60	.64	.65	.64	.62	.65	.75	-
11	.64	.62	.62	.62	.66	.61	.63	.62	.78	.78	-
12	.66	.64	.59	.67	.63	.61	.63	.69	.73	.77	.81	-
13	.65	.61	.61	.67	.57	.52	.58	.60	.62	.70	.66	.68	-
14	.70	.65	.64	.78	.59	.57	.55	.60	.62	.64	.66	.68	.79	-
15	.59	.54	.63	.62	.57	.55	.57	.63	.68	.67	.67	.69	.72	.74	-
16	.76	.67	.68	.79	.66	.60	.62	.64	.70	.71	.73	.78	.77	.83	.80	-
Todos los valores tienen una p < .001

Así que se procedió a realizar los mismos análisis, pero eliminando estos tres ítems, quedando en el cuestionario solo 13 por evaluar.

Los resultados del cuestionario de 13 ítems fueron que el coeficiente de alpha fue de .96, la prueba de esfericidad de Bartlett salió significativo p < .001 y el índice de KMO fue de .95. En el análisis factorial exploratorio salió un solo factor con 67.9 % de varianza explicada, después se procedió a realizar un análisis factorial de tres factores (ver figura 2), cuyo resultado fue de 79.7 % de varianza explicada. En este análisis se encontraron los tres factores con sus respectivos ítems, los cuales se pueden ver en la tabla III.

Figura 2. Gráfica de sedimentación del Cuestionario CSUQ de 13 ítems

Tabla III Matriz de componentes rotados con 13 ítems

		Matriz de Componentes Rotados
ÍTEM	Componentes
	FACTOR 1		FACTOR 2	FACTOR 3
2	.38		.32	.70
5	.29		.28	.84
6	.26		.25	.83
7	.25		.82	.21
8	.36		.76	.22
9	.35		.68	.45
10	.43		.59	.47
11	.44		.61	.46
12	.50		.61	.41
13	.79		.35	.28
14	.82		.27	.34
15	.74		.41	.26
16	.75		.40	.38

En el factor 1 (calidad de la información) el coeficiente alpha fue de .93, en el factor 2 (calidad de la información) el coeficiente de alpha fue de .93 y el factor 3 (calidad de sistema) su coeficiente fue de .88.
Por lo que se puede observar que el cuestionario de 13 ítems mostró mejores resultados tanto en la varianza explicada, como en la distribución de los ítems con sus respectivos factores como lo señala la literatura. Cabe mencionar que el ítem 16, cambió del factor 2 al 1, sin embargo, su contenido es de una evaluación general, por lo que es posible aceptar este cambio en su ubicación, sin que afecte en el resultado final.

Conclusiones
Como se pudo observar en los resultados de los análisis correspondientes al cuestionario CSUQ, hubo muy buen coeficiente alpha, lo que significa que el cuestionario cuenta con muy buena confiabilidad, tanto el conformado por 16 ítems (original) como el conformado por 13 ítems.
Adicionalmente, el análisis factorial mostró evidencia de un solo factor, con elevadas cargas y varianza explicada. Pero, siguiendo los antecedentes, se forzó a tres factores, los cuales manifestaron una distribución muy semejante a lo que marca la literatura. Sin embargo, tres de los ítems presentaron inconsistencias con respecto a su pertenencia en los factores. Al revisar el contenido de estos ítems (1, 3 y 4) se pudo observar que su redacción es muy semejante a la de los ítems 14 y 16, donde se expresa la percepción de agrado o satisfacción con respecto a la plataforma evaluada. Los autores planteamos que esta situación es el causante de la modificación de la estructura factorial, donde estos ítems podrían ser incluidos en cualquiera de los factores, ya sea el 2 o 3 (ítems 1 y 3). Por otro lado, en el caso del ítem 4, su contenido es muy parecido al del ítem 14, motivo por el cual aparecen juntos. Esto se ve apoyado por los análisis estadísticos, en particular las correlaciones entre estos ítems, las cuales fueron de valores muy elevados, indicando así la cercanía de las respuestas (ver tabla II).
La opinión de los autores de la presente investigación es que la redacción original de dichos ítems induce a los participantes a una respuesta semejante y, por lo tanto, a que se agrupen en el análisis factorial. Por tal motivo, proponemos una escala reducida a 13 ítems que permite evaluar, de forma semejante al original en inglés, la usabilidad. Esto estaría apoyado por los altos valores de confiabilidad de los análisis estadísticos.
En resumen, se puede afirmar que la adaptación de la escala CSUQ al idioma español, mostró ser confiable en términos estadísticos al igual que una adecuada validez de constructo, haciendo apropiada su utilización para la evaluación de las diferentes plataformas web. Por lo tanto, reafirmamos que en nuestra opinión, la redacción de algunos ítems (1, 3, 4, 14 y 16) de la escala original (inglés), inducen a los participantes a dar el mismo tipo de respuesta, haciendo que sea redundante su utilización. Por ello, proponemos una reducción del número de ítems del cuestionario, sin que esto afecte la confiabilidad y validez del instrumento.

Bibliografía
Benedek, J. & Miner, T. (2002). Measuring Desirability: New methods for evaluating desirability in a usability lab setting. Proceedings of Usability Professionals Association, 2003.
Brooke, J. (1996). SUS: A Quick and Dirty Usability Scale. In: P. W. Jordan, B. Thomas, B. A. Weerdmeester, & I. L. McClelland (Eds.), Usability Evaluation in Industri. London: Taylor & Francis.
Chin, J. P., Diehl, V. A., & Norman, K. L. (1988). Development of an instrument measuring user satisfaction of the human-computer interface. Proceedings of SIGCHI '88, (pp. 213-218), New York: ACM/SIGCHI. doi:10.1145/57167.57203
Lewis, J. R. (1995). IBM Computer Usability Satisfaction Questionnaires: Psychometric Evaluation and Instructions for Use. International Journal of Human-Computer Interaction, 7(1), 57-78. doi:10.1080/10447319509526110
Lewis, J. R. (2002). Psychometric evaluation of the PSSUQ using data from five years of usability studies. International Journal of Human-Computer Interaction,14(3-4), 463-488. doi:10.1080/10447318.2002.9669130
Sauro, J., & Lewis, J. R. (2012). Quantifying the user experience: Practical statistics for user research. Elsevier, USA. doi:10.1016/B978-0-12-384968-7.00001-1
Tullis, T. S., & Stetson, J. N. (2004). A Comparison of Questionnaires for Assessing Website Usability. Usability Professional Association Conference, 1-12