New Norms for the Spanish Adaptation of the NEO Personality Inventory-Revised (NEO PI-R): Reliability and Normative Data in Volunteers From the General Population

Sanz, Jesús; García-Vera, María Paz

My SciELO

Custom services

Services on Demand

Journal

Article

Indicators

Cited by SciELO
Access statistics

Clínica y Salud

On-line version ISSN 2174-0550Print version ISSN 1130-5274

Clínica y Salud vol.20 n.2 Madrid 2009

Nuevos Baremos para la Adaptación Española del Inventario de Personalidad NEO Revisado (NEO PI-R): Fiabilidad y Datos Normativos en Voluntarios de la Población General

New Norms for the Spanish Adaptation of the NEO Personality Inventory-Revised (NEO PI-R): Reliability and Normative Data in Volunteers From the General Population

Jesús Sanzy María Paz García-Vera

Universidad Complutense de Madrid

Esta investigación ha sido parcialmente financiada por dos ayudas del Ministerio de Educación y Ciencia (BSO2003-08321 y SEJ2006-02003).

Dirección para correspondencia

RESUMEN

La adaptación española comercial del Inventario de Personalidad NEO-Revisado (NEO PI-R) fue baremada en contextos de selección de personal. Aunque estos baremos son apropiados cuando las personas pueden distorsionar sus respuestas, no lo son para situaciones con deseabilidad social baja como, por ejemplo, investigaciones con voluntarios, precisamente el contexto donde se desarrolló y baremó el NEO PI-R original. Se presentan por primera vez datos normativos y de fiabilidad de la adaptación española comercial del NEO PI-R obtenidos con voluntarios de la población general española (N = 682). Los índices de consistencia interna de las escalas globales del NEO PI-R fueron excelentes (alfas ≥ 0,85), mientras que en 25 de las 30 escalas específicas oscilaron entre adecuados y buenos (alfas ≥ 0,60 y < 0,80). Las diferencias estandarizadas en las puntuaciones del NEO PI-R entre la muestra de voluntarios y la de selección de personal de los baremos comerciales alcanzaron medias absolutas de tamaño medio (d = 0,53), lo que justifica la creación de baremos específicos para situaciones donde las personas no tienen interés directo en distorsionar sus respuestas. Se ofrecen baremos separados para mujeres y varones voluntarios, y se discute su utilidad en diferentes contextos de evaluación de la personalidad (p. ej., contextos clínicos).

Palabras clave: evaluación de la personalidad, NEO PI-R, baremos españoles, fiabilidad.

ABSTRACT

The commercialized Spanish adaptation of the NEO Personality Inventory- Revised (NEO PI-R) was standardized on samples assessed in personnel selection settings. Although these norms are appropriate for situations when persons may distort their responses, they are inadequate for situations with low social desirability such as research settings with volunteers, -the context where the original NEO PI-R was developed and standardized. This study is the first to provide normative and reliability data of the commercialized Spanish adaptation of the NEO PI-R with volunteers from the Spanish general population (N = 682). Internal consistency estimates were excellent (alphas ≥ 0.85) for the NEO PI-R dimension scales, whereas they ranged from adequate to good (alphas ≥ 0.60 and < 0.80) for 25 out of 30 NEO PI-R facet scales. The standardized differences in NEO PI-R scores between the volunteer sample and the personnel selection sample of the commercial norms reached mean absolute values of medium size (d = 0.53). This result supports the development of specific norms for situations where persons do not have a direct interest in distorting their responses. Norms for male and female volunteers are provided, and the utility of these norms for different settings of personality assessment (e.g., clinical contexts) are discussed.

Key words: personality assessment, NEO PI-R, Spanish norms, reliability.

Introducción

En los últimos 20 años el modelo de los cinco factores o Cinco Grandes se ha erigido en la taxonomía más consensuada y validada de los rasgos de personalidad (McCrae y Costa, 2003; Sanz, Avia y Silva, 1999). Según este modelo, que ha sido replicado en diferentes países e idiomas y con diferentes instrumentos y poblaciones, cinco dimensiones globales de personalidad denominadas neuroticismo (frente a estabilidad emocional), extraversión (contrapuesta a introversión), apertura a la experiencia o cultura (frente a cerrazón a la experiencia), amabilidad (contrapuesta a antagonismo) y responsabilidad (frente a falta de responsabilidad) pueden resumir e integrar la mayoría de los rasgos de personalidad.

Costa y McCrae (1985) desarrollaron uno de los primeros cuestionarios de personalidad específicamente diseñados para la evaluación de los Cinco Grandes: el Inventario de Personalidad NEO (NEOPI). Tanto este inventario como su versión revisada (NEO PI-R; Costa y McCrae, 1992) y su versión abreviada (NEO-FFI; Costa y McCrae, 1989) se han convertido en el estándar para la evaluación del modelo de los cinco factores (Sanz et al., 1999; Sanz, Gil, García-Vera y Barrasa, 2008).

A partir de una adaptación experimental de Avia (Avia, Sanz y Sánchez-Bernardos, 1997), TEA Ediciones publicó en 1999 las adaptaciones españolas del NEO PI-R y del NEO-FFI (Costa y McCrae, 1999). En la adaptación comercial del NEO PI-R se retocaron 79 ítems de la adaptación de Avia y, aunque algunos de estos cambios fueron menores (p. ej., inclusión de una coma), en otros ítems las modificaciones fueron sustanciales, lo que podría dar lugar a interpretaciones diferentes del contenido de los ítems.

Estas adaptaciones españolas comerciales del NEO PI-R y del NEO-FFI fueron desarrolladas y baremadas con muestras evaluadas en procesos de selección de personal (Costa y McCrae, 1999) y, por consiguiente, parecen estar especialmente diseñadas para contextos de evaluación en los que se asume que las personas están motivadas a presentar una imagen favorable de sí mismos como, por ejemplo, procesos de selección de personal y de promoción laboral. Sin embargo, los baremos así obtenidos no parecen apropiados en otros contextos como, por ejemplo, en las investigaciones realizadas con voluntarios, donde se asume que las respuestas a los cuestionarios de personalidad son autoinformes verídicos de los comportamientos de las personas evaluadas ya que éstas no tienen nada que ganar o perder como consecuencia de la evaluación, especialmente cuando tales evaluaciones se hacen con garantías de anonimato o confidencialidad.

Efectivamente, estudios previos demuestran consistentemente que las puntuaciones en los cuestionarios de personalidad de los solicitantes de empleo difieren significativamente, en la dirección de mostrar una imagen socialmente más deseable, de las puntuaciones que obtienen las personas que los completan de forma voluntaria como, por ejemplo, personas que actualmente ocupan esos empleos o personas que participan en una investigación (Hough, 1998; Sanz, Gil, Barrasa y García-Vera, 2006).

Hough (1998) comparó en tres estudios las puntuaciones medias en nueve escalas de personalidad de 1.739 empleados en diversos puestos de trabajo y 40.479 candidatos a esos puestos. Las diferencias entre ambos tipos de muestras en términos del estadístico d de tamaño del efecto llegaron a alcanzar, en valores absolutos, 0,56 unidades de desviación típica para una escala de necesidad de logro en las submuestras de varones del segundo estudio (Hough, 1998), mientras que promediando los valores absolutos de los estadísticos d calculados por Hough (1998) en las submuestras de varones y mujeres de los tres estudios, y ponderándolos por el tamaño de esas submuestras, se podría estimar en 0,26 unidades de desviación típica las diferencias medias entre ocupantes y solicitantes de empleo en las puntuaciones en escalas diseñadas para evaluar diversos rasgos de personalidad (p. ej., responsabilidad, necesidad de logro, influencia, adaptabilidad, mentalidad detallista, autoestima resistente y búsqueda de experiencias).

De hecho, tras realizar un meta-análisis de 33 estudios que comparaban las puntuaciones en escalas de personalidad de empleados y candidatos, Birkeland, Manson, Kisamore, Brannick y Smith (2006) calcularon que, a lo largo de todos los tipos de puestos de trabajo, los candidatos puntuaban significativamente más alto que los empleados en apertura a la experiencia (d = 0,13) y extraversión (d = 0,11), pero, especialmente, en responsabilidad (d = 0,45) y estabilidad emocional (d = 0,44). Además, estos autores encontraron que estas diferencias eran mayores para los instrumentos diseñados para evaluar directamente los Cinco Grandes que para los instrumentos que los evalúan indirectamente.

Por otro lado, algunos estudios sugieren que estas diferencias son aún más grandes cuando se comparan solicitantes de empleo con personas de la población general que participan voluntariamente en una investigación. Por ejemplo, tras ajustar las puntuaciones medias en función del sexo y la edad, Sanz et al. (2006) encontraron diferencias estadísticamente significativas entre 91 trabajadores voluntarios de la población general y 420 solicitantes de empleo en 11 de las 20 escalas del Inventario de Personalidad y Preferencias-Normativo (PAPI-N; Cubiks, 1996), diferencias que oscilaban entre 0,30 y 0,66 unidades de desviación típica (d medio = 0,45) y que reflejaban un perfil socialmente deseable por parte de los solicitantes de empleo.

Es más, estas diferencias también se pueden observar en la adaptación española comercial del NEO-FFI. Manga, Ramos y Morán (2004) aplicaron dicha adaptación a una muestra de 1136 adultos voluntarios españoles. Al comparar, en términos del estadístico d de tamaño del efecto, las puntuaciones medias de esta muestra con las de la muestra de selección de personal que conforma los baremos oficiales de la adaptación española comercial del NEOFFI (Costa y McCrae, 1999), los estadísticos d alcanzaron un valor medio para todas las escalas de 0,50 y 0,53 unidades de desviación típica para las submuestras de varones y mujeres, respectivamente. En todos los casos estas diferencias reflejaban un perfil socialmente más favorable en los baremos oficiales de la adaptación española del NEO-FFI, es decir, niveles más bajos de neuroticismo y más altos de extraversión, apertura, amabilidad y, sobre todo, responsabilidad.

Estos resultados sugieren que los baremos de las adaptaciones comerciales españolas del NEO PI-R y del NEO-FFI no son apropiados para interpretar las respuestas de las personas que contestan a dichos inventarios en contextos con baja o nula deseabilidad social como, por ejemplo, los contextos de investigación en los que las personas completan los instrumentos de forma voluntaria (y habitualmente también de forma anónima o confidencial), contextos en los cuales, precisamente, Costa y McCrae (1992) desarrollaron y baremaron ambos inventarios.

Para la adaptación española comercial del NEOFFI existen baremos para adultos voluntarios españoles elaborados por Manga et al. (2004) a partir de la muestra mencionada anteriormente. Sin embargo, no existen tales baremos para la adaptación española comercial del NEO PI-R. Aunque de Miguel (2005) administró el NEO PI-R a una muestra de 560 adultos voluntarios españoles, la versión del NEO PI-R que utilizó no fue la comercializada por TEA Ediciones, sino la de Avia et al. (1997), en la que, además, introdujo algunos cambios. Por tanto, la versión española del NEO PI-R utilizada por de Miguel (2005) difiere de forma significativa de la adaptación comercial española del instrumento, pues a las diferencias entre esta adaptación y la de Avia hay que añadir las modificaciones que la propia de Miguel realizó en la redacción de 33 ítems de esta última. En definitiva, la versión del NEO PI-R aplicada por de Miguel (2005) se diferencia de la adaptación comercial española en 97 ítems y, por tanto, aunque algunas diferencias son menores, es difícil establecer que los datos normativos proporcionados por de Miguel (2005) sean aplicables a la adaptación comercial española del NEO PI-R, sin duda la más extendida y utilizada por los profesionales e investigadores españoles.

Recientemente, se ha publicado una 3ª edición de la adaptación comercial española que incluye tres nuevos baremos (Costa y McCrae, 2008). Sin embargo, éstos consisten en una ampliación de la muestra de tipificación de personas evaluadas en procesos de selección de personal, en una nueva muestra de aspirantes a cuerpos de seguridad (policías, bomberos y fuerzas armadas) también evaluados en procesos de selección de personal, y en una nueva muestra de estudiantes universitarios los cuales, aunque fueron evaluados en contextos voluntarios no competitivos, tan sólo representan, en términos de edad y nivel de educación, a un sector muy restringido de los adultos de la población general española.

En conclusión, el objetivo del presente estudio es presentar por primera vez datos normativos y de fiabilidad para la adaptación española comercial del NEO PI-R obtenidos con una muestra heterogénea de adultos voluntarios de la población general española, los cuales permitan utilizar el NEO PI-R en contextos de investigación con voluntarios o en situaciones en las cuales se presuma que la deseabilidad social es baja o nula como, por ejemplo, algunos contextos clínicos o educativos.

Método

Participantes

En este estudio participaron 692 adultos (390 mujeres y 292 varones) de la población general de la Comunidad de Madrid con edades comprendidas entre 18 y 84 años (edad media = 41,8; dt = 14,8). Estas personas fueron reclutadas mediante la técnica de la "bola de nieve" por estudiantes universitarios de Psicología quienes invitaron a sus familiares y amigos a participar en un estudio sobre personalidad e hipertensión (n = 358) o en otro sobre evaluación de la personalidad (n = 325), siguiendo en ambos casos unos criterios que aseguraran cierta heterogeneidad de la muestra en cuanto a la edad y sexo. A pesar de que una muestra así obtenida no es aleatoria, se consiguió que su perfil respecto al sexo y la edad fuera muy parecido al de la población española (véase la Tabla 1). Más información< sobre las características sociodemográficas de la muestra se recoge en la Tabla 2, en la cual se puede apreciar su heterogeneidad también en cuanto a su nivel de estudios, estado civil y profesión o situación laboral.

Instrumentos

Inventario de Personalidad NEO Revisado (NEO PI-R; Costa y McCrae, 1992). El NEO PI-R es un inventario de autoinforme de 240 ítems con escalas de tipo Likert de 5 puntos (de 0 a 4) diseñado para evaluar la personalidad según el modelo de los Cinco Grandes. El NEO PI-R tiene cinco escalas básicas, cada una compuesta por 48 ítems, que se corresponden con las dimensiones básicas del mismo nombre de los Cinco Grandes, y 30 escalas específicas de 8 ítems cada una (seis por cada escala básica) que pretenden medir las facetas o factores específicos de personalidad que según Costa y McCrae (1992) conforman los Cinco Grandes. En este estudio se utilizó la adaptación española comercial del NEO PI-R (Costa y McCrae, 1999).

Procedimiento

Los participantes que colaboraron en la investigación sobre personalidad e hipertensión completaron el NEO PI-R como parte de una evaluación más exhaustiva en la que tenían que rellenar otros cuestionarios de personalidad, siendo el NEO PI-R el primero. Los participantes que colaboraron en la investigación sobre evaluación de la personalidad tan sólo completaron el NEO PI-R. En ambos casos, el NEO PI-R fue aplicado individualmente por el estudiante de Psicología que había invitado al participante a colaborar en una de esas dos investigaciones como parte de sus clases prácticas o de un seminario. El entrenamiento y supervisión de los estudiantes en la administración del NEO PI-R fue realizado por los autores de este estudio durante esas clases prácticas o seminario.

Resultados

Fiabilidad de consistencia interna del NEO PI-R en voluntarios españoles

En la Tabla 3 se presentan los coeficientes alfa de consistencia interna obtenidos en la muestra de voluntarios españoles para cada una de las escalas básicas y específicas del NEO PI-R. Siguiendo los criterios propuestos por Prieto y Muñiz (2000), todas las escalas básicas del NEO PI-R obtuvieron coeficientes de fiabilidad excelentes (r ≥ 0,85), mientras que el 43,3% de sus escalas específicas lograron coeficientes de fiabilidad buenos (0,80 ≤ r < 0,85; 1 escala) o adecuados (0,70 ≤ r < 0,80; 12 escalas), el 40% de dichas escalas específicas obtuvieron coeficientes adecuados con carencias (0,60 ≤ r < 0,70; 12 escalas), y tan sólo 5 escalas específicas (16,7%) mostraron coeficientes inadecuados (r < 0,60).

Estos resultados son similares, aunque ligeramente inferiores, a los obtenidos por Costa y McCrae (1992) con el NEO PI-R original en muestras de voluntarios estadounidenses. Así, en estas muestras todas las escalas básicas del NEO PI-R también obtuvieron coeficientes de fiabilidad excelentes, mientras que el 56,7% de sus escalas específicas lograron coeficientes buenos (2 escalas) o adecuados (15 escalas), el 33,3% de dichas escalas específicas obtuvieron coeficientes adecuados con carencias (10 escalas), y tan sólo 3 escalas (10%) específicas mostraron coeficientes inadecuados (véase la Tabla 3).

Curiosamente, los índices de consistencia interna del NEO PI-R en ambas muestras de adultos voluntarios fueron superiores (voluntarios estadounidenses) o ligeramente superiores (voluntarios españoles) a los obtenidos con la muestra de tipificación de selección de personal de la adaptación española comercial (Costa y McCrae, 2008; véase la Tabla 3)¹. En esta última muestra, aunque todas las escalas básicas también obtuvieron coeficientes de fiabilidad excelentes, entre las escalas específicas, tan sólo el 30% alcanzaron coeficientes de fiabilidad buenos (1 escala) o adecuados (8 escalas), un 50% (15 escalas) logró coeficientes adecuados con carencias y un 20% (6 escalas) obtuvo coeficientes inadecuados.

Diferencias en el NEO PI-R entre voluntarios y solicitantes de empleo

En la Tabla 4 se presentan las medias en el NEO PI-R tanto de la muestra de voluntarios españoles del presente estudio como de la muestra de selección de personal que conforma los actuales baremos de tipificación españoles del instrumento (Costa y McCrae, 2008). En términos del estadístico d, la diferencia media para todas las escalas alcanzó, en valores absolutos, 0,56 y 0,51 unidades de desviación típica para los varones y las mujeres, respectivamente, y en ambos casos las diferencias apuntaban en la dirección de una imagen socialmente más favorable para la muestra de selección de personal².

Esta imagen implicaba niveles más altos de extraversión, apertura, amabilidad y de todas las facetas de estas tres dimensiones, y, especialmente, niveles más bajos de neuroticismo y de todas sus facetas y niveles más altos de responsabilidad y de todas sus facetas. Las únicas excepciones a este patrón general fueron, en los varones, las escalas de búsqueda de emociones y fantasía, y, en las mujeres, las escalas de franqueza, modestia y fantasía, para las cuales se encontraron puntuaciones más altas en la muestra de voluntarios que en la de selección de personal, aunque en todos los casos tales diferencias fueron menores de un tamaño del efecto pequeño (< 0,20) según los valores convencionales de Cohen (1988).

Baremos del NEO PI-R para adultos voluntarios españoles

Puesto que las diferencias entre las medias en el NEO PI-R de la muestra de voluntarios españoles de este estudio y la muestra de selección de personal de los baremos comerciales españoles superaban en muchas escalas 0,80 unidades de desviación típica (véase la Tabla 4), lo que se considera un efecto de tamaño grande (Cohen, 1988) y, de hecho, las diferencias medias para todas las escalas (d = 0,56 y 0,51) representaban efectos de tamaño medio (d > 0,50; Cohen, 1988), parecía justificado elaborar baremos específicos para adultos voluntarios españoles. En las Tablas 5 y 6 se recogen estos nuevos baremos del NEO PI-R en percentiles así como las medias y desviaciones típicas necesarias para transformar las puntuaciones brutas en puntuaciones típicas.

En consonancia con los baremos comerciales, los baremos de las Tablas 5 y 6 se presentan de forma diferenciada para varones y mujeres ya que, además, en la presente muestra de la población general se encontraron diferencias estadísticamente significativas entre varones y mujeres en la mayoría de las escalas del NEO-PI-R y, en algunas de ellas, tales diferencias se acercaban a tamaños medios del efecto. En concreto, los coeficientes de correlación parcial entre el sexo y cada una de las escalas del NEOPI- R, controlando el efecto de la edad, fueron estadísticamente significativos en 26 de las 35 escalas del NEO-PI-R. Es más, en 21 de esas 26 escalas dichos coeficientes de correlación superaron el valor de 0,10, considerado por Cohen (1988) como un efecto de tamaño pequeño, y en 9 escalas superaron el valor de 0,20, coeficiente que se encuentra entre un tamaño del efecto pequeño (r > 0,10) y uno medio (r > 0,30) según los valores convencionales de Cohen (1988) para el coeficiente de correlación.

Discusión

Consistentemente con la literatura previa, los resultados del presente estudio confirman que las puntuaciones en el NEO PI-R que obtienen los adultos voluntarios españoles difieren notablemente (0,56-0,51 unidades de desviación típica como promedio) de las puntuaciones que obtienen adultos en procesos de selección de personal como son los que formaban parte de los baremos comerciales del inventario. Estas diferencias son similares a las encontradas cuando se comparan las puntuaciones que obtienen en el NEO-FFI los adultos voluntarios españoles del estudio de Manga et al. (2004) con las puntuaciones de la muestra de selección de personal que conforman los baremos oficiales de la adaptación comercial del NEO-FFI (diferencias medias de 0,50-053 unidades de desviación típica).

Estos resultados implican que la utilización de los baremos oficiales de la adaptación española comercial del NEO PI-R puede distorsionar significativamente la interpretación que se haga de las puntuaciones de un adulto que conteste de forma voluntaria al NEO PI-R, presentándole con niveles más bajos de extraversión, apertura y amabilidad y, especialmente, con niveles más altos de neuroticismo y más bajos de responsabilidad, de los que realmente tiene en comparación con la población española de referencia.

Por consiguiente, esos resultados justifican la elaboración de nuevos baremos para la adaptación española comercial del NEO PI-R que estén basados en una muestra representativa de adultos voluntarios procedentes de la población general española.

En el presente estudio se han elaborado tales baremos de forma independiente para varones y mujeres a partir de una muestra incidental de 390 mujeres y 292 varones españoles que fueron reclutados con la técnica de la "bola de nieve" y que completaron el NEO PI-R de forma voluntaria y con garantías de confidencialidad como parte de una investigación. Dada las limitaciones inherentes al procedimiento utilizado para seleccionar la muestra de baremación, cabría cuestionar su grado de representatividad de la población española. Sin embargo, en relación con una variable tan importante como la edad, el perfil de la muestra de baremación respecto a tres grandes grupos de edad (18-29 años, 30-49 años, y 50 años y más) fue muy similar al que se encuentra en la población española (véase la Tabla 1). Por otro lado, el tamaño muestral de los baremos se puede considerar, en función de los criterios propuestos por Prieto y Muñiz (2000), suficiente para los varones (150 ≤ N < 300) y moderado para las mujeres (300 ≤ N < 600). No obstante, es obvio que la utilización de un muestreo aleatorio de selección de participantes pertenecientes, de forma proporcional, a distintas regiones geográficas españolas hubiera mejorado enormemente la representatividad de los baremos.

Es más, sería deseable la realización de nuevos estudios con muestras de voluntarios de la población general que permitieran replicar los resultados aquí obtenidos y confirmar, por tanto, la representatividad de los baremos que se presentan. En este sentido, es esperanzador comprobar que cuando se comparan los resultados hallados con la presente muestra con aquellos obtenidos por Avia et al. (1997) al administrar su adaptación experimental del NEO PIR a una muestra de 196 adultos de la población general española reclutados por un procedimiento similar al utilizado en este estudio, no se encuentran diferencias notables en las puntuaciones medias de las dos escalas (Ansiedad social y Competencia) cuyos ítems son idénticos en ambas adaptaciones españolas del NEO PI-R (la experimental de Avia y la comercial de TEA), obteniéndose diferencias que oscilan entre 0 y 0,12 unidades de desviación típica (d media = 0,06; véase la Tabla 7). Puesto que la versión anterior del NEO PI-R, el NEO-PI, en su adaptación española de Avia (Silva et al., 1994; Avia et al., 1995), también comparte con la adaptación española comercial del NEO PI-R una escala en la que todos sus ítems son idénticos (Ansiedad social), se puede comparar igualmente para dicha escala las puntuaciones medias obtenidas en la muestra de este estudio con aquellas que obtuvieron Silva et al. (1994; Avia et al., 1995) con el NEO-PI en una muestra de 1170 adultos de la población general española reclutados mediante un procedimiento similar al utilizado en la presente investigación. Como se puede ver en la Tabla 7, las diferencias entre ambas muestras fueron de tan sólo 0,13 y 0,15 unidades de desviación típica para varones y mujeres, respectivamente. En resumen, estas comparaciones, aunque limitadas a tan sólo dos escalas del NEO PI-R, son reveladoras tanto de la representatividad de los baremos para la población general española que se presentan en este trabajo como de su necesidad como alternativa a los baremos comerciales españoles del NEO PI-R, ya que las diferencias encontradas entre las muestras de adultos voluntarios de la población general (d con rangos de 0-0,12 ó 0,13-0,15; véase la Tabla 7) son inferiores al valor convencional para un tamaño del efecto pequeño (d= 0,20) y, además, son muy inferiores a las que se encuentran cuando se compara la muestra del presente estudio con la muestra de selección de personal de los baremos comerciales (d = 0,68-0,71 para Ansiedad social y d = 0,74-0,79, en valores absolutos, para Competencia; véase la Tabla 4).

En consonancia con los baremos comerciales, los nuevos baremos para la población general española se han calculado de forma independiente para varones y mujeres, decisión que se ve refrendada por la presencia en esta muestra de diferencias significativas entre varones y mujeres en la mayoría de las escalas del NEO PI-R, diferencias que son consistentes con los resultados encontrados, tanto en muestras de la población general española como en muestras de estudiantes universitarios, por de Miguel (2005) con su propia adaptación del NEO PI-R y por Sanz et al. (1999) con su propia adaptación del NEO-FFI.

Por otro lado, la utilización del NEO PI-R para evaluar la personalidad desde el modelo de los Cinco Grandes en adultos españoles que completan el inventario de forma voluntaria se ve refrendada por la obtención de índices adecuados de fiabilidad de consistencia interna para la mayoría de sus escalas. Efectivamente, los índices de consistencia interna para las escalas globales que miden las cinco dimensiones del modelo de los Cinco Grandes fueron excelentes, mientras que en 25 de las 30 escalas específicas que miden las facetas de dichas dimensiones oscilaron entre adecuados y buenos. Estos índices de fiabilidad son parecidos a los obtenidos por Costa y McCrae (1992) con muestras de voluntarios estadounidenses y a los obtenidos con la muestra de tipificación de selección de personal de los baremos comerciales españoles (Costa y McCrae, 1999, 2008), aunque son ligeramente inferiores a los primeros y mejoran ligeramente estos últimos.

En resumen, los baremos para la adaptación española comercial del NEO PI-R que se presentan en este estudio deberían utilizarse, en lugar de los baremos actuales de dicha adaptación, para interpretar las puntuaciones de las personas que completan de forma voluntaria el inventario en contextos de investigación o en contextos en los que la deseabilidad social se considere baja o nula. Este puede ser el caso, por ejemplo, de muchos contextos clínicos o educativos en los que se anima a los pacientes o clientes a presentarse de la manera más fiel posible para así recibir una mejor ayuda y en los que, además, se protege la confidencialidad de sus respuestas de manera muy estricta.

Sin embargo, los baremos de tipificación actuales que aparecen publicados en las diferentes ediciones de la adaptación española comercial del NEO PI-R (Costa y McCrae, 1999, 2008) deberían seguir utilizándose en todas aquellas situaciones en las que se sospeche que las personas evaluadas tienen un interés específico en presentarse de una manera socialmente favorable, situaciones tales como procesos de selección de personal o de promoción laboral. De hecho, una reciente revisión realizada por Salgado (2005) sobre la validez de las medidas de personalidad para predecir criterios relevantes en el ámbito laboral y sobre el problema de deseabilidad social que presentan tales medidas, llegaba a la conclusión de que, entre las distintas estrategias utilizadas para reducir y neutralizar la deseabilidad social, sólo dos parecen especialmente efectivas: (a) informar a las personas evaluadas que se analizarán sus respuestas respecto a la presencia de deseabilidad social y que dicha presencia podrá tener consecuencias negativas para las personas que distorsionen sus respuestas, y (b) desarrollar baremos a partir de muestras de personas que contestan a los cuestionarios de personalidad en los propios contextos en los que se sospecha la influencia de la deseabilidad social. Precisamente, la utilización de esta última estrategia es la que permiten los baremos de tipificación actuales de la adaptación española comercial del NEO PIR.

Finalmente, la existencia de diferentes adaptaciones españolas del NEO PI-R (la experimental de Avia, la comercial de TEA Ediciones y la elaborada por de Miguel), de diferentes ediciones de la adaptación comercial (1ª y 3ª edición que difieren en sus baremos de tipificación para adultos en selección de personal) y de diferentes baremos para la adaptación comercial (adultos en selección de personal, aspirantes a fuerzas de seguridad, estudiantes universitarios y adultos voluntarios) sugiere que tanto los profesionales como los investigadores españoles deberían especificar claramente en sus informes y artículos qué versión española del NEO PI-R y qué edición, en su caso, están utilizando, así como qué baremos están aplicando.

¹En esta comparación se han utilizado los coeficientes de fiabilidad que se presentan en la 3ª edición de la adaptación española comercial (Costa y McCrae, 2008). Estos coeficientes fueron obtenidos con una muestra de tipificación de personas evaluadas en contextos de selección de personal que duplica en su tamaño la muestra de tipificación de la 1ª edición y, además, son ligeramente superiores a los obtenidos con esta última muestra. En concreto, en la muestra de tipificación de la 1ª edición tan sólo dos escalas básicas obtuvieron coeficientes de fiabilidad excelentes, ya que las tres restantes mostraron coeficientes buenos, mientras que, entre las escalas específicas, tan sólo el 20% alcanzó coeficientes de fiabilidad adecuados (6 escalas) y el 30% adecuados con carencias (9 escalas), ya que las 15 escalas restantes (50%) obtuvieron coeficientes inadecuados. Por otro lado, en la 3ª edición de la adaptación española comercial (Costa y McCrae, 2008) no se informa de los coeficientes de fiabilidad obtenidos con las nuevas muestras de baremación de aspirantes a cuerpos de seguridad y de estudiantes universitarios.

² En esta comparación se ha utilizado la muestra de tipificación que se presenta en la 3ª edición de la adaptación española comercial (Costa y McCrae, 2008) y que es una muestra que duplica en su tamaño la presentada en la 1ª edición de dicha adaptación. No obstante, los resultados con esta última muestra fueron similares a los obtenidos con la muestra de tipificación de la 3ª edición, con unas diferencias medias (en términos del estadístico d) para todas las escalas en comparación a la muestra de adultos voluntarios de este estudio que alcanzaron, en valores absolutos, 0,60 y 0,59 unidades de desviación típica para los varones y las mujeres, respectivamente, y que apuntaban en la misma dirección de una imagen socialmente más favorable para la muestra de selección de personal. De hecho, las diferencias entre las muestras de tipificación de selección de personal de la 1ª y la 3ª edición de la adaptación española comercial son prácticamente inapreciables (véase Costa y McCrae, 2008), lo cual apunta a las buenas cualidades de ambas muestras para representar a la población de personas que se evalúan en contextos de selección y promoción de personal.

Bibliografía

Avia, M. D., Sanz, J., y Sánchez-Bernardos, M. L. (1997). Versión española del Inventario de personalidad NEO-Revisado (NEO PI-R) de Paul T. Costa y Robert R. McCrae (1992). Versión experimental. Manuscrito no publicado. Facultad de Psicología, Universidad Complutense de Madrid. [ Links ]

Avia, M. D., Sanz, J., Sánchez-Bernardos, M. L., Martínez-Arias, R., Silva, F., y Graña, J. L. (1995). The Five-Factor model: II. Relations of the NEO-PI with other personality variables. Personality and Individual Differences, 19, 81-97. [ Links ]

Birkeland, S. A., Manson, T. M., Kisamore, J. L., Brannick, M. T., y Smith, M. A. (2006). A meta-analytic investigation of job applicant faking on personality measures. International Journal of Selection and Assessment, 14, 317-335. [ Links ]

Cohen, J. (1988). Statistical power analysis for the Behavioral Sciences (21 ed.). Hillsdale, NJ: LEA. [ Links ]

Costa, P. T., Jr., y McCrae, R. R. (1985). The NEOPersonality Inventory manual. Odessa, FL: Psychological Assessment Resources. [ Links ]

Costa, P. T., Jr., y McCrae, R. R. (1989). The NEOPI/ FFI manual supplement. Odessa, FL: Psychological Assessment Resources. [ Links ]

Costa, P. T., Jr., y McCrae, R. R. (1992). Revised NEO Personality Inventory (NEO PI-R) and NEO FiveFactor Inventory (NEO-FFI). Professional manual. Odessa, FL: Psychological Assessment Resources. [ Links ]

Costa, P. T., Jr., y McCrae, R. R. (1999). Inventario de Personalidad NEO Revisado (NEO PI-R). Inventario NEO reducido de Cinco Factores (NEO-FFI). Manual. Madrid: TEA. [ Links ]

Costa, P. T., Jr., y McCrae, R. R. (2008). Inventario de Personalidad NEO Revisado (NEO PI-R). Inventario NEO reducido de Cinco Factores (NEO-FFI). Manual. 3ª edición. Madrid: TEA. [ Links ]

Cubiks (1996). Personality and Preference Inventory. London: Cubiks Group Limited. [ Links ]

Hough, L. M. (1998). Effects of intentional distortion in personality measurement and evaluation of suggested palliatives. Human Performance, 11, 209-244. [ Links ]

Instituto Nacional de Estadística (2004). Censos de población y viviendas 2001. Resultados definitivos. Documento consultado en internet: http://www.ine.es. [ Links ]

Manga, D., Ramos, F., y Moran, C. (2004). The Spanish norms of the NEO Five-Factor Inventory: New data and analyses for its improvement. International Journal of Psychology and Psychological Therapy, 4(3), 639-648. [ Links ]

McCrae, R. R., y Costa, P. T., Jr. (2003). Personality in adulthood: A fivefactor theory perspective (21 ed.). New York: Guilford Press. [ Links ]

Miguel Negredo, A. de (2005). Diferencias de edad y género en el NEOPI-R en dos muestras con distinto nivel académico. International Journal of Psychology and Psychological Therapy, 1, 13-31. [ Links ]

Prieto, G., y Muñiz, J. (2000). Un modelo para evaluar la calidad de los tests utilizados en España. Papeles del Psicólogo, 77, 65-75. [ Links ]

Salgado, J. F. (2005). Personalidad y deseabilidad social en contextos organizacionales: implicaciones para la práctica de la psicología del trabajo y las organizaciones. Papeles del Psicólogo, 92, 115-128. [ Links ]

Sanz, J., Gil, F., Barrasa, A., y García-Vera, M. P. (2006). Self-assessment of needs and behavior patterns at work: Spanish adaptation of the Personality and Preference Inventory-Normative (PAPI-N). Personality and Individual Differences,41, 837-847. [ Links ]

Sanz, J., Gil, F., García-Vera, M. P., y Barrasa, A. (2008). Needs and cognitive/behavior patterns at work and the Big Five: An assessment of the Personality and Preference Inventory Normative (PAPI-N) from the perspective of the five-factor model. International Journal of Selection and Assessment, 16, 46-58. [ Links ]

Sanz, J., Silva, F., y Avia, M. D. (1999). La evaluación de la personalidad desde el modelo de los "Cinco Grandes": El Inventario de Cinco Factores NEO de Costa y McCrae. En F. Silva (Ed.), Avances en Evaluación Psicológica (pp.: 171-234). Valencia: Promolibro. [ Links ]

Silva, F., Avia, M. D., Sanz, J., Martínez-Arias, R., Graña, M. L., y Sánchez Bernardos, M. L. (1994). The Five Factor Model I: Contributions to the structure of the NEO-PI. Personality and Individual Differences, 17, 741-753. [ Links ]

Dirección para correspondencia:
Jesús Sanz
Universidad Complutense de Madrid
Campus de Somosaguas
Facultad de Psicología
Departamento de Personalidad, Evaluación y Psicología Clínica
28223 Madrid.
E-mail: jsanz@psi.ucm.es

Manuscrito recibido: 23/11/2008
Revisión recibida: 14/01/2009
Aceptado: 15/01/2009