Página nueva

Fiabilidad y valores normativos de la versión española del inventario para la depresión de Beck de 1978

Reliability and normative data of the Spanish version of 1978 Beck's Depression Inventory

Se presentan por primera vez datos normativos y de fiabilidad de la traducción española de la versión de 1978 del Inventario para la Depresión de Beck (Beck Depression Inventory, BDI; Beck, Rush, Shaw y Emery, 1979) obtenidos con una muestra de 445 adultos seleccionados de la población general. El índice de consistencia interna fue alto (coeficiente alfa de Cronbach = 0.83). Respecto a la puntuación total del BDI, se hallaron diferencias significativas entre sexos, grupos de edad y niveles de educación. En primer lugar, las mujeres puntúaban más alto que los hombres. En segundo lugar, los mayores de 45 años más que los menores de dicha edad, los mayores de 65 años más que las personas entre 45 y 64 años. En tercer lugar, las personas con estudios básicos más que las personas con estudios universitarios o bachillerato. Se ofrecen puntuaciones normativas y centiles para la muestra total y para diferentes subgrupos en función del sexo y la edad. Finalmente, se discute la utilidad de tales puntuaciones para evaluar la significación clínica de los resultados de los tratamientos contra la depresión y se efectúa un análisis de la validez de contenido del BDI respecto a los criterios diagnósticos de depresión del DSM-IV (APA, 1994).

This paper provides for the first time normative and reliability data of the Spanish version of Beck's Depression Inventory (BDI). Data were collected from a sample of 445 adults. Reliability estimates were high (Cronbach alpha coefficient = .83). Significant differences were found regarding gender, age and education. First, women scored higher than men. Second, subjects aged over 45 scored higher than younger ones, and people aged over 65 in their turn scored higher than those aged 45 to 64. Third, lowest educated people also scored higher than high school or college education subjects. Norms and centile scores are provided both for the total sample and for gender-defined and age-defined subgroups. Finally, the usefulness of such scores is discussed for the clinical significance of depression therapy results. Also, a BDI content validity is worked out with respect to DSM-IV criteria.

El Inventario para la Depresión de Beck (Beck, Ward, Mendelson, Mock y Erbaugh, 1961; Beck, Rush, Shaw y Emery, 1979), al que a partir de ahora denominaremos BDI por su bien conocido acrónimo (Beck Depression Inventory), es quizás el instrumento de autoinforme más utilizado internacionalmente para cuantificar los síntomas depresivos en poblaciones normales y clínicas (Beck, Steer y Garbin, 1988; Piotrowski, 1996; Steer, Beck y Garrison, 1986; Vázquez, 1995). Asimismo, es sin duda uno de los instrumentos más utilizados para evaluar la efectividad de las terapias farmacológicas o psicológicas para la depresión (Dobson, 1989; Edwards, Lambert, Moran, McCully, Smith y Ellingson, 1984). El BDI cuenta con unas buenas propiedades psicométricas avaladas por una abundante literatura empírica (véase Beck, Steer y Garbin, 1988).

Se olvida con frecuencia que el BDI, en su formato de 21 ítems, cuenta con dos versiones, la de 1961 (Beck et al., 1961) y la de 1978 (Beck et al., 1979). Conde y su grupo de investigación llevaron a cabo la adaptación y validación en la población española de la versión de 1961 (véase Conde, Esteban y Useros, 1976; Conde y Franch, 1984). Sin embargo, no conocemos ningún estudio que haya abordado la adaptación y validación de la versión de 1978, a la que en ocasiones se denomina versión revisada o BDI revisado. Esta versión presenta sustanciales modificaciones respecto a la original de 1961 que aconsejan su empleo frente a esta última. En primer lugar, la versión de 1978 es más manejable en su autoadministración y corrección. En segundo lugar, la versión de 1978 elimina algunas afirmaciones alternativas de determinados ítems y reformula otras para una mayor legibilidad. En total, 15 ítems fueron cambiados en relación a la versión original de 1961. En tercer lugar, en la versión de 1978 se utilizan unas nuevas instrucciones. Mientras en la versión de 1961 se preguntaba por la situación del sujeto en el momento de completar el cuestionario, en la versión revisada se pregunta por su situación “durante la última semana, incluyendo el día de hoy”. Este cambio es muy importante puesto que con las instrucciones de la versión de 1961 se evaluaba una sintomatología depresiva más momentánea, mientras que con las instrucciones de la versión actual de 1978 se evalúan síntomas depresivos más estables y duraderos. De hecho, este marco temporal semanal de la versión de 1978 se aproxima más al contemplado en los criterios diagnósticos de un episodio depresivo mayor en el DSM-IV, es decir, síntomas de una duración mínima de dos semanas (APA, 1994).

Por otro lado, la propia adaptación de Conde et al. de la versión de 1961 presenta algunos inconvenientes adicionales. En primer lugar, las diferentes afirmaciones de cada uno de los ítems no están ordenadas por su gravedad, lo que para Beck constituía un requisito de cara a la legibilidad y validez aparente del instrumento (Beck y cols., 1961). Además, Conde et al. eliminaron estadísticamente dos ítems, Sentimiento de castigo y Pobre imagen corporal, lo que reduce aún más la posibilidad de comparar los resultados obtenidos con esta escala con los publicados en la literatura internacional sobre la depresión.

El objetivo principal del presente estudio es aportar valores normativos y datos sobre la fiabilidad en la población general de la traducción española de la versión del BDI de 1978. El estudio forma parte de un proyecto de investigación más amplio que trata de adaptar y validar esta versión del BDI en la población española (véase Sanz y Vázquez, 1997a,b,c; Vázquez y Sanz, 1997). La obtención de valores normativos y de datos sobre la fiabilidad del BDI en población general permite fundamentar la principal utilización que del BDI están haciendo los profesionales e investigadores españoles interesados en el área de la depresión: su utilización como instrumento para medir la efectividad de las terapias contra la depresión (López-Ibor y López-Ibor, 1986).

El BDI ha sido usado en multitud de estudios para evaluar la respuesta de grupos de pacientes depresivos a los tratamientos contra la depresión o para comprobar qué tratamiento es el más eficaz (véanse los análisis de la literatura de Dobson, 1989; Edwards et al., 1984; Steer, Beck y Garrison, 1986). Habitualmente se administra el BDI antes y después del tratamiento, y una reducción estadísticamente significativa en la puntuación media del BDI se considera, entre otros parámetros, una respuesta positiva al tratamiento. Sin embargo, es obvio que el objetivo de toda intervención terapéutica no es, o no es solamente, alcanzar una mejoría estadísticamente significativa de la problemática media de un grupo de pacientes, sino fundamentalmente alcanzar una mejora clínicamente significativa, es decir, una mejoría de una magnitud clínicamente relevante y con efectos prácticos en la vida de dichos pacientes.

Los investigadores dedicados a estudiar la evaluación de tratamientos han desarrollado diversos criterios para evaluar el grado en que un tratamiento produce una mejoría clínicamente significativa en un grupo de pacientes o para evaluar si un paciente en concreto ha mejorado de forma clínicamente significativa (véase Kazdin, 1992; Sanz, 1997). Un procedimiento muy utilizado es tener en cuenta si la puntuación del paciente al finalizar el tratamiento se aproxima más a la puntuación media de un grupo de referencia “normal” que a la de un grupo que padezca el trastorno en cuestión (Jacobson y Traux, 1991).

Para evaluar este criterio, un procedimiento muy utilizado es examinar si la puntuación postratamiento del paciente es igual o está por debajo de la media o la mediana de las normas de una muestra suficientemente grande y representativa de la población general (Hollon y Flick, 1988), o si se encuentra alrededor de dicha media o mediana situándose al menos en el intervalo de una desviación típica por encima de la media (Kendall y Grove, 1988). A nivel grupal, la eficacia de un tratamiento vendría dada por el porcentaje de pacientes que en el postratamiento obtienen una puntuación igual o inferior a la media (o mediana), o una puntuación en el intervalo de una desviación típica alrededor de dicha media (o mediana). Por consiguiente, la evaluación de este criterio requiere disponer de información sobre la distribución de puntuaciones que se obtienen con el instrumento (medidas de tendencia central y de dispersión) en una población “normal”. Idealmente estos valores normativos se deberían conseguir a partir de una muestra de la población general estratificada, en la medida de lo posible, atendiendo a diversas variables sociodemográficas.

En resumen, con el ánimo de ofrecer a los investigadores y profesionales españoles que trabajan en el área de la depresión una versión española del BDI de 1978 que les sirva para medir la efectividad de los tratamientos contra la depresión, en el presente trabajo se presentan valores normativos y datos de fiabilidad del inventario en una muestra representativa y relativamente numerosa de la población general.

El BDI se administró a una muestra de 445 personas procedentes de una población heterogénea en cuanto a edad, estado civil, profesión y nivel de estudios. Estas personas fueron reclutadas mediante la técnica de la “bola de nieve”, es decir, se pidió a un grupo de estudiantes de tercer curso de Psicología que invitaran a participar en un estudio sobre personalidad y depresión a sus familiares y amigos según unos criterios que aseguraran la estratificación de la muestra en función de la edad y del sexo. A pesar de que una muestra así obtenida no garantiza su aleatoriedad, la estratificación demográfica resultante de los participantes en este estudio se aproximó bastante al perfil demográfico de la Comunidad de Madrid en cuanto a las variables sexo y edad¹. Datos más concretos de las características sociodemográficas de esta muestra aparecen en la Tabla 1.

Quince sujetos, habiendo indicado en el ítem 19 una pérdida de peso, olvidaron indicar si estaban o no bajo dieta de adelgazamiento. En esos casos, al ítem 19 se le asignó un 0 (el valor más frecuente o moda de la muestra en dicho ítem). Igual sustitución fue realizada para tres sujetos que dejaron el ítem 19 sin contestar.

El BDI es un instrumento de 21 ítems en los que se evalúa la intensidad de la depresión. En cada uno de los ítems el sujeto tiene que elegir aquella frase entre un conjunto de cuatro alternativas siempre ordenadas por su gravedad² que mejor se aproxima a su estado durante la última semana incluyendo el día en que completa el inventario. En cuanto a la corrección del instrumento, cada ítem se valora de 0 a 3 puntos en función de la alternativa escogida y, tras sumar directamente la puntuación de cada ítem, se puede obtener una puntuación total que varía de 0 a 63. A veces se da la circunstancia de que el sujeto elige más de una alternativa en un ítem dado. En este caso se elige la puntuación de mayor gravedad. Por otro lado, el ítem sobre Pérdida de Peso (ítem 19) sólo se valora si el sujeto indica no estar bajo dieta para adelgazar. En el caso de que lo esté, se otorga una puntuación de 0 en el ítem.

El primer autor del presente estudio llevó a cabo una nueva traducción de la versión del BDI que aparece recogida en el libro de Beck et al. (1979) puesto que la traduccción publicada en castellano presentaba algunas insuficiencias³. Una copia de esta traducción aparece en el Apéndice. El BDI fue administrado individualmente, junto a otros tres cuestionarios que servían a los objetivos de otras investigaciones (véase Carrillo, Rojo y Staats, 1996), por el alumno que, como parte de sus prácticas, le había invitado a participar en este estudio.

El rango de puntuaciones totales en el BDI estuvo comprendido entre 0 y 39, con una media igual a 7,5 y una desviación típica igual a 6,7. Como viene siendo habitual en otros estudios (Kendall, Hollon, Beck, Hammen e Ingram, 1987), la curva de distribución de puntuaciones en esta muestra de la población general estaba desplazada a la izquierda (índice de simetría igual a 1,4) y apuntada hacia los valores más bajos (curtosis = 2,1), de forma que si bien la mediana no era muy distinta a la media muestral (6 frente a 7,5), el valor más frecuente en la muestra (moda = 3) era notablemente más bajo que dicha media.

Como muestra la Tabla 2, los siguientes ítems recibieron las mayores puntuaciones en frecuencia e intensidad: Irritabilidad, Insomnio, Autoculpa, Fatiga e Insatisfacción. Por el contrario, los síntomas que se mostraban de forma más ligera y con menor frecuencia fueron los que reflejaban los ítems de Autodecepción, Ideas de Suicidio y Pérdida de Peso.

La consistencia interna del BDI hallada en nuestra muestra es elevada (coeficiente alfa = 0,83), una cifra comparable a los coeficientes encontrados en estudios con muestras semejantes (entre 0,73 y 0,93; cf. Beck et al., 1988). Las correlaciones entre las puntuaciones en cada uno de los ítems y la puntuación total corregida en el BDI (es decir, la puntuación total sin tener en cuenta el ítem en cuestión) se presentan en la Tabla 2. Los coeficientes de correlación hallados fueron todos estadísticamente significativos, oscilando entre 0,23 (Autodecepción) y 0,57 (Tristeza). La media de las correlaciones interítems fue 0,20, con un mínimo de 0,00 y un máximo de 0,45.

En la Tabla 3 se presentan los porcentajes de personas que corresponden a las diferentes categorías de gravedad de depresión (Mínima, Leve, Moderada, y Grave) propuestas por Beck en el manual comercializado del inventario (Beck y Steer, 1993) ⁴.

Para determinar si un conjunto específico de síntomas del BDI podría diferenciar los sujetos deprimidos de los no deprimidos, se realizó un análisis discriminante por pasos usando como punto de corte una puntuación de 18 en el BDI. Diversos estudios han mostrado que una puntuación de 18 maximiza la exactitud diagnóstica del BDI en cuanto a su sensibilidad, especificidad, poder de predicción y eficiencia diagnóstica (Rudd y Rajab, 1995; Chan, 1991). Por otro lado, es una puntuación altamente consensuada entre los investigadores para diferenciar entre personas con y sin depresión (véase Kendall et al., 1987).

El análisis discriminante identificó los siguientes ítems como aquellos que mejor discriminaban entre los sujetos deprimidos y no deprimidos: Sentimiento de Castigo, Desinterés por el Sexo, Sentimiento de Fracaso, Pérdida de Apetito, Indecisión, Dificultad Laboral, Tristeza, Pesimismo, Insomnio, Lloro e Irritabilidad. La función discriminante obtenida podía clasificar correctamente el 98,2 % de los sujetos como no deprimidos o deprimidos, según el citado punto de corte del BDI, con un lambda de Wilks igual a 0,43 (c²(11, N = 445)
= 369,97, p < 0,0001).

Un ANOVA sobre la puntuación total en el BDI tomando como variable independiente el sexo de los sujetos, reveló una diferencia estadísticamente significativa entre la puntuación global de ambos sexos [F(1,443) = 12,2, p < 0,0005]. Como se puede ver en la Tabla 3, la media de la puntuación total del BDI de las mujeres era más alta que la de los varones. Es más, un MANOVA realizado sobre las respuestas separadas a los 21 ítems del BDI encontró un efecto significativo de la variable sexo [F(21,423) = 2,66,
p< 0,001]. ANOVAs posteriores señalaron que existían diferencias significativas entre sexos en los siguientes ítems, en los cuales, las mujeres siempre puntúaban más alto que los varones: Tristeza (0,39 frente a 0,18), Pesimismo (0,52 frente a 0,34), Insomnio (0,75 frente a 0,44), Fatiga (0,58 frente a 0,43), Pérdida de Apetito (0,29 frente a 0,18), Desinterés por el Sexo (0,68 frente a 0,26) y Sentimiento de Fracaso (0,24 frente a 0,14).

Un ANOVA 2 x 4 con las variables Sexo y Grupos de edad (18-24 años, 25-44 años, 45-64 años, y más de 65 años) ofreció un efecto significativo tanto para la variable sexo como para la variable edad [F(3, 433) = 18,86,
p < 0,001], pero no para la interacción de ambas variables [F(3, 433) = 1,47, n.s.]. Para analizar el efecto significativo del sexo, se realizaron a posteriori pruebas t con niveles de significación corregidos según el procedimiento de Bonferroni (0,05/6). Estas pruebas se llevaron a cabo bien con la fórmula habitual de varianzas conjuntas o bien con la fórmula de varianzas separadas, en función de si tales varianzas eran iguales o no según la prueba previa de Levene. Las pruebas t revelaron que el grupo de personas mayores de 65 años mostraba niveles de sintomatología depresiva significativamente más altos que todos los grupos de personas de menor edad [t(82,72) = 5,51, respecto al primer grupo de edad; t(80,90) = 5,49, respecto al segundo grupo; y t(85,63) = 2,89, respecto al tercero; todas las significaciones tuvieron una p < 0,008]. Por su parte, el grupo de personas entre 45 y 64 años también mostraba niveles de sintomatología depresiva significativamente más altos que las personas de menor edad [t(209,41) = 4,22 y t(300) = 4,23, para los grupos de edad respectivos, ambos con p < 0,008]. Sin embargo, no existía ninguna diferencia estadísticamente significativa en cuanto al nivel de sintomatología depresiva entre las personas de 18 a 24 años y las personas de 25 a 44 años [t(225) = 0,12, n.s.] -véase la Tabla 4.

En suma, estos análisis revelaron también la existencia de diferencias significativas entre los grupos de edad y, además, dichas diferencias resultaron ser independientes del sexo de los sujetos.

Se analizó la relación entre el estado civil de las personas (soltero; casado o convivencia estable; separado o divorciado, y viudo) con la puntuación total en el BDI (véase la Tabla 4). Los análisis señalaron la presencia de diferencias significativas entre los grupos de personas de distinto estado civil en la puntuación total del BDI [F(3, 437) = 15,44, p < 0,0001]. Las pruebas t realizadas a posteriori con niveles de significación corregidos según el procedimiento de Bonferroni revelaron que el grupo de personas viudas mostraba niveles de sintomatología depresiva significativamente más altos que los grupos de personas solteras o casadas. Ninguna otra comparación entre grupos de distinto estado civil fue estadísticamente significativa.

Sin embargo, es probable que las variables sexo y edad pudieran estar modulando la relación entre estado civil y puntuación total en el BDI. Teniendo en cuenta solamente las condiciones de soltero frente a casado para así conseguir un número suficiente de sujetos, se realizaron dos ANOVAs posteriores. El primero se efectuó con las variables estado civil y sexo. Este ANOVA arrojó un efecto significativo tanto para el sexo como para el estado civil [F(1, 402) = 6,39 y 6,35, respectivamente, ambos con p < 0,01], pero no para la interacción de ambas variables [F(1, 402) = 2,88, n.s.]. Es decir, los casados puntúan más alto en el BDI que los solteros (7,5 frente a 6,1). El segundo ANOVA se efectuó con las variables Estado civil y Grupo de edad. Este segundo ANOVA reveló un efecto significativo sólo para el factor grupo de edad [F(3, 394) = 9,79, p < 0,001], pero no para el factor estado civil o para la interacción de ambos factores [F(1, 394) = 0,38 y F(3, 394) = 1,12, respectivamente, ambos n.s.]. Estos resultados tan contradictorios podrían suponer la existencia de relaciones entre las tres variables, sexo, edad y estado civil, que confundían la posible relación o ausencia de relación entre el estado civil y la puntuación total en el BDI.

Teniendo en cuenta solamente las condiciones de soltero frente a casado y excluyendo las personas de más de 65 años, se realizó un ANOVA con las variables estado civil, sexo y grupo de edad. Este análisis reveló efectos significativos tanto para el sexo como para la edad, pero no para el estado civil [F(1, 355) = 0,11, n.s.] ni para ninguna de las dobles o triples interacciones entre las anteriores variables (todas las Fs n.s.).

En resumen, los resultados de estos análisis parecen señalar que el sexo y la edad son las variables fundamentales a la hora de determinar el nivel de sintomatología depresiva de las personas de la muestra de la población general, y que probablemente la relación del estado civil con dichos niveles de sintomatología depresiva depende de las anteriores variables y no del estado civil per se.

Se analizó la relación entre el nivel de estudios o educación de las personas (Estudios básicos; Formación profesional; Bachillerato, y Universitarios) con la puntuación total en el BDI (véase la Tabla 4). Los análisis efectuados revelaron la existencia de diferencias significativas entre los grupos de estudios en la puntuación total del BDI [F(3, 426) = 12,05,
p< 0,001]. Las pruebas t realizadas a posteriori con niveles de significación corregidos según el procedimiento de Bonferroni revelaron que el grupo con estudios básicos mostraba niveles de sintomatología depresiva significativamente más altos que los grupos con estudios de bachillerato o con estudios universitarios. Ninguna otra comparación entre grupos de estudios fue estadísticamente significativa.

Esta diferencia no estaba modulada ni dependía del sexo. Efectivamente, un ANOVA con las variables sexo y nivel de estudios como variables independientes confirmó los efectos principales antes señalados, pero no encontró un efecto de interacción significativo entre dichas variables [F(3, 422) = 1,91, n.s.]. Tampoco dicha diferencia estaba modulada o dependía de la edad. Un ANOVA con las variables grupos de edad y nivel de estudios como variables independientes confirmó los efectos principales antes señalados, pero no encontró una interacción significativa entre dichas variables [F(9, 410) = 0,69, n.s.].

Se analizó la relación entre el tipo de profesión u ocupación de las personas (Empresarios con asalariados; Empresarios sin asalariados; Directores, gerentes o altos cargos; Técnicos, profesores o mandos intermedios; Trabajadores independientes; Profesionales liberales; Personal administrativo; Obreros cualificados; Obreros no cualificados; Militares; Amas de casa; Desempleados; Jubilados o pensionistas; Estudiantes, y Otros) con la puntuación total en el BDI (véase de nuevo la Tabla 4). Los análisis mostraron diferencias significativas entre los grupos de profesión en la puntuación total del BDI [F(14, 403) = 4,50,
p< 0,001]. Las pruebas t realizadas a posteriori con niveles de significación corregidos según el procedimiento de Bonferroni revelaron que los grupos de amas de casa y jubilados mostraban niveles de sintomatología depresiva significativamente más altos que los profesionales, estudiantes, profesores y obreros cualificados. A su vez, el grupo de jubilados también mostraba niveles de sintomatología depresiva significativamente más altos que los grupos de desempleados, de otras ocupaciones y de personal administrativo. Ninguna otra comparación entre grupos de profesión fue estadísticamente significativa. Debido al escaso número de sujetos que componían cada celdilla cuando se cruzaban las variables sexo y/o edad con la variable profesión (una reducción bastante notoria en muchos casos puesto que no había en esta muestra ningun varón que fuera ama de casa, ni ninguna mujer que fuera militar o empresaria con asalariados), no fue posible analizar si la relación entre el tipo de profesión y la puntuación en el BDI dependía de terceras variables como el sexo o la edad.

En la Tabla 5 se presentan los valores normativos y puntuaciones centiles en el BDI para la muestra total de la población general y para los subgrupos de edad y sexo de la muestra de la población general. La obtención de valores normativos y puntuaciones centiles distintos para estos subgrupos viene determinada por el hallazago de diferencias estadísticamente significativas entre los mismos en cuanto a la puntuación total del BDI. Es verdad que también se han encontrado diferencias en relación al nivel de estudios o la profesión, pero tales diferencias no están tan bien documentadas en la literatura y deben ponerse en relación con otros indicadores socioeducativos y socioeconómicos. Por el contrario, la relación entre depresión y las anteriores variables (edad y sexo) está mucho mejor documentada (Vázquez y Sanz, 1991, 1995; Vázquez y Lozoya, 1994).

En cualquier caso, los datos presentados en la Tabla 5 deben alertar a los investigadores y profesionales sobre el empleo rutinario de categorías de gravedad de depresión a partir de puntos de cortes en el BDI obtenidos en otras culturas o con grupos de personas de otro sexo o edad. Por ejemplo, si en la literatura empírica se ha recomendado una puntuación de corte de 10 para identificar a las personas depresivas y no depresivas (Kendall et al., 1987), una puntuación que coincide más o menos con una desviación típica por encima de la media de las muestras estadounidenses, parece claro que en muestras españolas tales puntos de corte variarán sustancialmente dependiendo de si los sujetos proceden de la población universitaria (en este caso el punto de corte es de 11; véase Sanz y Vázquez, 1997a) o de si procede de la población general, y en este último supuesto dependerá de su edad o sexo (en el caso de un sujeto entre 45 y 64 años el punto de corte estaría en 14). Reflexiones parecidas se pueden realizar respecto a cuando un paciente depresivo bajo tratamiento psicológico o farmacológico ha mejorado significativamente. Por ejemplo, basándose en las normas estadounidenses, Kendall y Grove (1988) consideran que un paciente ha mejorado significativamente cuando su puntuación total en el BDI se encuentra en el intervalo de una desviación típica alrededor de la media, es decir, cuando su puntuación baja de 10. Sin embargo, este punto de corte parece muy exigente para un paciente español entre 45 y 64 años, ya que en su caso, a tenor de los valores normativos aquí expuestos, un funcionamiento “normal” para su medio cultural vendrían indicado por una puntuación en el BDI menor de 14.

El BDI se construyó con la intención de reflejar el consenso clínico sobre aquellas actitudes y síntomas que frecuentemente presentan los pacientes psiquiátricos con depresión y de forma infrecuente se encuentran en pacientes psiquiátricos sin depresión (Beck et al., 1961). A pesar de que han aparecido algunos desarrollos importantes en la forma de entender la depresión durante los 30 años que han pasado desde su construcción, el BDI sigue reflejando de manera adecuada las principales características de la depresión tal y como es entendida de forma consensuada hoy en día en sistemas como el DSM-IV (APA, 1994). Como puede observarse en la Tabla 6, el BDI cubre seis de los nueve criterios sintomatológicos (Criterio A) propuestos por el DSM-IV para el diagnóstico de un episodio depresivo mayor y, aunque parcialmente, también refleja dos de los tres criterios restantes. Estas últimas deficiencias parciales tiene que ver con la ausencia de ítems que describan “síntomas por exceso” (esencialmente aumento de peso/apetito e hipersomnia), de forma que el BDI sólo evalúa síntomas depresivos deficitarios (pérdida de peso/apetito e insomnio). Por otro lado, existe un criterio sintomatológico que queda sin cubrir en el BDI: los cambios psicomotores bien por exceso (agitación psicomotora) o por defecto (enlentecimiento psicomotor). Aunque las dificultades para hacer cosas y las interferencias en el trabajo recogidas por el ítem de Dificultad Laboral podrían indicar la presencia de cambios psicomotores, en concreto, de retardo psicomotor, nos parece que ese ítem parece cubrir más bien el criterio de gravedad o deterioro (Criterio C) propuesto por el DSM-IV para el diagnóstico de un episodio depresivo mayor: malestar clínicamente significativo o algún tipo de deterioro en el área social, laboral o en cualquier otra área importante de funcionamiento.

El BDI se distingue en cuanto al contenido por evaluar sobre todo características cognitivas: aproximadamente 2/3 de sus ítems tienen un contenido cognitivo, mientras que sólo el 32% de sus ítems evalúan aspectos somáticos o conductuales, frente al 50% de la Escala para la Valoración de la Depresión de Hamilton (1960) o de la Escala Autoaplicada de la Depresión de Zung (1965), por ejemplo (véase los análisis comparativos efectuados por Vázquez, 1995). Ahora bien, la evaluación cognitiva del BDI es algo parcial. Se dedica una especial atención hacia los síntomas de culpa, las atribuciones causales personales, etc., mientras que se echa de menos información sobre dificultades en el rendimiento intelectual (atención, memoria, concentración, etc.). La información sobre estas últimas se reduce a un único ítem: dificultad para tomar decisiones (Indecisión) y, de modo algo más indirecto, dificultades para hacer las cosas (Dificultad Laboral), el cual hemos incluido en la Tabla 6 más como indicativo del grado de deterioro laboral debido al síndrome depresivo.

1. La consistencia interna de la versión española del BDI de 1978 es buena y se asemeja a la hallada en otros ámbitos culturales con muestras también extraídas de la población general.

2. La alta consistencia interna del BDI indica que en muestras de la población general el BDI parece medir un síndrome de depresión general de síntomas intercorrelacionados.

3. Las mujeres presentaban puntuaciones más altas en el total del BDI y en algunos de sus ítems, unas diferencias que pueden tener que ver con diferencias entre sexos en cuanto al nivel de estudios, roles, actividades, profesiones, etc. De hecho, variables como el nivel de estudios y el tipo de profesión afectaban a las puntuaciones halladas en el BDI.

4. El BDI cubre aceptablemente el espectro de síntomas incluidos como criterios sintomatológicos del “episodio depresivo mayor” en el DSM-IV (en concreto cubre ocho de los nueve síntomas propuestos), así como, parcialmente, el criterio de deterioro en el funcionamiento, lo que hace lógica la elección de este instrumento para evaluar cuantitativamente a pacientes diagnosticados con tales criterios o para seleccionar sujetos que pudieran servir de análogos de tales pacientes. Sin embargo, ya que su contenido está muy centrado en los aspectos cognitivos de la depresión, es recomendable emplear otros instrumentos simultáneamente para recabar información complementaria del sujeto (Vredenburg et al., 1993), especialmente en relación a los síntomas somáticos. Así, por ejemplo, se podría emplear la Escala para la Valoración de la Depresión de Hamilton o, si se prefiere un instrumento autoaplicado, no heteroaplicado como el anterior, se podría emplear la Escala Autoaplicada para la Depresión de Zung (ambas adaptadas al español por el grupo de investigación de Conde; véase Conde y Franch, 1984). El lector también puede consultar otras opciones de medida en Vázquez (1995; en prensa, a) o en Comeche, Díaz y Vallejo (1995).

Obviamente, el hecho de que el BDI cubra razonablemente el espectro de síntomas que definen un episodio depresivo mayor (DSM-IV, APA 1994) no justifica nunca su uso como instrumento diagnóstico de un «Trastorno depresivo» de acuerdo a los sistemas de clasificación comúnmente utilizados (Vázquez, 1986). El BDI sirve exclusivamente para identificar síntomas y cuantificar su intensidad, lo que obviamente es muy importante para evaluar, por ejemplo, la efectividad de un proceso terapéutico y valorar el estado del paciente. Sin embargo, el diagnóstico categorial o formal de un trastorno depresivo se efectúa teniendo en cuenta no sólo el tipo y número de síntomas presentes sino la ausencia de otros cuadros clínicos potencialmente presentes (p. ej., esquizofrenia, intoxicación por drogas, etc.), la duración de los síntomas, determinadas combinaciones de presencia/ausencia de síntomas, etc.

5. En suma, la versión española del BDI de 1978 parece tener propiedades psicométricas aceptables que recomiendan incialmente su uso como instrumento de cuantificación de la sintomatología depresiva.

6. Finalmente, las normas aquí presentadas pueden servir para evaluar la eficacia de los tratamientos psicológicos o farmacológicos contra la depresión. Los profesionales que trabajen con adultos pueden evaluar de forma razonable la significación clínica de la mejoría del paciente en términos, por ejemplo, de si el paciente ha alcanzado al final del tratamiento la media o la mediana de las normas propuestas en este estudio o, si se prefiere un criterio menos exigente, una desviación típica por encima de la media. De hecho, este último criterio es el más consensuado internacionalmente (Kendall et al., 1987; Kendall y Grove, 1988; véase Sanz, 1997, para una discusión más detallada de la evaluación de la significación clínica). Igualmente, los investigadores que trabajen con muestras de adultos pueden evaluar de manera razonable la significación clínica de sus hallazgos en términos, por ejemplo, de la proporción de pacientes que han alcanzado al final del tratamiento los criterios anteriormente propuestos.

No obstante, hay que advertir que en este estudio se utilizó una muestra de conveniencia y que no sabemos si se asemeja a la población de la Comunidad de Madrid en otras variables demográficas aparte del sexo y la edad y si, en todo caso, se asemeja a la población de otras comunidades de España. Es posible que en otros ámbitos como, por ejemplo, comunidades rurales, las tasas de sintomatología depresiva y ansiosa sean desproporcionadamente elevadas (Vázquez Barquero et al., 1987). Una manera de evaluar la representatividad de la muestra es comprobar si se replican los hallazgos encontrados en este estudio con otras muestras procedentes de otras poblaciones españolas.

Suponiendo que se quieran utilizar estas normas, una cuestión ulterior es qué normas utilizar: las de la muestra de la población general o las de los diferentes subgrupos de dicha muestra. Una recomendación muy habitual es que los individuos se deben comparar con su propio subgrupo demográfico cuando las puntuaciones de los subgrupos difieren. Sin embargo, este asunto no está tan claro. Como señalan Hayes y Haas (1988), una primera dificultad es decidir qué subgrupo, o qué combinación de subgrupos, es relevante para la comparación puesto que cada persona pertenece simultáneamente a múltiples subgrupos (sexo, edad, nivel de estudios, profesión, status socioeconómico, etc.). Incluso si uno tiene idea de qué subgrupo es el más relevante, cabe la posibilidad de que los efectos del tratamiento se juzguen mejor en referencia a las normas de otros subgrupos (Gillis, Haaga y Ford, 1995). Por ejemplo, en nuestros datos el grupo de las personas con estudios básicos puntuó más alto en depresión que los demás grupos. Sin embargo, teniendo en cuenta la posibilidad de que la depresión puede entorpecer el rendimiento académico, pudiera ser preferible utilizar como criterios de mejora las normas de la población general en su conjunto en vez de los criterios más “indulgentes” de las normas del grupo de personas con estudios básicos en el caso de un paciente con estudios básicos que se encuentre cursando estudios conducentes a otro nivel académico.

Los autores agradecen a los profesores Jesús Carrillo Esteban y Nieves Rojo Mora el permiso para utilizar sus datos sobre el BDI.

La correspondencia en relación a este artículo debe dirigirse a Carmelo Vázquez o a Jesús Sanz, Departamento de Personalidad, Evaluación y Psicología Clínica, Universidad Complutense de Madrid, Campus de Somosaguas, 28223 Madrid, o, mediante correo electrónico, a cvazquez@PSI.UCM.ES o jsanz@PSI.ucm.es.

¹ Así, en la Comunidad de Madrid los porcentajes para los grupos de edad entre los 20 y 24 años, 25 y 44 años, 45 y 64 años y más de 65 años, son, respectivamente, para los varones 12,9%, 42,47%, 30,8% y 13,6%, y para las mujeres, 11,1%, 39,7%, 30,2% y 19,0% (Consejería de Economía, 1994). En la muestra de la población general de este estudio los porcentajes correspondientes fueron, para los varones, 15,8%, 37,6%, 36,7% y 10%, y para las mujeres, 15,9%, 35,3%, 33,8% y 15%, porcentajes semejantes a los anteriores.

² Sin embargo, algunos estudios sugieren que la presentación aleatoria de las distintas afirmaciones de gravedad dentro de cada ítem puede tener la ventaja de romper posibles sesgos de respuestas tendentes a escoger la primera afirmación o la última. De este modo se aseguraría que los sujetos prestan atención a todas las afirmaciones de cada ítem del BDI y permitiría obtener un rango mejor de puntuaciones (Dahlstrom, Brooks y Peterson, 1990).

³ En la traducción española de este libro (Terapia cognitiva de la depresión, Bilbao: DDB, 1983) se puede encontrar una traducción de la versión de 1978 del BDI (traducción que también aparece en Bas y Andrés, 1994). Aunque, obviamente, dicha traducción es muy similar a la empleada en este estudio (véase el Apéndice), sin embargo, presenta algunas diferencias. En este sentido, es de destacar la desafortunada traducción del ítem 20 en el cual el término inglés «constipation» fue traducido como «catarro», cuando en realidad significa «estreñimiento». Asimismo, la afirmación de la máxima gravedad del ítem de lloro tiene en esa traducción un significado totalmente contrario al sentido que tiene el original en inglés.

Se pueden encontrar otras traducciones al español del BDI de 1978. Por ejemplo, en la traducción de libro del Burns (1980) y en el compendio de escalas de Conde y Franch (1984), apare-

cen traducciones que tienen el serio inconveniente de no incluir en el ítem 19 la afirmación que pregunta al sujeto si está o no bajo dieta para adelgazar y, por tanto, no permiten dilucidar el significado clínico de la presencia de pérdida de peso (inconveniente que también presenta la versión original inglesa del libro de Burns, 1980). Recientemente, Comeche, Díaz y Vallejo (1995) han recogido en un compendio de cuestionarios y escalas otra traducción española del BDI de 1978. Esta traducción también presenta ligeras variaciones en la traducción de las afirmaciones respecto a la traducción propuesta por nosotros. La diferencia más notable, no obstante, reside en la inclusión de una afirmación más en el ítem 6, de forma que éste cuenta con 5 afirmaciones en lugar de 4 como el resto de los ítems del inventario. En concreto, la afirmación adicional del ítem 6 reza “Quiero que me castiguen”, es valorada con un 3 y desgraciadamente los autores del libro no dan explicación alguna de su inclusión, aunque cabe la posibilidad de que sea simplemente un error tipográfico. En cualquier caso, el inconveniente más grave de todas estas traducciones es que no sabemos cuáles son sus propiedades psicométricas en la población española.

American Psychiatric Association. (1994). Diagnostic and statistical manual of mental disorders (4º ed.). Washington, DC: APA.

Beck, A.T. y Steer, R.A. (1993). Beck Depression Inventory. Manual. San Antonio, TX: The Psychological Corporation.

Beck, A.T., Rush, A.J., Shaw, B.F. y Emery, G. (1979). Cognitive therapy of depression. New York: Guilford Press (Trad. esp. en Bilbao: Desclée de Brower, 1983).

Beck, A.T., Steer, R.A. y Garbin, M.C. (1988). Psychometric properties of the Beck Depression Inventory: Twenty-five years of evaluation. Clinical Psychology Review, 8, 77-100.

Beck, A.T., Ward, C.H., Mendelson, M., Mock, J. y Erbaugh, J. (1961). An inventory for measuring depression. Archives of General Psychiatry, 4, 561-571.

Carrillo, J.M., Rojo, N. y Staats, A.W. (1996). Vulnerable personality in depression: Investigating commonality in the search for unification. European Journal of Psychological Assessment, 12, 202-211.

Comeche, M.I., Díaz, M.I. y Vallejo, M.A. (1995). Cuestionarios, inventarios y escalas. Ansiedad, depresión y habilidades sociales. Madrid: Fundación Univesidad-Empresa.

Conde, V. y Franch, J.I. (1984). Escalas de evaluación comportamental para la cuantificación de la sintomatología psicopatológica en los trastornos angustiosos y depresivos. Madrid: Upjohn Farmaquímica.

Conde, V., Esteban, T. y Useros, E. (1976). Revisión crítica de la adaptación castellana del Cuestionario de Beck. Revista de Psicología General y Aplicada, 31, 469-497.

Consejería de Economía (1994). Anuario estadístico 1993. Vol. 1. Comunidad de Madrid. Madrid: Consejería de Economía de la Comunidad Autónoma de Madrid.

Chan, D. W.(1991). The Beck Depression Inventory: What difference does the Chinese version make? Psychological Assessment, 3, 616-622.

Dahlstrom, W.G., Brooks, J.D. y Peterson, C.D. (1990). The Beck Depression Inventory: Item order and the impact of response set. Journal of Personality Assessment, 55, 224-233.

Edwards, B.C., Lambert, M.J., Moran, P.W., McCully, T., Smith, K.C. y Ellingson, A.G. (1984). A meta-analytic comparison of the Beck Depression Inventory and the Hamilton Rating Scale for Depression as measures of treatment outcome. British Journal of Clinical Psychology, 23, 93-99.

Gillis, M.M., Haaga, D.A. y Ford, G.T. (1995). Normative values for the Beck Anxiety Inventory, Fear Questionnaire, Penn State Worry Questionnaire, and Social Phobia and Anxiety Inventory. Psychological Assessment, 7, 450-455.

Hamilton, M. (1960). A rating scale for depression. Journal of Neurology, Neurosurgery, and Psychiatry, 23, 56-62.

Hayes, S.C. y Haas, J.R. (1988). A reevaluation of the concept of clinical significance: Goals, methods, and methodology. Behavioral Assessment, 10, 189-196.

Hollon, S.D. y Flick, S.N. (1988). On the meaning and methods of clinical significance. Behavioral Assessment, 10, 197-206.

Jacobson, N.S. y Truax, P. (1991). Clinical significance: A statistical approach to defining meaningful change in psychotherapy research. Journal of Consulting and Clinical Psychology, 59, 12-19.

Kendall, P.C, Hollon, S.D., Beck, A.T., Hammen, C.L. e Ingram, R.E. (1987). Issues and recommendations regarding use of the Beck Depression Inventory. Cognitive Therapy and Reseach, 11, 289-299.

Kendall, P.C. y Grove, W.M. (1988). Normative comparisons in therapy outcome. Behavioral Assessment, 10, 147-158.

López-Ibor, J.J. y López-Ibor, J.M. (1986). Standardized instruments for the evaluation of affective disturbances in Spain and Spanish-speaking countries. En N. Sartorius y T.A. Ban (Eds.), Assessment of depression (pp. 19-22). Berlín: Springer-Verlag.

Piotrowski, C. (1996). Use of the Beck Depression Inventory in clinical practice. Psychological Reports, 79, 873-874.

Rudd, M.D. y Rajab, M.H. (1995). Specificity of the Beck Depression Inventory and the confounding role of comorbid disorders in a clinical sample. Cognitive Therapy and Research, 19, 51-68.

Sanz, J. (1997). ¿Cómo medir la efectividad de los tratamientos para la depresión? Manuscrito bajo revisión editorial.

Sanz, J. y Vázquez, C. (1997a). El Inventario para la Depresión de Beck (BDI) como instrumento para identificar sujetos deprimidos y no deprimidos en la investigación psicopatológica: Fiabilidad, validez y datos normativos en muestras universitarias. Manuscrito bajo revisión editorial.

Sanz, J. y Vázquez, C. (1997b). El Inventario para la Depresión de Beck (BDI) como instrumento para identificar sujetos deprimidos y no deprimidos en la investigación psicopatológica:. Criterios de selección en muestras universitarias. Manuscrito bajo revisión editorial.

Sanz, J. y Vázquez, C. (1997c). Factor structure of the Beck Depression Inventory in clinical and non-clinical samples. Manuscrito en preparación.

Steer, R.A., Beck, A.T. y Garrison, B. (1986). Applications of the Beck Depression Inventory. En N. Sartorius y T.A. Ban (Eds.), Assessment of depression (pp. 121-142). Berlín: Springer-Verlag.

Vázquez, C. (1986). Escalas evaluadoras de la depresión: Limitaciones conceptuales y metodológicas. Revista de Psicología General y Aplicada, 41, 101-113.

Vázquez, C. (1995). Evaluación de los trastornos depresivos y bipolares. En A. Roa (Ed.), Evaluación en psicología clínica y de la salud (pp. 163-209). Madrid: CEPE.

Vázquez, C. (en prensa, a). Instrumentos diagnósticos y de valoración de la depresión y la manía. En A. Bulbena, G. Berrios y J. Guimón (Eds.), Medición en Psiquiatría. Barcelona: Salvat.

Vázquez, C. y Lozoya, G. (1994). Evaluación y diagnóstico diferencial de los trastornos depresivos en personas de edad. En J. Buendía (Ed.), Envejecimiento y psicología de la salud (pp. 247-278). Madrid: Siglo XXI.

Vázquez, C. y Sanz, J. (1991). Trastornos depresivos (I): Datos clínicos y modelos teóricos. En A. Belloch y E. Ibáñez (Eds.), Manual de Psicopatología, vol. 2 (pp. 717-784). Valencia: Promolibro.

Vázquez, C. y Sanz, J. (1995). Trastornos del estado de ánimo: Aspectos clínicos. En A. Belloch, B. Sandín y F. Ramos (Eds.), Manual de Psicopatología, vol. 2 (pp. 299-340). Madrid: McGraw-Hill.

Vázquez, C. y Sanz, J. (1997). Fiabilidad y validez de la versión española del Inventario para la Depresión de Beck de 1978 en pacientes con trastornos psicológicos. Manuscrito bajo revisión editorial.

Vázquez-Barquero, J.L., Diez, J.F., Peña, C., et al. (1987). A community mental health survey in Cantabria: a general description of morbidity. Psychological Medicine, 17, 227-241.

Vredenburg, K., Flett, G.L. y Krames, L. (1993). Analogue versus clinical depression: A critical reappraisal. Psychological Bulletin, 113, 327-344.

Zung, W.W.K. (1965). A self-rating depression scale. Archives of General Psychiatry, 12, 63-70.