Pedro José Horcajo-Gila,b, Víctor Dujo-Lópeza,b, José Manuel Andreu-Rodríguezb y Marta Marín-Rullána
aPsicólogos forenses, ámbito privado, España; bUniversidad Complutense de Madrid, España
Recibido a 25 de Febrero de 2018, Aceptado a 26 de Agosto de 2018
Resumen
Se conceptualizan las distintas aproximaciones teóricas y metodológicas sobre valoración y gestión del riesgo de reincidencia delictiva en menores infractores. Se realiza una revisión sistemática de los instrumentos empleados con mayor frecuencia para valorar y gestionar el riesgo de reincidencia. Se emplean las bases de datos bibliográficos PsycINFO y Google Académico. Se seleccionan aquellos instrumentos cuyas puntuaciones presentan adecuados niveles de validez predictiva y aquellos cuyas características resultan relevantes por su idiosincrasia. Se localizan quince instrumentos: tres escalas actuariales (JSORRAT-II, Static-99 y PCL:YV) y doce instrumentos clínico-estructurados (YLS/CMI, SAVRY, SIED-AJ, EARL-20B, EARL-21G, J-SOAP-II, ERASOR 2.0, MEGA, Asset, ARMIDILO-S, DASH-13 y PREVI-A). Existe una gran variabilidad en los resultados en cuanto a validez predictiva cuando se comparan diferentes estudios realizados con un mismo instrumento. La adecuación de un instrumento al contexto judicial debe basarse en resultados de valores de validez predictiva (AUC) a partir de .70-.75.
Abstract
Both theoretical and methodological approaches were gathered based on the risk assessment and management of criminal recidivism among young offenders. A systematic review of the instruments most often used to assess and manage the risk of recidivism was carried out. PsycINFO and Google Scholar were used as s. The instruments chosen were based on adequate levels of predictive validity and those whose aspects were relevant. Fifteen instruments were found: three actuarial scales –JSORRAT-II, Static-99, and PCL-YV– and twelve structured clinical judgment measures –YLS/CMI, SAVRY, SIED-AJ, EARL-20B, EARL-21G, J-SOAP-II, ERASOR 2.0, MEGA, Asset, ARMIDILO-S, DASH-13, and PREVI-A. There is a great variability in the results found in terms of predictive validity when different studies with the same tool are compared. The adequacy of an instrument to the judicial context must be based on values of predictive validity (AUC) between .70-.75.
Palabras clave
Valoración del riesgo, Justicia juvenil, Violencia, Conducta antisocial, Menores infractores.
Keywords
Risk assessment, Juvenile justice, Violence, Antisocial behavior, Minor offenders.
Para citar este artículo: Horcajo-Gil, P. J., Dujo-López, V., Andreu-Rodríguez, J. M. y Marín-Rullán, M. (2019). Valoración y gestión del riesgo de reincidencia delictiva en menores infractores: una revisión de instrumentos. Anuario de Psicología Jurídica, 29, 41-53. https://doi.org/10.5093/apj2018a15
Correspondencia: pedrojosehorcajo@psicologia-forense-madrid.es (P. J. Horcajo-Gil).
Introducción En los últimos 15 años se han desarrollado nuevas técnicas para predecir la conducta violenta basadas en tres elementos: a) un mejor conocimiento de la naturaleza y procesos relacionados con la violencia, b) la sustitución del término peligrosidad (atributo disposicional, estático y dicotómico) por riesgo de violencia y c) el desarrollo de protocolos e instrumentos de uso profesional para la valoración del riesgo de violencia. Esto conduce a un cambio de paradigma, sustituyendo la estimación de la peligrosidad por la valoración (probabilística) del riesgo de reincidencia delictiva, a partir de los nuevos conocimientos sobre los procesos relacionados con la violencia fruto de la investigación empírica. En este nuevo paradigma se tienen en cuenta los factores de riesgo específicos en función del tipo de reincidencia (Andrés-Pueyo y Echeburúa, 2010; Andrés-Pueyo y Redondo, 2007). Según el DRAE (Real Academia Española. 2001), en su segunda acepción, reincidencia es definido como: “circunstancia agravante de la responsabilidad criminal, que consiste en haber sido el reo condenado antes por un delito análogo al que se le imputa”. Las tasas de reincidencia delictiva hacen alusión a los expedientes abiertos en un momento temporal concreto. La “reincidencia” se diferencia de la “reiteración” delictiva en que esta última consiste en el número de expedientes que el menor ha acumulado durante toda su trayectoria en los Juzgados de Menores (Cuervo y Villanueva, 2013). Puede medirse la reincidencia mediante los expedientes judiciales, mediante datos de denuncias policiales y también en base a los delitos y/o infracciones cometidos dentro de prisión (o centros tutelares). La metodología “ideal” sería aquella que midiera la reincidencia de manera prospectiva, pero en la mayoría de las ocasiones es medida retrospectivamente, es decir, a partir de una evaluación y/o un expediente ya registrado. A la hora de abordar la evaluación de los menores infractores debemos contar con un arsenal adecuado de pruebas que arrojen perspectiva acerca de todas las variables intervinientes en el proceso de evaluación forense, tanto para la valoración del riesgo de reincidencia violenta como para una evaluación más general o especifica de rasgos de personalidad (Wenger y Andrés-Pueyo, 2016). Parte de esta evaluación en el contexto de la justicia juvenil pasa por entender el desarrollo, génesis y abordaje de todas las variables asociadas a la delincuencia juvenil, y más ante un cambio de paradigma que pasa de un modelo tutelar a otro de naturaleza educativa y reparadora (Mampaso, Pérez-Fernández, Corbí, González y Bernabé, 2014). Este cambio supone que el origen de la delincuencia ya no es unicausal, si no que se traslada a un enfoque multicausal en el que cobran especial importancia tanto los factores de riesgo como los de protección, tanto de carácter ambiental como individual, siendo la concurrencia e interacción de dichos factores lo que nos permitirá abordar el delito en términos de probabilidad, pero no de determinación (Mampaso et al., 2014). Los factores de riesgo son características mensurables de los menores que se relacionan de manera significativa con el incremento de la probabilidad de que los jóvenes se involucren en conductas delictivas. Se dividen en estáticos y dinámicos (Andrews y Bonta, 2010). Los primeros son aquellas variables históricas difíciles o imposibles de modificar (p. ej., el historial delictivo) (Andrews y Bonta, 2010). Los segundos, también denominados necesidades criminógenas, son características del menor que pueden ser objeto de modificación (p. ej., las habilidades sociales) (Andrews y Bonta, 2010; Redondo y Andrés-Pueyo, 2007; Vilariño, Amado y Alves, 2013). La intervención en las necesidades criminógenas también se asocia a la disminución de las conductas infractoras (Hoge, Vincent, Guy y Redondo, 2015). Además, los factores de riesgo pueden ser clasificados en individuales (p. ej., impulsividad, ausencia de remordimientos) y contextuales (p. ej., asociación con pares implicados en la delincuencia) (Aguilar y Godoy, 2013; Cuervo, Villanueva, González, Carrión y Busquets, 2015; Rutter, Giller y Hagell, 1998). Igual de importante es tener en cuenta los factores de protección, es decir, aquellas situaciones o características que amortiguan los efectos pro-delictivos de los factores de riesgo citados. En el estudio de los factores de protección cobra especial importancia el nivel psicomadurativo del menor asociado tanto a la socialización como a variables individuales, debido a que el peso de los factores de riesgo (en especial los dinámicos o necesidades criminógenas) y de protección varía a lo largo del desarrollo del individuo (Hoge et al., 2015). Los factores de protección están muy asociados a la resiliencia, al inhibir o reducir la probabilidad del mantenimiento de las conductas problemáticas, lo que hace que ante dos menores con las mismas tensiones o factores de riesgo uno de ellos no desarrolle conductas infractoras, teniendo dicho enfoque un gran valor en materia de prevención primaria, secundaria y terciaria. Dentro de los factores de protección destaca la familia (Contreras, Molina y Cano, 2011), ya que una buena actitud y el apoyo familiar contribuyen al desarrollo de conductas prosociales y adaptadas a las exigencias del entorno (Amezcua, Pichardo y Fernández, 2002). Una alta inteligencia, buenas habilidades sociales, locus de control interno y temperamento resiliente, junto con la afectividad, el apoyo emocional y la interiorización adecuada de normas, constituyen factores de protección que disminuyen la vulnerabilidad y potencian la resistencia al daño (Howell 1997). Tradicionalmente, el estudio de la conducta infractora en menores se centra en el abordaje de los factores de riesgo y los factores de protección, no prestando demasiada atención a variables criminológicas, como aquellas relacionadas con las tipologías de delitos y su relación con perfiles específicos de infractores (Cuervo et al., 2015). Históricamente, los delitos contra las personas se asocian a factores de riesgo de carácter personal, como la falta de empatía, la falta de control de la ira, la insensibilidad o, en general, los rasgos asociados a la órbita de la psicopatía (Aguilar y Godoy, 2013; Barudy, 2000; Contreras et al., 2011; DeLisi et al., 2010; Vilariño et al., 2013), mientras que los delitos contra la propiedad se asocian a variables sociodemográficas y a etiología ambiental como estilos educativos inconsistentes (Kelly, Macy y Mears, 2005). Los datos con los que se cuenta ponen de relieve que el número de delitos se incrementan con los años, es decir, según los menores infractores se acercan al umbral legal de la mayoría de edad, dándose este fenómeno tanto en los delitos contra las personas como contra la propiedad (Cuervo et al., 2015). En cuanto al género, los hombres cometen un mayor número de crímenes, englobando todas las tipologías (Instituto Nacional de Estadística, 2011). En el estudio de Cuervo et al. (2015), en el que evalúan a 395 menores infractores, los autores encuentran que las mujeres cometen más delitos contra las personas que contra la propiedad (un 62.2% frente a un 37.8%), frente a una distribución más equilibrada en varones (48.9% para delitos contra las personas y 51.1 % contra la propiedad). Cuervo et al. (2015) no encuentran relación estadísticamente significativa entre la edad de los infractores y el tipo de delito cometido. En cuanto a la procedencia, los datos ponen de relieve que en el caso de menores infractores españoles la distribución entre delitos contra la propiedad y contra las personas son similares, equilibrio que desaparece en población foránea. Los delitos contra las personas son más frecuentes en menores de nacionalidades latinoamericanas (71%) y africanas (60%), mientras que los delitos contra la propiedad se dan más en población procedente de Europa del Este (72.2%) (Iborra, Rodríguez, Serrano y Martínez, 2011). En el caso de la población procedente del este de Europa, a menudo existe una mediación de mafias que instrumentalizan con una finalidad criminal. Aunque tradicionalmente los estudios indican que hay mayor reincidencia en delitos contra la propiedad, los resultados del estudio de Cuervo et al. (2015) indican que no hay diferencias significativas entre el tipo de delito y la reincidencia, en consonancia con otros estudios anteriores (Cuervo y Villanueva, 2013; García-España, García, Benítez y Pérez, 2011). La evolución de las metodologías de valoración del riesgo se desarrolla en cuatro generaciones (para una descripción en 5 periodos, véase Esbec y Fernández, 2003), la primera de las cuales (1G) se basa en el juicio profesional no estructurado (JPNE) del evaluador en contextos forenses (Andrews, Bonta y Wormith, 2006; Hanson, 2009). Debido a carencias metodológicas de la primera generación por la falta de estructuración y de rigor científico en la toma de decisiones (Andrés-Pueyo y Echeburúa, 2010), se desarrollan los instrumentos de segunda generación (2G), basados en escalas actuariales, esto es, fórmulas estadísticas que estiman probabilísticamente el riesgo de reincidencia a partir de un algoritmo que proporciona una puntuación global. Las escalas actuariales incorporan factores de riesgo estáticos y dinámicos, proporcionando puntos de corte y baremos. Estos instrumentos de 2G se sustentan en la evidencia empírica y en el rigor estadístico, dando protagonismo a los factores de riesgo de mayor validez predictiva (Andrews et al., 2006; Schwalbe, 2007). La principal ventaja del método actuarial es que elimina la subjetividad, pero en cambio el principal inconveniente es que simplifica en exceso el complejo proceso de toma decisional del ser humano, además de que no tiene en cuenta la gran heterogeneidad existente entre los distintos individuos que forman un grupo (Muñoz-Vicente y López-Ossorio, 2016). Dejando atrás esta segunda generación, la era moderna de los instrumentos de valoración del riesgo tiene su núcleo en el desarrollo del constructo psicopatía, de Robert D. Hare, siendo la PCL-R (Hare, 2003) para adultos y la PCL:YV (Forth, Kosson y Hare, 2003) para menores las piedras angulares de la predicción de la reincidencia delictiva, en especial del tipo violento. A partir de esta base se desarrollan los instrumentos de tercera generación (3G), que incorporan los factores de riesgo dinámicos (Andrews, Bonta y Wormith, 2011), siendo el buque insignia de esta etapa el Level of Service Inventory-Revised (LSI-R; Andrews y Bonta, 1995). Como último eslabón se encuentran los instrumentos de cuarta generación (4G), o “última generación”, en la que se destaca el desarrollo de instrumentos específicos para evaluar la probabilidad de reincidencia en menores y poder determinar posteriormente los objetivos de intervención más apropiados a cada caso, incluyendo factores de riesgo y de protección específicos en menores (Garrido, López y Galvis, 2017). Dado que el número de instrumentos que miden factores de riesgo (y de protección) en menores es significativamente inferior a sus homólogos para adultos, el objetivo de este trabajo es doble: 1) revisar la literatura sobre valoración y gestión del riesgo en menores infractores –tanto en el contexto nacional como en el internacional– y 2) explorar estudios sobre los principales instrumentos específicos en valoración de menores, incluyendo revisiones (meta-analíticas y cualitativas), con la finalidad de examinar tanto las características básicas de los mismos como la validez predictiva de sus puntuaciones sobre la reincidencia delictiva. MétodoProcedimiento Para conseguir los objetivos señalados, en primer lugar se realizó una revisión bibliográfica para conceptualizar la evolución en las metodologías e instrumentos utilizados en la valoración y gestión del riesgo. En segundo lugar se seleccionaron los acrónimos de los instrumentos que más aparecieron en las búsquedas preliminares y se realizaron búsquedas en las bases de datos descritas a continuación (véase el apartado de Estrategias de Búsqueda). Por último se seleccionaron los instrumentos en los que se halló evidencia empírica sólida acerca de la validez predictiva de sus puntuaciones sobre la reincidencia delictiva y se analizaron las características más importantes de dichos instrumentos. Asimismo se incluyeron instrumentos en fases experimentales o de reciente creación, debido a la relevancia de los mismos, inherente a sus características idiosincrásicas (i.e., abordan la perspectiva de género, cubren rangos de edad inferiores, valoran los factores de protección). Estrategia de Búsqueda Para localizar la población de estudios, en una primera fase se examinó la base especializada de datos bibliográficos: PsycINFO (1990-marzo 2015) y el metabuscador Google Académico (1990-marzo 2015). Las búsquedas se realizaron en el campo “resumen” con los términos en inglés “risk”, “protective”, “assessment”, “appraisement”, “prediction”, “tools”, “test”, “instruments”, “meta-analysis”, “review”; estos términos se emparejaron mediante los operadores booleanos “OR” entre sí y con los operadores “&” –para Google Académico– y “AND” –para PsycINFO– con los siguientes términos: “adolescents”, “youth”, “juvenile”, “predictive validity” y “recidivism” (a su vez, conectados entre sí con el operador “OR”). Como términos en castellano se utilizaron “riesgo”, “protector”, “evaluación”, “valoración”, “predicción”, “herramientas”, “pruebas”, “instrumentos”, “meta-análisis”, “revisión” (conectados entre sí mediante el operador “O”) en combinación (mediante los conectores “&” e “Y”) con los términos “adolescentes”, “jóvenes”, “juvenil”, “validez predictiva”, “reincidencia” (a su vez, conectados entre sí con el operador “O”). Además, se emplearon términos “comodín” (terminados en *) en inglés para obtener artículos con todas las variaciones del tallo de cada término: “recidiv*”, “reoffen*”, “aggress*”, “psychopath*”, “violen*”, “nonviolen*”, “institut*”, “psysical*” y “verbal*”. Por otra parte, se utilizó el operador “–” delante de los términos “adults” (en las búsquedas en inglés) y “adultos” (en las búsquedas en castellano), para excluir información sobre adultos. En una segunda fase, se utilizaron como términos clave de búsqueda los acrónimos de los instrumentos que mostraron mayor frecuencia de aparición en la búsqueda bibliográfica realizada para la reseña de la literatura y se seleccionaron aquellos estudios en los que aparecían datos de validez predictiva (véase la sección Resultados). Se examinó el apartado Referencias de los estudios identificados y, finalmente, se envió correspondencia a algunos de los autores principales de dichos estudios para obtener trabajos/datos adicionales que podrían haberse pasado por alto. Asimismo, se incluyó un resultado de validez predictiva del instrumento IGI-J (Garrido, López y Silva, 2006) posterior a 2015, identificando el estudio (Garrido et al., 2017) a través de las alertas de Google Académico. Se consideró relevante aportar este último estudio, ya que se encontraron adecuadas evidencias de validez predictiva. En una tercera fase se han incluido los instrumentos Asset (Youth Justice Board, 2000) y ARMIDILO-S (Boer, Tough y Haaven, 2004), debido a que contaban con numerosos estudios de validez predictiva y su uso está generalizado tanto en Inglaterra y Gales como en Estados Unidos respectivamente. Criterios de Inclusión Del ámbito internacional se seleccionaron instrumentos cuyas puntuaciones mostraron validez predictiva sobre la reincidencia delictiva en diversos estudios (tanto nacionales como internacionales) o también aquellos que por sus características idiosincrásicas resultaron relevantes. Del ámbito nacional se incluyeron aquellos seleccionados previamente en el contexto internacional y que además fueron validados o adaptados en España, junto con un instrumento creado y validado formalmente en España (PREVI-A; Graña, Andreu y González, 2017). Criterios de Exclusión Tras una primera fase de búsqueda, finalmente se excluyeron aquellos instrumentos sobre los que no había estudios que mostrasen un índice adecuado de validez predictiva y/o que no poseyesen características relevantes por su especificidad. Selección e Inclusión Final de Resultados Los criterios utilizados en la identificación, cribado, elección e inclusión de resultados han seguido las recomendaciones PRISMA [Preferred Reporting Items for Systematic reviews and Meta-Analyses] (Liberati et al., 2009). Se clasificaron las herramientas en función de los diferentes tipos de reincidencia delictiva: violenta (tanto sexual como no sexual) y/o general, teniendo en cuenta el rango de edad de la población al que iban dirigidos. Además, se tuvo en cuenta si el instrumento evaluaba los factores de riesgo o los factores de protección (o ambos). Un criterio adicional de inclusión fue el contexto de creación del instrumento. Además, se consideró si evaluaban características (factores de riesgo y/o de protección) diferenciales en función del género. Finalmente, se tuvo en cuenta si eran adecuados para evaluar a menores con bajo funcionamiento intelectual. ResultadosPrincipales Instrumentos de Valoración y Gestión del Riesgo de Reincidencia en Menores y Evidencias de Validez Predictiva de sus Puntuaciones En la Tabla 1 se resumen las características más relevantes de los instrumentos para la valoración y gestión del riesgo descritos en esta revisión. Existen varias formas de clasificar las medidas de valoración del riesgo de reincidencia (para una descripción exhaustiva, véase Hanson y Morton-Bourgon, 2009). La clasificación con mayor consenso es la que distingue entre las medidas actuariales y las clínico-estructuradas (Andrés-Pueyo y Echeburúa, 2010; Andrés-Pueyo y Redondo, 2007 Andreu, Graña, Peña y Ballesteros, 2013; Esbec y Fernández, 2003) o basadas en el juicio profesional estructurado (JPE) (Borum, Lodewikjs, Bartel y Forth, 2010; Vincent, Chapman y Cook, 2011). Se encuentran 15 instrumentos, de los cuales 12 muestran adecuados niveles de validez predictiva en investigaciones, que se comentan a continuación. Los tres instrumentos que no presentan adecuados niveles de validez predictiva son el Sistema Integrado de Evaluación Diferenciada para Adolescentes y Jóvenes (SIED-AJ; Cortés, Lorca y Vázquez, 2015), el Early Assessment Risk List for Boys (EARL-20B; Augimeri, Koegl, Webster y Levene, 2001) y el Early Assessment Risk List for Girls (EARL-21G; Levene et al., 2001). Tabla 1 Nota. Elaboración propia. En la Tabla 2 se resumen los datos sobre validez predictiva para la reincidencia delictiva de las puntuaciones de los siguientes instrumentos: Juvenile Sexual Offense Recidivism Risk Assessment Tool-II (JSORRAT-II; Epperson, Ralston, Fowers, DeWitt y Gore, 2006), Static-99 (Hanson y Thornton, 1999), Youth Level of Service/Case Management Inventory (YLS / CMI; Hoge y Andrews, 2002), Structured Assessment for Violence Risk in Youth (SAVRY; Borum, Bartel y Forth, 2003), Hare Psychopathy Checklist Youth Version (PCL: YV; Forth et al., 2003), Juvenile Sexual Offender Assessment Protocol (J-SOAP-II; Prentky y Righthand, 2003), Estimate of Risk of Adolescent Sexual Offense Recidivism 2.0 (ERASOR 2.0; Worling, 2004), Instrumento de Predicción y Valoración de la Intervención-ARRMI (PREVI-A; Graña et al., 2017), Multiplex Empirically Guided Inventory of Ecological Aggregates for Assessing Sexually Abusive Adolescents and Children (MEGA; Miccio-Fonseca, 2009), Asset (Youth Justice Board, 2000) y Assessment of Risk and Manageability for Individuals who Offend Sexually (ARMIDILO-S; Boer et al., 2004). Asimismo, se muestran los datos sobre validez predictiva para el desistimiento en la conducta delictiva de las puntuaciones del siguiente instrumento: Desistence for Adolescents who Sexually Harm (DASH-13; Worling, 2013). Tabla 2 Nota. Modificado de Hempel, Buck, Cima y van Marle (2013). Review of risk assessment instruments for juvenile sex offenders: What is next? International Journal of Offender Therapy and Comparative Criminology, 57, 216-218. Derechos de autor protegidos por Copyright Clearance Center, Inc 2015 (http://ijo.sagepub.com/). Permiso concedido para reproducción y modificación. AUC = area under the receiver operator characteristic curve; d = effect size based on base rates. *p < .05, **p < .01, ***p < .001. A modo orientativo, la evidencia empírica sobre la validez predictiva de los instrumentos se realiza mediante el análisis de las curvas ROC [Receiver Operating Characteristic]. Una curva ROC es una representación gráfica de la sensibilidad frente a la especificidad para un sistema de clasificación binario, de modo que cuando el área bajo la curva (area under the curve - AUC) arroja un valor de 1 la clasificación se puede considerar como perfecta, es decir, que el instrumento clasifica de manera correcta a todos los casos posibles, mientras que un valor de .50 representaría una clasificación al azar, es decir, que el instrumento no discrimina entre el resultado de los participantes que presentan reincidencia violenta de quienes no. Es decir, un test diagnóstico se considera no-discriminativo si su curva ROC coincide con la línea de no-discriminación, la cual posee un valor AUC = .50. A medida que el valor AUC de un test diagnóstico se acerca al valor 1 (test diagnóstico perfecto), mayor será su capacidad discriminativa. En general, valores AUC por debajo de .75 no reflejan una adecuada capacidad predictiva, mientras que valores comprendidos entre .75 y .90 indicarían una buena capacidad predictiva del instrumento o guía de valoración. En cuanto al DASH-13, existen datos sobre la validez predictiva de sus puntuaciones sobre el desistimiento de la conducta delictiva. El estudio de Zeng, Chu y Lee (2015) muestra los siguientes valores del área bajo la curva (AUC): .52 para desistimiento sexual, .64 para el desistimiento general y .60 para el desistimiento total. Discusión y ConclusionesLos objetivos de este estudio son conceptualizar la valoración y gestión del riesgo en menores infractores en sentido diacrónico y revisar los instrumentos más utilizados tanto en el contexto nacional como internacional, seleccionando los más adecuados. Para tal fin, se comparan los resultados de validez predictiva de sus puntuaciones en diferentes estudios (incluyendo revisiones cualitativas y meta-analíticas). A lo largo de las últimas décadas se pasa del juicio clínico no estructurado (1G) a las escalas actuariales (2G), transición que perfecciona la metodología de valoración del riesgo al aportar rigor estadístico. La 3G tiene su esencia en la valoración del riesgo a partir de la puntuación en la PCL-YV (Hare, 2003) y en el desarrollo de instrumentos que incorporan factores de riego dinámicos, mientras que la 4G o última generación (Garrido et al., 2017) se caracteriza por el predominio del juicio profesional estructurado (JPE), enfatizando la importancia del valor predictivo de las puntuaciones de estos instrumentos de cara a la gestión del riesgo (Garrido et al., 2017; Graña, Garrido y González, 2007). Además, esta 4G (última generación) se caracteriza por la eclosión de instrumentos que recogen factores de riesgo específicos en menores. Los protocolos actuariales aplican hallazgos obtenidos en estudios grupales a personas concretas, con la limitación de que la probabilidad de error es mayor cuanto mayor sea la heterogeneidad existente (Andrés-Pueyo y Echeburúa, 2010; Muñoz-Vicente y López-Ossorio, 2016). Los procedimientos mixtos clínico-estructurados o basados en el juicio profesional estructurado (JPE) (Andrés-Pueyo y Echeburúa, 2010; Andrés-Pueyo y Redondo, 2007) constituyen una herramienta valiosa al estimar la reincidencia dentro del marco de la delincuencia juvenil (Borum et al., 2010), en especial cuando se trata de predecir reincidencia violenta (Lodewijks, Doreleijers y de Ruiter, 2008), integrando de manera eficiente la información obtenida en la valoración y aplicándola en la gestión de los casos particulares (Schwalbe, 2008; Vincent et al., 2011). No obstante, el método del JPE está sujeto a ciertas limitaciones, ya que existe cierta subjetividad por parte del profesional que toma la decisión final (Andrés-Pueyo y Echeburúa, 2010; Schwalbe, 2008). Estas limitaciones, trasladadas a contextos jurídicos, conllevan la necesidad de exigir una serie de requisitos a los informes periciales del riesgo de violencia, tales como proponer dos evaluadores independientes con cualificación y experiencia profesional y/o académica acreditable (Muñoz-Vicente y López-Ossorio, 2016). Parece evidente que en el ámbito internacional hay diversas herramientas disponibles para la valoración y gestión del riesgo que han sido avaladas mediante la evidencia empírica (sin olvidar sus “carencias”), aunque quizá no son suficientes desde el plano de la especificidad. A nivel nacional, el campo de la valoración del riesgo de reincidencia violenta ha recibido una considerable atención tanto en adultos como en menores infractores; sin embargo, son necesarios más estudios acerca de la capacidad predictiva de los instrumentos revisados, valorando aspectos metodológicos (vide infra). De entre las herramientas encontradas en el contexto internacional se describe primeramente el SIED-AJ (Cortés et al., 2015), un instrumento creado en Chile cuyo objetivo es orientar intervenciones y evaluar niveles de cambio en el proceso psico-socio-educativo. Es fruto de una extensa investigación aunque, como señalan los autores, faltan aún estudios que aporten evidencias de validez predictiva sobre la reincidencia delictiva. Otro instrumento que destacar es el EARL-21G, por la mejora que aporta desde la perspectiva de género, al contar con dos ítems específicos de género femenino. Dentro del factor niño, el ítem específico para varones “contacto previo con las autoridades” no muestra valor predictivo en mujeres, por lo que se sustituye por otro ítem específico “desarrollo sexual problemático”. Dentro del factor familia, el EARL-21G cuenta con un ítem adicional: “interacción cuidador-hija”. Las chicas que puntuaron más alto en el factor familia mostraron una peor respuesta a la intervención (Koegl, Augimeri, Ferrante, Walsh y Slater, 2008). No obstante, el eje central a la hora de valorar la utilidad de los instrumentos para la valoración del riesgo es el estudio de la validez predictiva de sus puntuaciones sobre la reincidencia delictiva. Para ello se evalúan diferentes medidas como la sensibilidad, la especificidad o los índices de probabilidad. La interpretación del área bajo la curva (AUC), a través del análisis ROC [Receiver Operating Characteristic] parte de que un resultado de .50 puede representar una aproximación azarosa, mientras que 1 representará una predicción perfecta (Mossman, 1994; Rice y Harris, 1995). Partiendo de estos dos polos, en términos generales, los valores cercanos a .56 corresponden a una d de Cohen de 0.3, representando un tamaño del efecto pequeño; un valor AUC de .65 equivaldría a una d de Cohen de 0.5, representando un tamaño del efecto moderado, mientras que un valor AUC de .70 corresponde a una d de Cohen de 0.8, considerándose un tamaño del efecto grande (Rice y Harris, 2005). A la hora de valorar la validez predictiva también se han de tener en cuenta las limitaciones provenientes del tamaño de la muestra y los resultados obtenidos en las diferentes subescalas de los instrumentos y el margen de tiempo de reincidencia (por ejemplo 1 año). Para que la capacidad predictiva sea adecuada en justicia es necesario que los valores AUC estén por encima de .70 (Rice y Harris, 2005). Janus y Meehl (1997) indicaron que en los métodos de predicción actuariales al menos se han de demostrar valores entre .70 y .75 como punto de referencia en el contexto judicial para que las decisiones judiciales emanadas sean fiables y ajustadas al compromiso de la ley. Los parámetros que se encuentran en la presente revisión son heterogéneos, con una amplia variabilidad de muestras y resultados. Las escalas actuariales que presentan mayores tasas de validez predictiva son el JSORRAT-II (Epperson et al., 2006) y el Static-99 (Hanson y Thornton, 1999), junto con la PCL:YV (Forth et al., 2003) y su adaptación española autorizada (González et al., 2003). La PCL-YV presenta valores altos de validez predictiva en la valoración del riesgo de reincidencia violenta no sexual, mientras que en la valoración de la reincidencia violenta sexual presenta valores bajos. El JSORRAT-II y el Static-99 miden reincidencia sexual en adolescentes que ya cuentan con algún delito sexual en su expediente. El Static-99 está diseñado para valorar adultos, siendo cuestionado su uso en adolescentes, con resultados dispares. Los valores hallados en la valoración del riesgo de violencia sexual (véase Tabla 2) son aceptables en investigación, pero no en contextos donde se tomen decisiones. No obstante, destaca la gran heterogeneidad de los resultados entre los diversos estudios. Por tanto, el Static-99 se recomienda en algunos casos, en la línea de lo sostenido por Harris, Phenix, Thornton y Hanson (2003). En cuanto a la valoración del riesgo de violencia no sexual, los valores que presenta (véase Tabla 2) oscilan entre las categorías medio-bajo y moderado. El JSORRAT-II muestra valores muy heterogéneos a través de los diversos estudios, con valores AUC que van desde .50 hasta .79. Las medidas clínico-estructuradas que mayor validez predictiva muestran son el YLS/CMI (Hoge y Andrews, 2002) y su adaptación, el Inventario de Gestión e Intervención para Jóvenes (IGI-J; Garrido et al., 2006), el SAVRY (Borum et al., 2003), el J-SOAP-II (Prentky y Righthand, 2003) y su adaptación, el J-SOAP-II (Garrido et al., 2006), el SAVRY (Borum et al., 2003) y su adaptación, la Valoración Estructurada de Riesgo de Violencia en Jóvenes (SAVRY; Vallès y Hilterman, 2006), el ERASOR 2.0 (Worling, 2004) y el PREVI-A (Graña et al., 2017), este último diseñado y validado formalmente en España. Para valoración de delincuencia violenta no sexual, los resultados del SAVRY y del IGI-J son discretos, en consonancia con los resultados del metaanálisis de Fazel, Singh, Doll y Grann (2012). El SAVRY presenta valores de validez predictiva de .74 para reincidencia general y .73 para reincidencia violenta no sexual, por encima de los valores que obtiene el Static-99 (.67 para la reincidencia general y .69 para la reincidencia violenta no sexual), pero por debajo de los valores que presenta la PCL:YV (.78 para reincidencia violenta no sexual y .73 para reincidencia general) y por debajo también de los valores que presenta el PREVIA (.80 para reincidencia general). En el caso del J-SOAP-II, los datos encontrados oscilan entre valores AUC de .44 a .86 para reincidencia violenta sexual y .74 para reincidencia general. Existe una alta variabilidad, que puede ser debida a las muestras de estudio y a otras variables. Aunque los resultados que sobrepasan el .70 se pueden ajustar a los requerimientos necesarios que ha de tener un instrumento en el contexto de justicia (Janus y Meehl, 1997; Rice y Harris, 2005), hay que tener en cuenta que en algunos de los estudios los valores son muy bajos (i.e., .44). Lo mismo ocurre con el JSORRAT-II, con un .74 como valor AUC máximo obtenido en reincidencia violenta sexual. En términos generales, y en consonancia con los hallazgos de Fazel et al. (2012), la mayor parte de los instrumentos en sus diferentes estudios alcanzan parámetros discretos, existiendo una alta variabilidad en los estudios realizados con el J-SOAP-II. Con esta variabilidad existente, se concluye que en caso de ser utilizados en el ámbito práctico (especialmente en contextos judiciales) ha de hacerse con suma cautela. En el caso de reincidencia violenta sexual con personas con afectación funcional intelectual, el ARMIDILO-S parece mostrar mayor validez predictiva (AUC = .73) frente a sus competidores (Blacker, Beech, Wilcox y Boer, 2011), aunque dichos resultados no puedan generalizarse transculturalmente. La escala de riesgo del MEGA presenta valores de validez predictiva sobre la curva de ROC de AUC de .71 (.62-.82, 95% IC). Tanto el ARMIDILO-S como el MEGA cumplen con los criterios para el uso práctico aunque su uso ha de hacerse con cautela dada la variabilidad en los estudios que, aunque no es acentuada, se encuentra presente. En cuanto a la PCL:YV (Forth et al., 2003), presenta las siguientes limitaciones: 1) la presencia de psicopatía en las escalas actúa como un predictor más junto con el resto de los factores presentes y 2) en niños no se puede diagnosticar “psicopatía”. Según algunos autores, sería prematuro establecer un punto de corte mientras no se obtenga un cuerpo empírico consistente sobre la estabilidad de los rasgos de psicopatía a lo largo de la adolescencia y durante la transición a la edad adulta (Salekin y Lynam, 2010). Los diferentes estudios del Asset (Youth Justice Board, 2000) en cuanto a validez predictiva arrojan valores AUC de .72, retratándolo como un instrumento con adecuada capacidad predictiva en la evaluación de la reincidencia violenta, tanto en frecuencia como en intensidad (Baker, Jones, Roberts y Merrington, 2003). La aproximación de Baker, Jones, Merrington y Roberts (2005) dio como resultado parámetros similares, con un valor AUC de .73. En consonancia con los resultados de los estudios precedentes (Baker et al., 2003; Baker et al., 2005), el estudio desarrollado por el Ministerio de Justicia de Reino Unido (Wilson y Hinks, 2011) (N = 7,621) obtiene resultados similares (AUC = .72), superando la limitación de los estudios anteriormente citados con muestras pequeñas y potencialmente poco representativas. Sin embargo, no se cuenta con adaptación de este instrumento en el contexto nacional. Se señalan algunas limitaciones relacionadas con el uso de estos instrumentos, dentro de las cuales cabe señalar la necesidad de llevar a cabo más estudios prospectivos, dado que la mayoría de los estudios de reincidencia llevados a cabo emplean una metodología retrospectiva. Es decir, los participantes en el momento de la evaluación del riesgo están cumpliendo una medida de internamiento actual, por lo que los delitos que se utilizan para determinar la reincidencia delictiva son cometidos en el pasado en un intervalo temporal preestablecido. Sería necesario, por tanto, desarrollar estudios longitudinales prospectivos de cara a determinar la tasa real de reincidencia delictiva entre aquellos que reinciden y no reinciden en distintos periodos de seguimiento para poder contrastar así las estimaciones realizadas y la capacidad predictiva del instrumento. Es conveniente concluir, finalmente, que en materia de investigación, en cuanto a capacidad predictiva, la mayor parte de los umbrales se sitúan en valores AUC en torno a .70, para considerar un poder predictivo óptimo, mientras que en el contexto judicial se exigen parámetros más elevados para justificar el peso de las decisiones jurídicas al respecto. Janus y Meehl (1997) recomiendan para este tipo de contextos valores AUC de entre .70 y .75, mientras que Wilson y Hinks (2011), en términos generales, consideran que una buena capacidad predictiva es aquella representada por valores AUC de entre .78 y .80. También es conveniente plantear la necesidad de seguir profundizando en el estudio de los factores específicos (tanto de riesgo como de protección), así como en la determinación de tipologías (Andreu et al., 2013). Asimismo, se subraya que cuando se utilicen instrumentos de valoración del riesgo en el contexto jurídico la evaluación debería ser realizada por dos peritos acreditados y con experiencia que evalúen de forma independiente (Muñoz-Vicente y López-Ossorio, 2016); además, se debe informar a los operadores jurídicos de las limitaciones inherentes a los instrumentos utilizados (Echeburúa, Muñoz-Vicente y Loinaz, 2011). Extended Summary In the last 15 years, new techniques have been developed to predict violent behavior, leading to the development of protocols and instruments for professional use to assess the risk of violence. This has led to a paradigm shift, replacing the concept of hazard estimation with the recidivism risk assessment (and management), thanks to the knowledge of risk factors, measurable characteristics of offenders that are significantly related to criminal behavior. The evolution of risk assessment methodologies has been developed over four generations, the first of which (1G) is based on the unstructured professional judgment of the evaluator in forensic contexts. Due to the methodological deficiencies of this first generation, second generation instruments (2G) were developed based on actuarial scales, statistical formulas that probabilistically estimate the risk of recidivism from an algorithm that provides a global score. 2G instruments were supported by empirical evidence and statistical rigor, giving prominence to the risk factors of higher predictive validity. Leaving behind this second generation, the modern era of risk assessment instruments has its nucleus in the development of the psychopathic construct of Robert D. Hare, being the PCL-R for adults and the PCL:YV for minors the cornerstones of the prediction of criminal recidivism, especially of the violent type. From this base, third generation (3G) instruments are developed, which incorporated the dynamic risk factors, being the Level of Service Inventory-Revised the flagship of this stage. The last link is fourth generation (4G), or “last generation” instruments, which highlights the development of specific instruments to assess the likelihood of recidivism in minors to subsequently determine the most appropriate intervention objectives in each case. Given that the number of instruments that assess risk factors in minors is significantly lower than their counterparts for adults, the objective of this work was twofold: 1) to review the literature on risk assessment in juvenile offenders, both in Spain and in the international context, and 2) to explore studies on the main recidivism risk assessment instruments in youth offenders, including reviews (both meta-analytical and qualitative), in order to examine both their basic characteristics and the predictive validity of their scores. Method Procedure. To achieve those goals, first, both theoretical and methodological approaches were gathered, based on the risk assessment and management of criminal recidivism among young offenders. Secondly, a systematic review of the instruments most often used to assess and manage the recidivism risk was carried out. The instruments chosen were based on adequate levels of predictive validity and those whose aspects were relevant due to their idiosyncrasy (e.g., age group, gender, protective factors, and environment). Search strategy. To locate the population of studies, PsychINFO (1990-March 2015) and Google Scholar (1990-March 2015) were used as databases. The searches were carried out in the Summary field with the terms in English “risk”, “assessment”, “appraisement”, “prediction”, “tools”, “test””, “instruments”, “meta-analysis”, “review”; these terms were paired with the Boolean operators “OR” with each other and with the operators “&” (for Google Scholar) and “AND” (for PsycINFO) with the following terms: “adolescents”, “youth”, “juvenile”, “predictive validity”, “recidivism”. In addition, “wildcard” terms (ending in *) were used to obtain articles that use all stem variations of each term: “recidiv*”, “reoffen*”, “aggress*”, “psychopath*”, “violen*”, “nonviolen*”, “institut*”, “psysical*”, and “verbal*”. In addition, the operator “-” was used in front of the “adults” terms, to exclude information about adults. In a second phase, the acronyms of the instruments with the highest frequency of appearance in the bibliographic search carried out for the review of the literature were used as key search terms and those studies in which predictive validity data appeared were selected (see Results section). The References section of the studies identified was examined and, finally, correspondence was sent to some of the main authors of these studies to obtain additional work/data that could have been overlooked. Inclusion criteria. From the international context, instruments with adequate evidence of predictive validity were selected or also those that due to their idiosyncratic characteristics are relevant. At the national context, those that had been previously selected in the international context and that had also been validated and/or adapted in Spain were included, along with an instrument created and formally validated in Spain (PREVI-A). Exclusion criteria. Those instruments that did not have adequate levels of predictive validity or did not possess relevant characteristics due to their specificity were excluded. In the selection and final inclusion of results the PRISMA criteria (Preferred Reporting Items for Systematic reviews and Meta-Analyses Liberati et al., 2009) were used. The tools were classified according to the different types of criminal recidivism that they measure: violent (both sexual and non-sexual) and/or general (non-violent), considering the age range of the target population. In addition, it was considered whether the use of the instrument is exclusively aimed at measuring the risk factors or protection factors (or both). Another criterion was whether the tools provide a comprehensive assessment or are screening measures. An additional criterion of inclusion was the context of creation of the instrument. Also, it was considered that differential risk factors according to gender appeared in the literature. Results Fifteen instruments were found: three actuarial scales (JSORRAT-II, Static-99, and PCL-YV), and twelve structured clinical judgment measures (YLS/CMI, SAVRY, SIED-AJ, EARL-20B, EARL-21G, J-SOAP-II, ERASOR 2.0, MEGA, Asset, ARMIDILO-S, DASH-13, and PREVI-A). Discussion and Conclusions There are various tools available for the assessment and management of risk in the international context, supported by empirical evidence, although they may not be sufficient from the point of view of specificity. There is a great variability in the results found in terms of predictive validity when different studies with the same tool are compared. The adequacy of an instrument to the judicial context must be based on values of predictive validity (AUC) between .70 and .75. In Spain, the field of risk assessment has received considerable attention in adults, even though the management of risk and rehabilitation of young people is a goal pursued in recent years. The need to carry out more prospective studies is indicated. In addition, it is highly recommended that in psychological forensic reports, the risk assessment is carried out by two independent evaluators who are experts in the field. The need to continue deepening the study of specific factors (both risk and protection), as well as the determination of typologies, is pointed out. Para citar este artículo: Horcajo-Gil, P. J., Dujo-López, V., Andreu-Rodríguez, J. M. y Marín-Rullán, M. (2019). Valoración y gestión del riesgo de reincidencia delictiva en menores infractores: una revisión de instrumentos. Anuario de Psicología Jurídica, 29, 41-53. https://doi.org/10.5093/apj2018a15 Referencias |
Para citar este artículo: Horcajo-Gil, P. J., Dujo-López, V., Andreu-Rodríguez, J. M. y Marín-Rullán, M. (2019). Valoración y gestión del riesgo de reincidencia delictiva en menores infractores: una revisión de instrumentos. Anuario de Psicología Jurídica, 29, 41-53. https://doi.org/10.5093/apj2018a15
Correspondencia: pedrojosehorcajo@psicologia-forense-madrid.es (P. J. Horcajo-Gil).
Copyright © 2024. Colegio Oficial de la Psicología de Madrid