1 de septiembre de 2011

La curva ROC y el ave roc


Ustedes perdonarán que esté un poco pesado con todo este tema de los clasificadores; les prometo que, por ahora, ésta será la última entrega. Y dicho esto, pasemos al

Capítulo III

El hijo del doctor Sensible y la doctora Específica puso un ejemplo.

-Imaginemos que para aprobar un examen sólo hicieran falta 2 puntos sobre 10. ¿Qué ocurriría entonces?
-Los alumnos que saben Matemáticas aprobarían todos. La mayoría de los alumnos que saben Matemáticas tienen notas superiores al 5 y ésos estarían aprobados. Por otro lado, los alumnos que saben Matemáticas pero tuvieron mala suerte tendrán notas alrededor de un 3 o un 4. Nunca menos de un 2. ¡Aprobaríamos a todos los que saben! -dijo contento el doctor Sensible.
-Pero también aprobaríamos a muchos de los que no saben -apostilló la doctora Específica. Bastantes de los que no saben Matemáticas suficientes tendrán más de 2 puntos. El 2 no es la nota de corte óptima.

El hijo de ambos sonrió.

-Los has dicho muy bien, mamá. No es la nota de corte óptima. ¿Y si la nota de corte fuera un 3?
-Suspenderían muchos de los que se lo merecen -dijo ella.
-Sí, pero también suspendería algún pobre que sepa mucho pero con mala suerte -se apresuró a afinar él.

Y el hijo contestó lo siguiente.

-Ambos tenéis razón. Toda pérdida de sensibilidad implica un aumento de especificidad. Pero esto no ocurre de forma lineal. Al pasar la nota de corte del 2 al 3, muchos alumnos que no saben obtendrán su suspenso a costa de alguno raro que suspenderá sin merecerlo. En otras palabras, al pasar la nota de corte del 2 al 3, más alumnos quedarán correctamente clasificados en aprobados y suspensos según sus conocimientos.

La idea clave es que la ganancia de sensibilidad a costa de una pérdida de especificidad no es lineal, sino curva. Esa curva tiene nombre propio y se llama ROC, que dicho sea de paso, no tiene nada que ver con el roc, el ave mitológica cuyo huevo quiso colgar Aladino de la cúpula de su palacio o el que se encontró Simbad el marino en uno de sus viajes.

No quiero entrar en cuestiones estadísticas tediosas acerca de la curva; en Internet encontrarán fácilmente información sobre ella mucho mejor de la que yo puedo darles. Sin embargo, sí que les interesará conocer sus ventajas.

Por ejemplo, permite encontrar el punto de corte de una prueba, como el examen de Matemáticas, (o una prueba médica, como un valor bioquímico o fisiológico) con el cual el número de individuos mal clasificados sea mínimo. U otro punto de corte, por ejemplo en el cual no minimicemos el número de individuos mal clasificados, sino el coste que éstos suponen.

¿O se creían ustedes que los valores médicos de corte se establecían al azar?

Foto: Huevo de roc.

6 firmas. Añade tú la tuya:

Emmanuel dijo...

Yo soy más de prosodia y métrica griega y latina... pero supongo que me hago una idea ¿o no?

DartaJuan dijo...

Pero, ¿acaso el TAC no es una técnica altamente específica y sensible? O estás haciendo más referencia a diagnóstico más que a pruebas de imagen que posteriormente tienen que ser interpretadas?

Emilienko dijo...

@DartaJuan: Más que el TAC, el que tiene que ser sensible y específico es el radiólogo ;)

Evidentemente, hay pruebas diagnósticas que son a la vez muy sensibles y específicas, en las cuales encontrar un punto de corte es sencillo. Imagina que todos los que no saben en el examen tuvieran notas alrededor de un 2 y los que saben alrededor de un 8. No hubo alumnos que sabían suspensos ni alumnos que no sabían aprobados. En ese caso, el punto de corte 5 convierte la prueba en un CLASIFICADOR IDEAL.

Cuanta menos especificidad se pierda con una ganancia de especificidad, más cerca de la idealidad se encuentra un clasificador. Esto se calcula con el área que deja la curva ROC entre ella y ordenadas. Cuánto más próxima sea a 1 o a 0, más cerca de la idealidad estará el clasificador; mientras que cuanto más próxima a 0,5, el clasificador será malo y aleatorio.

angelurri dijo...

(¡¡madre mía, qué hijo más repelente!!)

DartaJuan dijo...

mmm.... interesante.

Me ha gustado tu punto de que el sensible y específico tiene que ser el radiólogo, aunque hoy en día los métodos diagnósticos evolucionen (por desgracia en mi opinión) hacia el diagnóstico por ellos mismos (creo que un ejemplo muy básico de esto es el ECG, que si bien los médicos lo ignoran, elabora su propio diagnóstico de la lectura)

De todas formas, creo que es importante que a largo plazo se introduzca la variable "cómo ha sido el examen de su hijo" y "quién ha evaluado a su hijo"

Un saludo!

Golfilla dijo...

Me ha encantado absolutamente la colección de los tres capítulos. En serio. Estaba volviendo a seguirte desde la historia de la Begonia, tarde , ya lo sé, pero así soy yo infiel y discontinua, y no sabes cuánto he disfrutado con tus últimos post, sobre todo con estos cuentos. Qué divertido es aprender y qué ingenioso es usted Dr.Durán ( te he quitado un apellido porque sí).

Seguiré siguiéndote con interés, y como siempre con la esperanza de verte pronto.

Un beso enorme!