descriptive-statistics – ¿El coeficiente de dados es lo mismo que la precisión?

Pregunta:

Me he encontrado con el coeficiente de Dice para la similitud y precisión del volumen. Me parece que estas dos medidas son iguales. ¿Es eso correcto?

Respuesta:

No son lo mismo y, a menudo, se utilizan en diferentes contextos. La puntuación de Dice se utiliza a menudo para cuantificar el rendimiento de los métodos de segmentación de imágenes . Allí anotas alguna región de verdad del terreno en tu imagen y luego haces un algoritmo automatizado para hacerlo. El algoritmo se valida calculando la puntuación de Dice, que es una medida de la similitud de los objetos. Por tanto, es el tamaño de la superposición de las dos segmentaciones dividido por el tamaño total de los dos objetos. Usando los mismos términos para describir la precisión, la puntuación de Dice es: $$ \ text {Puntuación de Dice} = \ frac {2 \ cdot \ text {número de verdaderos positivos}} {2 \ cdot \ text {número de verdaderos positivos + número de falsos positivos + número de falsos negativos}} $$ Entonces, el número de verdaderos positivos es el número que encuentra su método, el número de positivos es el número total de positivos que se pueden encontrar y el número de falsos positivos es el número de los puntos negativos que su método clasifica como positivos.

La puntuación de Dice no es solo una medida de cuántos positivos encuentra, sino que también penaliza los falsos positivos que encuentra el método, similar a la precisión. por lo que es más similar a la precisión que a la exactitud. La única diferencia es el denominador, donde tiene el número total de positivos en lugar de solo los positivos que encuentra el método. Por lo tanto, la puntuación de Dice también penaliza los aspectos positivos que su algoritmo / método no pudo encontrar.

Editar: En el caso de la segmentación de imágenes, digamos que tiene una máscara con verdad fundamental, llamemos a la máscara $ A $ como sugiere. Entonces, la máscara tiene valores 1 en los píxeles donde hay algo que está tratando de encontrar y, de lo contrario, cero. Ahora tienes un algoritmo para generar imagen / máscara $ B $ , que también tiene que ser una imagen binaria, es decir, creas una máscara para tu segmentación. Luego tenemos lo siguiente:

  • El número de positivos es el número total de píxeles que tienen intensidad 1 en la imagen $ A $
  • El número de verdaderos positivos es el número total de píxeles que tienen el valor 1 tanto en $ A $ como en $ B $ . Entonces es la intersección de las regiones de unos en $ A $ y $ B $ . Es lo mismo que usar el operador AND en $ A $ y $ B $ .
  • El número de falsos positivos es el número de píxeles que aparecen como 1 en $ B $ pero cero en $ A $ .

Si está haciendo esto para una publicación, escriba Dice con una D mayúscula, porque lleva el nombre de un tipo llamado Dice.

EDITAR: Con respecto al comentario sobre una corrección: no uso la fórmula tradicional para calcular el coeficiente de Dice, pero si lo traduzco a la notación en la otra respuesta se convierte en:

$$ \ text {Puntaje de dados} = \ frac {2 \ cdot | A \ cap B |} {2 \ cdot | A \ cap B | + | B \ barra invertida A | + | A \ barra invertida B |} $$

Que es equivalente a la definición tradicional. Es más conveniente escribirlo de la forma en que lo escribí originalmente para expresar la fórmula en términos de falsos positivos. La barra invertida es el conjunto menos.

Leave a Comment

Your email address will not be published. Required fields are marked *

web tasarım