El algoritmo de Código abierto Tencent mejora los puntos de referencia de Detección Facial

El gigante tecnológico chino Tencent tiene de código abierto su algoritmo de detección facial DSFD (Detector facial de Doble Disparo). El documento relacionado DSFD: El Detector de cara de doble disparo logra un rendimiento de vanguardia en puntos de referencia de conjuntos de datos de CARA MÁS ANCHA y FDDB, y ha sido aceptado por la conferencia top computer vision CVPR 2019.

DSFD

La detección de rostros es un paso fundamental para la alineación, el análisis, el reconocimiento y la verificación faciales. Investigadores del Laboratorio Youtu centrado en IA de Tencent proponen tres técnicas de detector facial DSFD:

  1. Módulo de mejora de características (FEM): Transferencia de los mapas de características originales para extender el detector de disparo único a un detector de disparo doble y hacerlos más discriminables y robustos.
  2. Pérdida progresiva de anclaje (PLA): Calculada mediante el uso de dos juegos de anclajes y adaptada para facilitar las características de manera efectiva.
  3. Coincidencia de anclajes mejorada (IAM): Integración de nuevas técnicas de aumento de datos y estrategia de diseño de anclajes en DSFD para proporcionar una mejor inicialización para el regresor.
El marco DSFD utiliza un Módulo de Mejora de características (b) sobre una arquitectura VGG16 de feedforward para generar características mejoradas © a partir de las características originales (a); junto con dos capas de pérdida, First Shot PAL para las características originales y Second Shot PAL para las características mejoradas.

Resultados del experimento

El marco DSFD muestra un rendimiento excepcional en los experimentos. Al observar las siguientes imágenes, el DSFD demostró una gran eficacia en la detección de rostros con variaciones de escala, postura, oclusión, desenfoque, maquillaje, iluminación, modalidad y reflexión. Las cajas delimitadoras azules indican que la confianza del detector está por encima de 0,8.

la Eficacia de DSFD con grandes variaciones.

El grupo de investigación también realizó extensos experimentos y estudios de ablación con parámetros de referencia actuales para los conjuntos de datos de CARA ANCHA y FDDB.

Con el conjunto de datos de CARA MÁS ANCHA, como se muestra a continuación, DSFD logró un rendimiento de vanguardia para una precisión media en tres subconjuntos: 96,6% (Fácil), 95,7% (Medio) y 90,4% (Duro) en el conjunto de validación; y 96,0% (Fácil), 95,3% (Medio) y 90,0% (Duro) en el conjunto de prueba.

Precision-recall curvas más AMPLIO de CARA a la validación y pruebas de subconjunto.

Con el conjunto de datos FDDB, como se muestra a continuación, DSFD logró un rendimiento de vanguardia en curvas ROC discontinuas y continuas: 99,1% y 86.2% cuando el número de falsos positivos sea igual a 1.000.

Comparaciones populares de estado-of-the-art de los métodos en la FDDB conjunto de datos. La primera fila muestra los resultados de ROC sin anotaciones adicionales, y la segunda fila muestra los resultados de ROC con anotaciones adicionales.

Reimplantación del proyecto

El proyecto DSFD se implementa en PyTorch. Sin usar bibliotecas especiales, este proyecto puede ejecutarse con Torch 0.3.1, Python 3.6 y cuDNN. El equipo de investigación ha proporcionado todos los materiales necesarios en su repositorio de GitHub.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.