El gigante tecnológico chino Tencent tiene de código abierto su algoritmo de detección facial DSFD (Detector facial de Doble Disparo). El documento relacionado DSFD: El Detector de cara de doble disparo logra un rendimiento de vanguardia en puntos de referencia de conjuntos de datos de CARA MÁS ANCHA y FDDB, y ha sido aceptado por la conferencia top computer vision CVPR 2019.
DSFD
La detección de rostros es un paso fundamental para la alineación, el análisis, el reconocimiento y la verificación faciales. Investigadores del Laboratorio Youtu centrado en IA de Tencent proponen tres técnicas de detector facial DSFD:
- Módulo de mejora de características (FEM): Transferencia de los mapas de características originales para extender el detector de disparo único a un detector de disparo doble y hacerlos más discriminables y robustos.
- Pérdida progresiva de anclaje (PLA): Calculada mediante el uso de dos juegos de anclajes y adaptada para facilitar las características de manera efectiva.
- Coincidencia de anclajes mejorada (IAM): Integración de nuevas técnicas de aumento de datos y estrategia de diseño de anclajes en DSFD para proporcionar una mejor inicialización para el regresor.

Resultados del experimento
El marco DSFD muestra un rendimiento excepcional en los experimentos. Al observar las siguientes imágenes, el DSFD demostró una gran eficacia en la detección de rostros con variaciones de escala, postura, oclusión, desenfoque, maquillaje, iluminación, modalidad y reflexión. Las cajas delimitadoras azules indican que la confianza del detector está por encima de 0,8.

El grupo de investigación también realizó extensos experimentos y estudios de ablación con parámetros de referencia actuales para los conjuntos de datos de CARA ANCHA y FDDB.
Con el conjunto de datos de CARA MÁS ANCHA, como se muestra a continuación, DSFD logró un rendimiento de vanguardia para una precisión media en tres subconjuntos: 96,6% (Fácil), 95,7% (Medio) y 90,4% (Duro) en el conjunto de validación; y 96,0% (Fácil), 95,3% (Medio) y 90,0% (Duro) en el conjunto de prueba.

Con el conjunto de datos FDDB, como se muestra a continuación, DSFD logró un rendimiento de vanguardia en curvas ROC discontinuas y continuas: 99,1% y 86.2% cuando el número de falsos positivos sea igual a 1.000.

Reimplantación del proyecto
El proyecto DSFD se implementa en PyTorch. Sin usar bibliotecas especiales, este proyecto puede ejecutarse con Torch 0.3.1, Python 3.6 y cuDNN. El equipo de investigación ha proporcionado todos los materiales necesarios en su repositorio de GitHub.
