L’algorithme Open Source de Tencent Améliore les Benchmarks de détection de visage

Le géant chinois de la technologie Tencent a ouvert son algorithme de détection de visage DSFD (Dual Shot Face Detector). Le document connexe DSFD: Dual Shot Face Detector atteint des performances de pointe sur des benchmarks de données de VISAGE PLUS LARGES et FDDB, et a été accepté par la conférence top computer vision CVPR 2019.

DSFD

La détection de visage est une étape fondamentale pour l’alignement, l’analyse, la reconnaissance et la vérification du visage. Des chercheurs du Youtu Lab axé sur l’IA de Tencent proposent trois techniques de détection de visage DSFD:

  1. Module d’amélioration des fonctionnalités (FEM): Transfert des cartes d’entités d’origine pour étendre le détecteur à un seul coup à un détecteur à deux coups et les rendre plus discriminables et robustes.
  2. Perte d’ancrage progressive (PLA) : Calculée à l’aide de deux jeux d’ancrages et adaptée pour faciliter efficacement les fonctionnalités.
  3. Amélioration de la correspondance d’ancrage (IAM): Intégration de nouvelles techniques d’augmentation des données et d’une stratégie de conception d’ancrage dans DSFD pour fournir une meilleure initialisation du régresseur.
Le framework DSFD utilise un module d’amélioration des fonctionnalités (b) au-dessus d’une architecture feedforward VGG16 pour générer des fonctionnalités améliorées © à partir des fonctionnalités d’origine (a) ; ainsi que deux couches de perte, First Shot PAL pour les fonctionnalités d’origine et Second Shot PAL pour les fonctionnalités améliorées.

Résultats de l’expérience

Le cadre DSFD montre des performances exceptionnelles dans les expériences. En observant les images suivantes, DSFD a démontré une grande efficacité dans la détection de visages présentant des variations d’échelle, de pose, d’occlusion, de flou, de maquillage, d’éclairage, de modalité et de réflexion. Les boîtes de délimitation bleues indiquent que la confiance du détecteur est supérieure à 0,8.

Efficacité de la DSFD avec de grandes variations.

Le groupe de recherche a également mené des expériences approfondies et des études d’ablation avec des repères actuels pour les ensembles de données FACE et FDDB PLUS LARGES.

Avec l’ensemble de données WIDER FACE, comme indiqué ci-dessous, DSFD a obtenu des performances de pointe pour une précision moyenne sur trois sous-ensembles: 96,6% (Facile), 95,7% (Moyen) et 90,4% (Difficile) sur l’ensemble de validation; et 96,0% (Facile), 95,3% (Moyen) et 90,0% (Difficile) sur l’ensemble de test.

Courbes de rappel de précision sur un sous-ensemble de validation et de test de VISAGE PLUS LARGE.

Avec l’ensemble de données FDDB, comme indiqué ci-dessous, DSFD a obtenu des performances de pointe sur les courbes ROC discontinues et continues : 99,1% et 86.2% lorsque le nombre de faux positifs est égal à 1 000.

Comparaisons avec des méthodes de pointe populaires sur l’ensemble de données FDDB. La première ligne affiche les résultats ROC sans annotations supplémentaires et la deuxième ligne les résultats ROC avec des annotations supplémentaires.

Re-mise en œuvre du projet

Le projet DSFD est mis en œuvre sur PyTorch. Sans utiliser de bibliothèques spéciales, ce projet peut fonctionner avec Torch 0.3.1, Python 3.6 et cuDNN. L’équipe de recherche a fourni tous les matériaux nécessaires sur son référentiel GitHub.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.