Tencent Open-Source Algoritmo migliora Face Detection Benchmark

tecnologia cinese gigante Tencent ha open-source il suo algoritmo di rilevamento dei volti DSFD (Dual Shot Face Detector). Il documento correlato DSFD: Dual Shot Face Detector raggiunge prestazioni all’avanguardia su benchmark di dataset PIÙ ampi e FDDB ed è stato accettato dalla top computer vision conference CVPR 2019.

DSFD

Face detection è un passo fondamentale per l’allineamento facciale, l’analisi, il riconoscimento e la verifica. I ricercatori del laboratorio Youtu di Tencent focalizzato sull’IA propongono tre tecniche di rilevamento del volto DSFD:

  1. Feature Enhance Module (FEM): trasferimento delle mappe originali delle funzionalità per estendere il rilevatore a colpo singolo a un rilevatore a doppio colpo e renderli più discriminabili e robusti.
  2. Perdita di ancoraggio progressiva( PLA): calcolata utilizzando due serie di ancore e adattate per facilitare efficacemente le funzionalità.
  3. Improved Anchor Matching (AM): integrazione di nuove tecniche di aumento dei dati e strategia di progettazione dell’ancoraggio in DSFD per fornire una migliore inizializzazione per il regressore.
Il framework DSFD utilizza un modulo Feature Enhance (b) in cima a un’architettura feedforward VGG16 per generare funzionalità avanzate © dalle funzionalità originali (a); insieme a due livelli di perdita, First Shot PAL per le funzionalità originali e Second Shot PAL per le funzionalità avanzate.

Risultati dell’esperimento

Il framework DSFD mostra prestazioni eccezionali negli esperimenti. Osservando le seguenti immagini, DSFD ha dimostrato un’elevata efficacia nel rilevare volti con variazioni su scala, posa, occlusione, sfocatura, trucco, illuminazione, modalità e riflessione. I riquadri di delimitazione blu indicano che la confidenza del rivelatore è superiore a 0,8.

Efficacia di DSFD con grandi variazioni.

Il gruppo di ricerca ha anche condotto ampi esperimenti e studi di ablazione con gli attuali benchmark per i set di dati WIDER FACE e FDDB.

Con il set di dati VISO PIÙ AMPIO, come mostrato di seguito, DSFD ha raggiunto prestazioni all’avanguardia per una precisione media su tre sottoinsiemi: 96,6% (Facile), 95,7% (Medio) e 90,4% (Difficile) sul set di convalida; e 96,0% (Facile), 95,3% (Medio) e 90,0% (Difficile) sul set di test.

Curve di richiamo di precisione su sottoinsiemi di convalida e test di FACCE PIÙ AMPI.

Con il set di dati FDDB, come mostrato di seguito, DSFD ha raggiunto prestazioni all’avanguardia su curve ROC sia discontinue che continue: 99,1% e 86.2% quando il numero di falsi positivi è uguale a 1.000.

Confronti con metodi popolari all’avanguardia sul set di dati FDDB. La prima riga mostra i risultati ROC senza annotazioni aggiuntive e la seconda riga mostra i risultati ROC con annotazioni aggiuntive.

Re-implementazione del Progetto

Il progetto DSFD è implementato su PyTorch. Senza utilizzare librerie speciali, questo progetto può essere eseguito con Torch 0.3.1, Python 3.6 e cuDNN. Il team di ricerca ha fornito tutti i materiali necessari sul loro repository GitHub.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.