Tencent Open-Source algoritm Betters Face Detection benchmark-uri

gigantul tehnologic chinez Tencent și-a deschis algoritmul de detectare a feței DSFD (Dual Shot face Detector). Lucrarea aferentă DSFD: Dual Shot face Detector atinge performanțe de ultimă generație pe repere mai largi ale feței și ale setului de date FDDB și a fost acceptată de Conferința top computer vision CVPR 2019.

DSFD

detectarea feței este un pas fundamental pentru alinierea, analizarea, recunoașterea și verificarea feței. Cercetătorii de la Laboratorul youtu concentrat pe Ai al Tencent propun trei tehnici de detectare a feței DSFD:

  1. feature Enhance Module( FEM): transferarea hărților caracteristice originale pentru a extinde detectorul cu o singură lovitură la un detector cu dublă lovitură și pentru a le face mai discriminabile și mai robuste.
  2. pierderea progresivă a ancorei( PLA): calculată prin utilizarea a două seturi de ancore și adaptată pentru a facilita caracteristicile în mod eficient.
  3. potrivire îmbunătățită a ancorelor (IAM): integrarea tehnicilor noi de mărire a datelor și a strategiei de proiectare a ancorelor în DSFD pentru a oferi o inițializare mai bună pentru regresor.
cadrul DSFD utilizează un modul feature Enhance (B) pe partea de sus a unei arhitecturi feedforward VGG16 pentru a genera caracteristici îmbunătățite de la caracteristicile originale (a); împreună cu două straturi de pierdere, first shot PAL pentru caracteristicile originale și Second shot PAL pentru caracteristicile îmbunătățite.

rezultatele experimentului

cadrul DSFD prezintă performanțe remarcabile în experimente. Observând următoarele imagini, DSFD a demonstrat o eficiență ridicată în detectarea fețelor cu variații de scară, postură, ocluzie, neclaritate, machiaj, iluminare, modalitate și reflecție. Casetele de delimitare albastre indică faptul că încrederea detectorului este peste 0,8.

eficacitatea DSFD cu variații mari.

grupul de cercetare a efectuat, de asemenea, experimente ample și studii de ablație cu repere actuale pentru seturile de date mai largi și FDDB.

cu setul de date cu fața mai largă, așa cum se arată mai jos, DSFD a obținut performanțe de ultimă generație pentru precizie medie pe trei subseturi: 96,6% (ușor), 95,7% (mediu) și 90,4% (greu) pe setul de validare; și 96,0% (ușor), 95,3% (mediu) și 90,0% (greu) pe setul de testare.

curbe de rechemare de precizie pe subsetul de validare și testare a feței mai largi.

cu setul de date FDDB, după cum se arată mai jos, DSFD a obținut performanțe de ultimă generație atât pe curbe Roc discontinue, cât și continue: 99,1% și 86.2% atunci când numărul de fals pozitive este egal cu 1.000.

comparații cu metode populare de ultimă oră din setul de date FDDB. Primul rând arată rezultatele ROC fără adnotări suplimentare, iar al doilea rând arată rezultatele ROC cu adnotări suplimentare.

reimplementarea proiectului

proiectul DSFD este implementat pe PyTorch. Fără a utiliza biblioteci speciale, acest proiect poate rula cu Torch 0.3.1, Python 3.6 și CuDNN. Echipa de cercetare a furnizat toate materialele necesare în depozitul lor GitHub.

Lasă un răspuns

Adresa ta de email nu va fi publicată.