Tencent Open-Sourced Algorithm Betters Benchmarks for ansigtsgenkendelse

Kinesisk teknologigigant Tencent har open-sourced sin ansigtsgenkendelsesalgoritme dsfd (Dual Shot Face Detector). Det relaterede papir DSFD: Dual Shot Face Detector opnår avanceret ydeevne på bredere ansigts-og FDDB-datasæt benchmarks og er blevet accepteret af top computer vision conference CVPR 2019.

DSFD

ansigtsgenkendelse er et grundlæggende trin for ansigtsjustering, parsing, genkendelse og verifikation. Forskere fra Tencents AI-fokuserede Youtu-laboratorium foreslår tre dsfd-ansigtsdetektorteknikker:

  1. Feature Enhance Module (FEM): overførsel af de originale funktionskort for at udvide single shot detektoren til en dual shot detektor og gøre dem mere diskriminerbare og robuste.
  2. progressivt Ankertab (PLA): beregnet ved hjælp af to sæt ankre og tilpasset til at lette funktioner effektivt.
  3. forbedret Ankermatchning (IAM): integration af nye dataforstørrelsesteknikker og ankerdesignstrategi i dsfd for at give bedre initialisering for regressoren.
dsfd-rammen bruger et Funktionsforbedringsmodul (b) oven på en fremadgående vgg16-arkitektur til at generere forbedrede funktioner, der er fra de originale Funktioner (A); sammen med to tabslag, første skud PAL for de originale funktioner og andet skud PAL for de forbedrede funktioner.

Eksperimentresultater

dsfd-rammen viser fremragende ydeevne i eksperimenter. Iagttagelse af følgende billeder demonstrerede DSFD høj effektivitet til at detektere ansigter med variationer i skala, pose, okklusion, sløring, makeup, belysning, modalitet og refleksion. Blå afgrænsningsbokse angiver, at detektorens tillid er over 0,8.

effektivitet af DSFD med store variationer.

forskningsgruppen gennemførte også omfattende eksperimenter og ablationsundersøgelser med aktuelle benchmarks for det bredere ansigt og FDDB datasæt.

med det bredere ANSIGTSDATASÆT, som vist nedenfor, opnåede DSFD avanceret ydeevne for gennemsnitlig præcision på tre undergrupper: 96,6% (let), 95,7% (Medium) og 90,4% (hårdt) på valideringssættet; og 96,0% (let), 95,3% (Medium) og 90,0% (hårdt) på testsættet.

præcision-recall kurver på bredere ansigt validering og test delmængde.

med FDDB-datasættet, som vist nedenfor, opnåede DSFD avanceret ydeevne på både diskontinuerlige og kontinuerlige ROC-kurver: 99,1% og 86.2%, Når antallet af falske positiver er lig med 1.000.

sammenligninger med populære state-of-the-art metoder på FDDB datasæt. Den første række viser ROC-resultaterne uden yderligere kommentarer, og den anden række viser ROC-resultaterne med yderligere kommentarer.

Re-implementering af projektet

DSFD-projektet gennemføres på PyTorch. Uden brug af specielle biblioteker kan dette projekt køre med Torch 0.3.1, Python 3.6 og CuDNN. Forskergruppen har leveret alle nødvendige materialer på deres GitHub-arkiv.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.