Tencent Åpen Kildekode Algoritme Betters Ansiktsgjenkjenning Benchmarks

Kinesisk teknologi giganten Tencent har åpen kildekode sin ansiktsgjenkjenning algoritme DSFD (Dual Shot Face Detector). Det relaterte papiret DSFD: Dual Shot Face Detector oppnår toppmoderne ytelse på BREDERE ANSIKT og FDDB datasett benchmarks, og har blitt akseptert av top computer vision conference CVPR 2019.

DSFD

Ansiktsgjenkjenning er et grunnleggende trinn for ansiktsjustering, parsing, gjenkjenning og verifisering. Forskere fra Tencent AI-fokuserte Youtu Lab foreslår tre dsfd ansiktsdetektor teknikker:

  1. Feature Enhance Module (FEM): Overføring av de opprinnelige funksjonskartene for å utvide single shot detektoren til en dual shot detektor og gjøre dem mer diskriminerbare og robuste.
  2. Progressivt Ankertap (PLA): Beregnet ved å bruke to sett med ankre og tilpasset for å lette funksjoner effektivt.
  3. Forbedret Ankermatching (IAM): Integrering av nye dataforstørrelsesteknikker og ankerdesignstrategi I DSFD for å gi bedre initialisering for regressoren.
DSFD-rammeverket bruker En Funksjonsforbedringsmodul (b) på toppen av en feedforward VGG16-arkitektur for å generere forbedrede funksjoner © fra de opprinnelige funksjonene (a); sammen med to tapslag, Første Skudd PAL for de opprinnelige funksjonene, Og Andre Skudd PAL for de forbedrede funksjonene.

Eksperimentresultater

DSFD framework viser fremragende ytelse i eksperimenter. Ved å observere følgende bilder viste DSFD høy effektivitet ved å oppdage ansikter med variasjoner på skala, pose, okklusjon, blurriness, sminke, belysning, modalitet og refleksjon. Blå markeringsbokser indikerer at detektorens tillit er over 0,8.

Effektivitet AV DSFD med store variasjoner.

forskergruppen gjennomførte også omfattende eksperimenter og ablasjonsstudier med gjeldende benchmarks FOR BREDERE ANSIKT og FDDB datasett.

MED DET BREDERE ANSIKTSDATASETTET, som vist nedenfor, oppnådde DSFD toppmoderne ytelse for gjennomsnittlig presisjon på tre undergrupper: 96,6% (Lett), 95,7% (Middels) og 90,4% (Hardt) på valideringssettet; og 96,0% (Lett), 95,3% (Middels) og 90,0% (Hardt) på testsettet.

Precision-recall kurver PÅ BREDERE ansikt validering og testing delsett.

MED FDDB-datasettet, som vist nedenfor, oppnådde DSFD toppmoderne ytelse på både diskontinuerlige OG kontinuerlige ROC-kurver: 99,1% og 86.2% når antall falske positiver er lik 1000.

Sammenligninger med populære state-of-the-art metoder PÅ FDDB datasett. Den første raden viser ROC-resultatene uten ytterligere merknader, og den andre raden viser ROC-resultatene med flere merknader.

Re-implementere Prosjektet

DSFD-prosjektet er implementert På PyTorch. Uten å bruke noen spesielle biblioteker, kan dette prosjektet kjøre Med Torch 0.3.1, Python 3.6 og CuDNN. Forskerteamet har gitt alle nødvendige materialer på GitHub-depotet.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.