Tencent Open-Sourced Algorithm Betters Face Detection Benchmarks

Kiinalainen teknologiajätti Tencent has open-sourced its face detection algorithm DSFD (Dual Shot Face Detector). Aiheeseen liittyvä paperi DSFD: Dual Shot Face Detector saavuttaa huipputeknisen suorituskyvyn laajemmilla kasvot-ja FDDB-dataset-vertailuarvoilla, ja top computer vision conference cvpr 2019 on hyväksynyt sen.

DSFD

kasvojentunnistus on olennainen vaihe kasvojen kohdistamisessa, jäsentämisessä, tunnistamisessa ja todentamisessa. Tencentin tekoälyyn keskittyneen Youtu-laboratorion tutkijat ehdottavat kolmea DSFD-kasvojentunnistustekniikkaa:

  1. Feature Enhance Module (FEM): siirtämällä alkuperäinen ominaisuus kartat laajentaa yhden laukauksen ilmaisin dual laukaus ilmaisin ja tehdä niistä erottamiskelpoisempia ja kestävä.
  2. Progressive Anchor Loss (Pla): laskettu käyttämällä kahta ankkurisarjaa ja mukautettu helpottamaan ominaisuuksia tehokkaasti.
  3. parannettu Ankkurisovitus (iam): DSFD: ssä integroidaan uusia tiedonsuurennustekniikoita ja ankkurin suunnittelustrategiaa, jotta regressorille saadaan parempi alustus.
DSFD-kehyksessä käytetään feedforward VGG16-arkkitehtuurin päälle Ominaisuustehostemoduulia (B), joka tuottaa parannettuja ominaisuuksia © alkuperäisistä ominaisuuksista (a); yhdessä kahden häviökerroksen kanssa, ensimmäinen laukaus PAL alkuperäisille ominaisuuksille ja toinen laukaus PAL parannetuille ominaisuuksille.

kokeiden tulokset

DSFD-kehys osoittaa erinomaista suorituskykyä kokeissa. Tarkkailemalla seuraavia kuvia DSFD osoitti suurta tehokkuutta havaita Kasvot vaihtelut mittakaavassa, aiheuttaa, okkluusiota, blurriness, meikki, Valaistus, modaliteetti, ja heijastus. Siniruutujen mukaan ilmaisimen luotettavuus on yli 0,8.

Dsfd: n tehokkuus suurilla vaihteluilla.

tutkimusryhmä teki myös laajoja kokeita ja ablaatiotutkimuksia nykyisillä vertailuarvoilla WIDER FACE-ja FDDB-aineistoille.

WIDER FACE-aineistolla, kuten alla on esitetty, DSFD saavutti huipputason suorituskyvyn keskimääräisellä tarkkuudella kolmessa osajoukossa: 96,6% (Easy), 95,7% (Medium) ja 90,4% (Hard) validointijoukossa; ja 96,0% (Easy), 95,3% (Medium) ja 90,0% (Hard) testijoukossa.

Precision-recall curves on WIDER FACE validation and testing subset.

FDDB-aineiston avulla DSFD saavutti huippusuorituksen sekä epäjatkuvilla että jatkuvilla ROC-käyrillä: 99,1% ja 86.2%, kun väärien positiivisten määrä on 1000.

vertailuja suosittuihin huipputeknisiin menetelmiin FDDB-aineistossa. Ensimmäisellä rivillä näkyvät ROC-tulokset ilman Lisähuomautuksia ja toisella rivillä ROC-tulokset lisähuomautuksin.

projektin uudelleen toteuttaminen

DSFD-projekti toteutetaan Pytorchilla. Tämä projekti voi toimia Torch 0.3.1: llä, Python 3.6: lla ja CuDNN: lla ilman erityisiä kirjastoja. Tutkimusryhmä on toimittanut kaiken tarvittavan materiaalin GitHub-arkistoonsa.

Vastaa

Sähköpostiosoitettasi ei julkaista.