Tencent nyílt forráskódú algoritmus Betters Face Detection Benchmarks

a kínai technológiai óriás Tencent nyílt forrású arcfelismerő algoritmusát, a Dsfd-t (Dual Shot Face Detector). A dsfd: Dual Shot Face Detector a legmodernebb teljesítményt nyújtja a szélesebb arc és az FDDB adatkészlet referenciaértékein, és a top computer vision conference CVPR 2019 elfogadta.

DSFD

az arcfelismerés az arc igazításának, elemzésének, felismerésének és ellenőrzésének alapvető lépése. A Tencent AI-központú Youtu Laboratóriumának kutatói három dsfd arcdetektor technikát javasolnak:

  1. Feature Enhance Module (Fem): az eredeti funkciótérképek átvitele, hogy az egylövésérzékelőt kettős lövésérzékelővé bővítse, és megkülönböztethetőbbé és robusztusabbá tegye őket.
  2. progresszív Horgonyveszteség (Pla): két horgonykészlet használatával számítható ki, és a funkciók hatékony megkönnyítésére adaptálva.
  3. továbbfejlesztett Anchor Matching (iam): új adatnövelési technikák és horgonytervezési stratégia integrálása a dsfd-be a regresszor jobb inicializálása érdekében.
a DSFD keretrendszer egy Feature Enhance modult (b) használ a feedforward VGG16 architektúra tetején, hogy továbbfejlesztett funkciókat generáljon az eredeti funkciókból (a); két veszteségréteggel együtt, az első lövés PAL az eredeti funkciókhoz, a második lövés PAL a továbbfejlesztett funkciókhoz.

kísérleti eredmények

a DSFD keretrendszer kiemelkedő teljesítményt mutat a kísérletekben. A következő képeket figyelve a DSFD nagy hatékonyságot mutatott az arcok észlelésében a skála, a póz, az elzáródás, az elmosódás, a smink, a megvilágítás, a modalitás és a reflexió variációival. A kék határoló dobozok azt jelzik, hogy az érzékelő megbízhatósága 0,8 felett van.

a DSFD hatékonysága nagy variációkkal.

a kutatócsoport kiterjedt kísérleteket és ablációs vizsgálatokat végzett a szélesebb arc-és FDDB-adatkészletek jelenlegi referenciaértékeivel.

a szélesebb arc adatkészlettel, amint az alább látható, a DSFD a legkorszerűbb teljesítményt érte el az átlagos pontosság érdekében három részhalmazon: 96,6% (könnyű), 95,7% (közepes) és 90,4% (kemény) a validációs készleten; és 96,0% (könnyű), 95,3% (közepes) és 90,0% (kemény) a tesztkészleten.

precíziós visszahívási görbék szélesebb arc validálás és tesztelés részhalmaza.

az FDDB adatkészlettel, amint az alább látható, a DSFD a legkorszerűbb teljesítményt érte el mind a folytonos, mind a folytonos ROC görbéken: 99,1% és 86.2%, ha a hamis pozitív eredmények száma 1000.

összehasonlítás a népszerű state-of-the-art módszerek az FDDB adatkészlet. Az első sor a ROC eredményeit mutatja további megjegyzések nélkül,a második sor pedig a ROC eredményeit további megjegyzésekkel.

a projekt újbóli végrehajtása

a DSFD projekt a PyTorch-on valósul meg. Anélkül, hogy bármilyen speciális könyvtárak, ez a projekt futtatható Torch 0.3.1, Python 3.6 és CuDNN. A kutatócsoport minden szükséges anyagot biztosított a GitHub adattárán.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.