Tencent Open-Source algoritmus Betters Face Detection benchmarky

čínský technologický gigant Tencent má open-source svůj algoritmus detekce obličeje DSFD (Dual Shot Face Detector). Související papír Dsfd: Dual Shot face Detector dosahuje state-of-the-art výkon na širší tváře a FDDB datové sady benchmarků, a byl přijat top computer vision conference CVPR 2019.

dsfd

detekce obličeje je základním krokem pro zarovnání obličeje, analýzu, rozpoznávání a ověření. Vědci z laboratoře Youtube zaměřené na AI Tencent navrhují tři techniky detektoru obličeje DSFD:

  1. feature Enhance Module (FEM): přenos původních map funkcí pro rozšíření detektoru s jedním výstřelem na detektor s dvojitým výstřelem a jejich větší rozlišitelnost a robustnost.
  2. Progressive Anchor Loss (PLA): vypočteno pomocí dvou sad kotev a přizpůsobeno pro efektivní usnadnění funkcí.
  3. vylepšené přizpůsobení kotev (iam): integrace nových technik augmentace dat a strategie návrhu kotev v DSFD pro lepší inicializaci regresoru.
rámec DSFD používá modul vylepšení funkcí (b) na vrcholu architektury vgg16 pro generování vylepšených funkcí © z původních funkcí (a); spolu se dvěma ztrátovými vrstvami, First Shot PAL pro původní funkce a Second Shot PAL pro vylepšené funkce.

výsledky experimentu

rámec DSFD vykazuje vynikající výkon v experimentech. Při pozorování následujících obrázků prokázala DSFD vysokou účinnost při detekci tváří s variacemi na stupnici, póze, okluzi, rozmazání, make-up, osvětlení, modalitu a odraz. Modré ohraničující políčka ukazují, že důvěra detektoru je nad 0,8.

účinnost DSFD s velkými variacemi.

výzkumná skupina také provedla rozsáhlé experimenty a ablační studie se současnými měřítky pro širší datové soubory FACE a FDDB.

s datovým souborem širší tváře, jak je uvedeno níže, DSFD dosáhl nejmodernějšího výkonu pro průměrnou přesnost na třech podmnožinách: 96,6% (Easy), 95,7% (Medium) a 90,4% (Hard) na ověřovací sadě; a 96,0% (Easy), 95,3% (Medium) a 90,0% (Hard) na testovací sadě.

přesné-recall křivky na širší validaci obličeje a testování podmnožinu.

s datovou sadou FDDB, jak je ukázáno níže, DSFD dosáhl špičkového výkonu na diskontinuálních i spojitých křivkách ROC: 99,1% a 86.2%, pokud se počet falešných pozitiv rovná 1000.

srovnání s populárními nejmodernějšími metodami na datovém souboru FDDB. První řádek zobrazuje výsledky ROC bez dalších anotací a druhý řádek zobrazuje výsledky ROC s dalšími anotacemi.

re-implementace projektu

projekt DSFD je realizován na PyTorch. Bez použití speciálních knihoven může tento projekt běžet s Torch 0.3.1, Python 3.6 a CuDNN. Výzkumný tým poskytl všechny potřebné materiály na svém úložišti GitHub.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.