Tencent Open-Source algoritme Betters Face Detection Benchmarks

Chinese technologiegigant Tencent heeft open-source zijn face detection algorithm DSFD (Dual Shot Face Detector). De verwante paper DSFD: Dual Shot Face Detector bereikt state-of-the-art prestaties op breder gezicht en FDDB dataset benchmarks, en is geaccepteerd door top computer vision conference CVPR 2019.

DSFD

gezichtsherkenning is een fundamentele stap voor gezichtsuitlijning, parsing, herkenning en verificatie. Onderzoekers van Tencent ‘ s AI-gerichte Youtu Lab voorstellen drie DSFD gezicht detector technieken:

  1. Feature Enhance Module (FEM): overdracht van de originele feature maps om de single shot detector uit te breiden naar een dual shot detector en ze meer onderscheidbaar en robuust te maken.
  2. progressief Ankerverlies (Pla): berekend met behulp van twee reeksen ankers en aangepast om functies effectief te vergemakkelijken.
  3. verbeterde Anker Matching( IAM): integratie van nieuwe data augmentatie technieken en anker ontwerp strategie in DSFD voor een betere initialisatie voor de regressor.
de DSFD framework maakt gebruik van een Feature Enhance Module (b) op de top van een feedforward vgg16 architectuur te genereren enhanced features © van de originele features (a); samen met twee loss layers, First Shot PAL voor de originele features, en Second Shot PAL voor de verbeterde features.

resultaten van experimenten

het DSFD-raamwerk toont uitstekende prestaties in experimenten. Het observeren van de volgende beelden, DSD toonde een hoge effectiviteit in het detecteren van gezichten met variaties op schaal, pose, occlusie, onscherpte, make-up, verlichting, modaliteit, en reflectie. Blauwe bounding boxes geven aan dat het detectorvertrouwen hoger is dan 0,8.

effectiviteit van DSFD met grote variaties.

de onderzoeksgroep voerde ook uitgebreide experimenten en ablatiestudies uit met huidige benchmarks voor de datasets van de bredere pijler en de FDDB.

met de bredere gegevensset, zoals hieronder weergegeven, bereikte DSFD state-of-the-art prestaties voor gemiddelde precisie op drie subsets: 96,6% (Easy), 95,7% (Medium) en 90,4% (Hard) op de validatieset; en 96,0% (Easy), 95,3% (Medium) en 90,0% (Hard) op de testset.

Precision-recall curves op bredere gezicht validatie en testen subset.

met de FDDB-dataset, zoals hieronder te zien is, bereikte DSFD state-of-the-art prestaties op zowel discontinue als continue ROC-curves: 99,1% en 86.2% wanneer het aantal valse positieven gelijk is aan 1.000.

vergelijkingen met populaire state-of-the-art methoden op de FDDB dataset. De eerste rij toont de ROC-resultaten zonder extra annotaties, en de tweede rij toont de ROC-resultaten met extra annotaties.

heruitvoering van het Project

het DSFD-project wordt uitgevoerd op PyTorch. Zonder speciale bibliotheken te gebruiken, kan dit project draaien met Torch 0.3.1, Python 3.6 en CuDNN. Het onderzoeksteam heeft alle benodigde materialen geleverd op hun GitHub repository.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.