Tencent Open-Sourced Algorithm Betters Face Detection Benchmarks

chiński gigant technologiczny Tencent udostępnił swój algorytm detekcji twarzy Dsfd (Dual Shot Face Detector). Powiązany papier Dsfd: Dual Shot Face Detector osiąga state-of-the-art wydajność w szerszych benchmarkach zestawów danych FACE I FDDB i został zaakceptowany przez top computer vision conference CVPR 2019.

dsfd

wykrywanie twarzy jest podstawowym krokiem do wyrównania twarzy, parsowania, rozpoznawania i weryfikacji. Naukowcy z laboratorium youtu skoncentrowanego na sztucznej inteligencji Tencent proponują trzy techniki detektora twarzy DSFD:

  1. funkcja moduł ulepszania (Fem): przeniesienie oryginalnych map funkcji w celu rozszerzenia detektora pojedynczego strzału na detektor podwójnego strzału i uczynienia go bardziej rozróżnialnym i wytrzymałym.
  2. Progressive Anchor Loss (Pla): obliczana przy użyciu dwóch zestawów kotwic i dostosowana do skutecznego ułatwiania funkcji.
  3. ulepszone dopasowywanie kotwic (iam): Integracja nowatorskich technik augmentacji danych i strategii projektowania kotwic w DSFD, aby zapewnić lepszą inicjalizację regresora.
framework DSFD wykorzystuje moduł ulepszania funkcji (b) na architekturze feedforward VGG16 do generowania ulepszonych funkcji © z oryginalnych funkcji (a); wraz z dwiema warstwami stratnymi, pierwszym strzałem PAL dla oryginalnych funkcji i drugim strzałem PAL dla ulepszonych funkcji.

wyniki eksperymentu

struktura DSFD pokazuje wyjątkową wydajność w eksperymentach. Obserwując poniższe obrazy, DSFD wykazał wysoką skuteczność w wykrywaniu twarzy o różnej skali, pozie, okluzji, rozmyciu, makijażu, oświetleniu, modalności i odbiciu. Niebieskie pola obwiedni wskazują, że ufność detektora wynosi powyżej 0,8.

skuteczność DSFD z dużymi zmianami.

grupa badawcza przeprowadziła również rozległe eksperymenty i badania ablacji z aktualnymi benchmarkami dla szerszych zestawów danych FACE I FDDB.

dzięki szerszemu zestawowi danych twarzy, jak pokazano poniżej, DSFD osiągnął najnowocześniejszą wydajność dla średniej precyzji w trzech podzbiorach: 96,6% (łatwy), 95,7% (średni) i 90,4% (twardy) w zestawie walidacyjnym; oraz 96,0% (łatwy), 95,3% (średni) i 90,0% (twardy) w zestawie testowym.

krzywe Precision-recall na szerszym podzbiorze walidacji i testowania twarzy.

dzięki zestawowi danych FDDB, jak pokazano poniżej, DSFD osiągnął najnowocześniejszą wydajność zarówno na nieciągłych, jak i ciągłych krzywych ROC: 99,1% i 86.2%, gdy liczba fałszywych alarmów wynosi 1000.

porównania z popularnymi, najnowocześniejszymi metodami w zbiorze danych FDDB. Pierwszy wiersz pokazuje wyniki ROC bez dodatkowych adnotacji, a drugi wiersz pokazuje wyniki ROC z dodatkowymi adnotacjami.

ponowne wdrożenie projektu

projekt DSFD jest realizowany na platformie PyTorch. Bez użycia żadnych specjalnych bibliotek, ten projekt może działać z Torch 0.3.1, Python 3.6 i CuDNN. Zespół badawczy dostarczył wszystkie niezbędne materiały na ich repozytorium GitHub.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.