Tencent Open-Source Algorithm Betters Face Detection Benchmarks

Chinese technology giant Tencent has open-sourced its face detection algorithm DSFD (Dual Shot Face Detector). The related paper DSFD: Dual Shot Face Detector achieves state-of-the-art performance on WIDER FACE and FDDB dataset benchmarks, and has been accepted by top computer vision conference CVPR 2019.

DSFD

a detecção facial é um passo fundamental para o alinhamento facial, análise, reconhecimento e verificação. Pesquisadores do Laboratório Youtu focalizado em IA da Tencent propõem três técnicas de detecção de rosto DSFD:

  1. Feature Enhance Module (FEM): transferindo os mapas de recursos originais para estender o detector de tiro único para um detector de tiro duplo e torná-los mais discrimináveis e robustos.
  2. perda progressiva de âncora( PLA): calculada usando dois conjuntos de âncoras e adaptado para facilitar as características de forma eficaz.
  3. Improved Anchor Matching( IAM): Integrating novel data augmentation techniques and anchor design strategy in DSFD to provide better initialization for the regressor.
O DSFD framework usa um Recurso de Melhorar o Módulo de (b) em topo de uma feedforward VGG16 arquitetura para gerar recursos avançados © de características originais (a), juntamente com dois perda de camadas, o Primeiro Tiro PAL para as características originais, e Segundo Tiro PAL para os recursos avançados.

resultados de experiências

O quadro DSFD mostra um desempenho notável em experiências. Observando as seguintes imagens, DSFD demonstrou alta eficácia na detecção de faces com variações em escala, pose, oclusão, desfocação, maquiagem, iluminação, modalidade e reflexão. As caixas envolventes azuis indicam que a confiança do detector está acima de 0,8.

a Eficácia de DSFD com grandes variações.

the research group also conducted extensive experiments and ablation studies with current benchmarks for the WIDER FACE and FDDB datasets.

Com a MAIOR CARA de conjunto de dados, como mostrado abaixo, DSFD alcançado state-of-the-art de desempenho de precisão média em três subconjuntos: 96.6% (Fácil), 95.7% (Médio) e 90.4% (Rígido) sobre o conjunto de validação; e 96.0% (Fácil), 95.3% (Médio) e 90,0% (Rígido) sobre o conjunto de teste.

Precision-recall curvas na MAIOR CARA de validação e teste de subconjunto.

com o conjunto de dados FDDB, como mostra abaixo, a DSFD obteve um desempenho de última geração nas curvas rotativas contínuas e descontínuas: 99,1% e 86.2% quando o número de falsos positivos é igual a 1000.

as Comparações com os populares estado-de-o-arte de métodos de FDDB conjunto de dados. A primeira linha mostra os resultados da ROC sem anotações adicionais, e a segunda linha mostra os resultados da ROC com anotações adicionais.

re-execução do projecto

o projecto DSFD é implementado em PyTorch. Sem usar bibliotecas especiais, este projeto pode ser executado com Torch 0.3.1, Python 3.6 e CuDNN. A equipe de pesquisa forneceu todos os materiais necessários em seu repositório GitHub.

Deixe uma resposta

O seu endereço de email não será publicado.