TencentオープンソースのアルゴリズムBetters顔検出ベンチマーク

中国の技術大手Tencentは、その顔検出アルゴリズムDSFD(デュアルショット顔検出器)をオープンソース 関連論文DSFD:Dual Shot Face Detectorは、より広い顔およびFDDBデータセットベンチマークで最先端の性能を達成し、top computer vision conference CVPR2019に採択されました。

DSFD

顔検出は、顔のアライメント、解析、認識、および検証のための基本的なステップです。 TencentのAIに焦点を当てたYoutu Labの研究者は、3つのDSFD顔検出技術を提案しています:

  1. Feature Enhance Module(FEM):元のフィーチャマップを転送して、シングルショット検出器をデュアルショット検出器に拡張し、それらをより識別可能で堅牢にします。
  2. プログレッシブアンカー損失(PLA):二組のアンカーを使用して計算され、フィーチャを効果的に容易にするために適応されます。
  3. 改善されたアンカーマッチング(IAM):リグレッサのためのより良い初期化を提供するために、DSFDで新しいデータ増強技術とアンカー設計戦略を統合します。
DSFDフレームワークは、フィードフォワードVGG16アーキテクチャの上に機能強化モジュール(b)を使用して、元の機能(a)から強化された機能©を生成します。

実験結果

DSFDフレームワークは実験において優れた性能を示しています。 以下の画像を観察すると、DSFDは、スケール、ポーズ、閉塞、ぼやけ、メイク、照明、モダリティ、および反射の変化を有する顔を検出する際に高い有効性を示した。 青い境界ボックスは、検出器の信頼度が0.8を超えていることを示します。

大きい変化のDSFDの有効性。

研究グループはまた、より広い顔とFDDBデータセットのための現在のベンチマークで広範な実験とアブレーション研究を実施しました。

より広い顔データセットでは、以下に示すように、DSFDは、検証セットで96.6%(Easy)、95.7%(Medium)、90.4%(Hard)、テストセットで96.0%(Easy)、95.3%(Medium)、90.0%(Hard)の三つのサブセットで平均精度の最

———–

以下に示すように、FDDBデータセットを使用すると、DSFDは不連続および連続ROC曲線の両方で最先端の性能を達成しました:99.1%および86。偽陽性の数が1,000に等しい場合、2%。

FDDBデータセットの一般的な最先端の方法との比較。 最初の行には追加の注釈なしのROC結果が表示され、2番目の行には追加の注釈付きのROC結果が表示されます。

プロジェクトの再実装

DSFDプロジェクトはPyTorchに実装されています。 特別なライブラリを使用せずに、このプロジェクトはTorch0.3.1、Python3.6、およびCuDNNで実行できます。 研究チームは、GitHubリポジトリに必要なすべての資料を提供しています。

コメントを残す

メールアドレスが公開されることはありません。