Instance-Aware, Context-Focused, and Memory-Efficient Weakly Supervised Object Detection

方法介绍

可以称之为W2FGAM+Reg的合体版。

  1. W2F:
    新的提取伪标签的策略:挑选前p%的伪标签,做nms
  2. GAM:
    用一个注意力网络(ResBlock+Hard Gumbel-Softmax)与整个网络对抗,drop掉判别性区域,称为Concrete DropBlock
  3. Reg:
    增加Regression分支

细节

Concrete DropBlock部分:Hard Gumbel-Softmax是一种把概率转换成0/1,并可以反传梯度的技巧。为了避免输出直接drop掉整个feature map,需要将每个点的概率和一个阈值[latex]\tau[/latex]取min。

一种节省显存的训练方法:从ROIPooling分开,前半部分先跑,后半部分将proposal分batch跑、反传梯度,然后前半部分再反传。

思考

DropBlock部分无疑是有些奇怪的,即使取了min,这个对抗无疑还是会学着去把整个feature map给drop掉。论文中并没有展示DropBlock的输出,值得怀疑会不会退化成random dropout。

One Comment

  1. 可以思考的很深入,期待你的paper

Leave a Comment

您的电子邮箱地址不会被公开。 必填项已用*标注