PMAL: Open Set Recognition via Robust Prototype Mining

摘要

开放集识别(OSR)一直是一个新兴的课题。除了识别预定义的类外,系统还需要拒绝未知数。原型学习是处理这个问题的一种潜在方式,因为它提高类内表示的紧凑性的能力在区分已知和未知数时是非常需要的。在这项工作中,我们提出了一个新的原型挖掘和学习(PMAL)框架。在优化嵌入空间阶段之前,它有一个原型挖掘机制,明确地考虑了两个关键特性,即原型集的高质量和多样性。具体地说,首先从基于数据不确定性学习的训练样本中提取出一组高质量的候选样本,避免了意外噪声的干扰。考虑到对象在单一类别中的多样性出现,提出了一种基于多样性的原型集滤波策略。因此,可以更好地优化嵌入空间,以区分其中的预定义类以及在已知数和未知数之间。大量的实验验证了在原型挖掘中所包含的两个良好的特性(即高质量和多样性),并显示了与现有技术相比,所提出的框架的显著性能。

Prototypes(原型):代表每个类的鉴别特征。 Figure 1: Two typical problems on implicitly learned prototypes. (a) Undesired learned prototypes arisen from lowquality samples. (b) Redundancy in similar prototypes and lacks of diversity. The in-between ellipse shows the feature distribution of a exemplary class ‘airplane’. 高质量的样本周围会有较多的样本,彼此之间的距离也较近。之前的研究中,由于样本质量低和缺乏多样性而导致原型不可靠,导致原型的代表性有限。使用原型会出现两大问题。

  1. 第一种问题就是在特征空间中原型接近低质量样本点。例如上图(a)中棕色的五角星表示的原型,就是受到低质量样本的影响。低质量的样本往往都具有比较模糊的特征。原型应该代表每个类别的鉴别特征,所以只有高质量的样本才合适。
  2. 第二种问题就是在类似原型中缺乏多样性的冗余。没有明确的指导,一个类别的原型显示出许多冗余,不能充分代表多样的外观。上图(b)中绿色标记的原型在特征空间中相邻,附近的样本显示出相似的外观,这意味着学习到的原型存在冗余。

Figure 2: The proposed prototype mining and learning framework. Different colors denote different classes. Prototype Mining And Learning (PMAL)的框架图如上所示。

  1. 原型挖掘阶段。首先根据最新提出的度量嵌入拓扑鲁棒性从训练集中提取高质量的候选对象,该方法捕获了由固有的低质量因素引起的样本中包含的数据不确定性。然后设计了原型集过滤,在每个类中包含原型的多样性。
  2. 嵌入优化阶段。给定高可靠的原型,嵌入空间通过一个设计良好的点到集的距离度量进行优化。通过提前挖掘原型和有序的特征优化,也减少了训练负担,因为后期只针对嵌入空间工作。

本文的方法本质还是将已知类别限定在紧凑的特征空间中,然后给未知类别提供更大的特征空间。

经验分享 程序员 微信小程序 职场和发展