[CVPR2022] ACPL: Anti-curriculum Pseudo-labelling for Semi-supervised Medical Image Classification

news/2023/11/30 23:19:22

ACPL: Anti-curriculum Pseudo-labelling for Semi-supervised Medical Image Classification

要点:

1、医学分析中有效的半监督学习需要:有效地处理多类别(病变分类)和多标签(多疾病诊断),以及不平衡(疾病流行率的高差异);
2、策略之一:基于伪标签 pseudo labeling,但是:
(a)比一致性学习 consistency learning 的准确率低,
(b)并不是专门针对于多分类和多标签问题而设计,
(c)受不平衡学习 imbalanced learning 的影响;
3、传统方法:通过阈值选择置信伪标签 select confident pseudo label by threshold
4、本文的 ACPL
(a)引入新的技术选择信息性的未标记样本,以处理不平衡和多分类、多标签,
(b)通过分类器的精准集合来估计伪标签,提高伪标签的准确率;
5、SOTA 方法:未标记数据的一致性学习 + 自监督预训练
6、伪标签方法:为高置信度的未标记样本分配标签以重新训练模型,但是,对于不均衡问题,自信分类的未标记样本代表信息最少的样本,这些样本可能属于多数类,这将使得分类偏向多数类,并且极有可能降低少数类别的分类精度;
7、选择高置信度的伪标签样本:
(a)对所有类别使用固定的阈值,
(b)类阈值 class-wise threshold:处理不均衡、多标签的类别相关性,更精确的伪标签预测,但是如果不知道类分布情况将很难估计该阈值,
(c)将模型输出用于伪标记过程,可能导致确认偏差 confirmation bias,分配错误的伪标签将增加模型在错误预测上的置信度,从而降低模型准确率;

ACPL

1、新的信息含量度量方法 —— 交叉分布样本信息性 cross-distribution sample informativeness

新的方法:选择用于伪标记的最具信息量的未标记数据
(基于本文假设:对于半监督学习,未标记和标记样本之间存在分布转移 distribution shift)
有效的学习课程 learning curriculum 必须关注于离标记样本分布尽可能远的信息性未标记样本 informative unlabeled samples
(选择这些样本,将均衡训练并消除估计类分类阈值的需要)
未标记样本的信息含量度量,将由我们提出的交叉分布样本信息性 cross-distribution sample informativeness 计算,输出未标记样本与标记的锚点样本集合的接近程度(锚点样本是高信息性的已标记样本)

2、新的伪标记机制——信息混合 informative mixup

将模型分类与由样本信息性指导的 K 近邻 K-nearest neighbor (KNN) 分类相结合,提高预测精度并减轻确认偏差

3、锚点集合纯化方法 ASP (anchor set porification)

 选择最具信息的伪标记样本,将其包含在已标记的锚点集合,提升后续训练阶段 KNN 分类器的伪标签准确率

相关的工作:

基于一致性的 SSL:

优化已标记图像的分类预测,最小化未标记图像不同视图下的预测输出
不同视图来源于不同的图像扰动 image perturbation:空间、时间、对抗、数据增强
基于一致性的方法可以通过自监督的预训练提高性能
但是,依赖于需要领域知识的扰动函数,且需要适应每种新的医学图像

伪标记的 SSL:

使用可用的标记数据训练模型
预测根据高置信度分类的未标记样本的伪标签
利用伪标记样本重训练模型
但是,伪标签 SSL 会在不平衡问题中偏向于主要类,不能适应多类和多标签问题,且容易导致确认偏差
改进取决于以下两点:
1、信息性未标记样本的选取 —— 解决主要类偏差和对多类、多标签问题的适应
2、准确的伪标记机制 —— 解决确认偏差

基于信息含量的训练样本选取的现有研究:完全监督的课程和反课程学习方法 fully supervised curriculum and anti-curriculum learning methods

课程学习侧重于早期训练阶段的简单样本,然后逐渐包括后期训练阶段的硬样本
(简单样本:训练期间损失较小的样本;硬样本:损失较大)
反课程学习首先关注于硬样本,训练后期过渡到简单样本

但是,上述都是完全监督的。
现有研究:基于课程学习的伪标记 SSL
本文研究:为了获取不平衡的多类和多标签问题中的准确标签,我们遵循反课程学习:
1、伪标记可能属于少数类的最具信息性的样本 —— 有助于平衡训练
2、不需要估计类分类阈值即可选择样本 —— 无缝适应多类和多标签问题
证明了为伪标记选择高信息性样本的价值,以及从分类器集合选择伪标签的价值

ACPL 优化:
根据反课程策略为未标记样本生成准确的伪标签,在每个训练阶段,高信息性的未标记样本被选取进行伪标记

交叉分布样本信息性 CDSI:
未标记样本的信息标准

信息混合 IM:
信息混合:将模型的结果与使用锚点的K近邻分类器融合
使用信息混合生成信息性未标记样本的伪标签
每个训练结束,锚点集都使用锚点集合纯化方法 ASP 更新 —— 根据 CDSI准则,每次只保留伪标记样本中最具信息量的子集

消融实验:

图表:

ACPL VS 传统的伪标签半监督学习方法

上:ACPL;下:traditional
左:多标签胸部 X 光;右:多类别

在这里插入图片描述

ACPL 算法伪代码

 1. 根据 CDSI 和 IM 构建伪标记集2. 根据 ASP 更新锚点集3. 根据已标记集和伪标记集优化损失函数求模型输出4. 更新已标记集和未标记集

在这里插入图片描述

ACPL 算法图示

 1. 用已标记数据集和伪标记数据集训练模型2. 从锚点和未标记样本中提取特征3. 使用公式(4)中的 CDSI 估算未标记样本与锚点集的信息含量4. 使用公式(2)将未标记样本分为高、中、低信息含量5. 使用公式(6)中的 IM 为高信息含量的未标记样本分配一个伪标签6. 用新的伪标记样本更新伪标签训练集7. 使用公式(7)中的 ASP 更新锚点集合

在这里插入图片描述
ASP 图示

1. 找 D_U 中每个元素的 K 近邻有标记样本
2. 找 D_L 中每个元素的 K 近邻无标记样本
3. 针对 D_U 中的每个元素求两者的交集
4. 将 c(.) 最小的样本加入 D_A

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

代码:

https://github.com/FBLADL/ACPL


http://www.ppmy.cn/news/827782.html

相关文章

Cutadapt

在对下机数据进行处理的时候,原始的数据一般都带有接头,如果不除去接头序列,会对接下来的基因组装和比对产生较大的误差,所以这个时候需要对原始数据进行接头处理并过滤掉质量较差的序列,其中Cutadapt是一个比较经典的…

ACPI

ACPI ACPI 就是Advanced Configuration and Power Interface 的缩写,意思是“ 高级配置与电源接口” 。这是英特尔、微软和东芝共同开发的一种电源管理标准。 ACPI 可实现以下功能: 1 、用户可以使外设在指定时间开关;

ACPI Overview

最近有些时间,重温了一下ACPI SPEC Rev4.0,发现之前无法理解的东西,现在也不是那么难懂了。现整理一下笔记。 先来明确两个概念:ACPI,OSPM ACPI:Advanced Configuration and Power Interface 高级配置和电…

Python - Django框架 - 配置 MySQL 数据库

在Django中配置数据库主要步骤是: 安装数据库适配器。对于MySQL,使用: pip install mysqlclient对于SQLite(默认),则无需安装。 在settings.py中的DATABASES设置配置: 对于MySQL: DATABASES {default: {ENGINE: django.db.backends.mysql, NAME: 数据库名字, USER: 用…

剑指 offer 栈算法题:包含min函数的栈

题目描述:定义栈的数据结构,请在该类型中实现一个能够得到栈的最小元素的 min 函数在该栈中,调用 min、push 及 pop 的时间复杂度都是 O(1)。 分析: 数据栈 最小栈法,利用一个最小栈存放当前数据栈的最小元素&#x…

安装hisuite后,依然无法连接华为手机,驱动无法正确安装

安装hisuite后,依然无法连接手机。在设备管理器中HDB interface依旧有叹号, 设备状态提示注册中有问题 说明驱动依旧没有正确安装 解决办法 开始 运行 regedit 依次展开 HKEY_LOCAL_MACHINE/SYSTEM/CurrentControlSet/Control/Class/在这下面有很多用…

解决华为笔记本安装驱动后浏览器频闪

某一天,我在女友的笔记本打游戏时,发现fps极其低,后面发现是显卡的问题,安装了最新的显卡后,谷歌浏览器出现频闪,最大化和最小化会频闪,折腾了好久解决办法如下: 首先我关闭了谷歌的…

Spring boot 与redis 群集

以下是使用Spring Boot与Redis集群进行交互的代码示例&#xff1a; 1. 添加Redis依赖&#xff1a; - 在pom.xml文件中添加Spring Data Redis依赖&#xff1a; <dependency> <groupId>org.springframework.boot</groupId> <artifactId…

每日小技巧:教您ps提示内存不足怎么办?

1、首先右击“编辑”打开下拉菜单&#xff0c;选中“首选项”&#xff0c;在点击“性能”&#xff0c;然后会弹出内存调节界面. 2、在首选项的下拉菜单点击“性能”&#xff0c;然后会弹出内存调节界面. 3、在弹出的快捷菜单可以查看到内存的“可用内存”大小&#xff0c;“p…

打开ps显示计算机内存不足怎么办,ps显示内存不足怎么办,教你ps显示内存不足怎么办...

ps设计者反馈&#xff0c;遇到了PS使用时提示内存不足的情况&#xff0c;就是在用PS设计东西的时候有时会遇见PS提示内存不足类似的情况&#xff0c;ps显示内存不足怎么办?这通常是电脑配置不够/photoshop版本较高占用内存较大所致。下面小编教你ps显示内存不足怎么办吧。 ps显…

ps html 优化,photoshop越用越卡的解决方法,ps性能优化教程

温馨提示&#xff1a;修改完成后&#xff0c;需重启 Ps 让设置生效。 1.2 缓存 什么是高速缓存级别&#xff1f; 它可以 提高软件响应速度&#xff0c;但是缓存级别越高&#xff0c;相对应的会增加图像加载的时间。 如果将「高速缓存级别」设置为 1&#xff0c;可能会使用某些 …

ps显示计算机内存不足怎么办,PS常见问题——内存不足,解决办法!

原标题:PS常见问题——内存不足,解决办法! 今天讲讲设计师常遇到的问题。 不管是初次接触ps的,还是长期工作的设计师,每个人无一例外,都会到遇到ps崩溃的时候,这里我针对其中几个小问题来说说使用ps的时候,该常做的几件事。 11111111111111111111111111111111111111111…

打开ps显示计算机内存不足怎么办,ps内存不足怎么办【解决方法】

Ps内存不足怎么办?当我们在使用电脑的时候&#xff0c;有时候是需要使用一些ps和p图片的软件的&#xff0c;我们需要保存这些图片。我们在编辑一些多层的文件的时候&#xff0c;有可能会遇到Ps内存不足的问题。这是怎么引起的呢?我们的电脑的日内存是有限的&#xff0c;而且我…

ps 提示暂存满,不能导入文件

ps用的时候导入新文件提示暂存满&#xff0c;不能导入&#xff0c;网上搜索了不少&#xff0c;然后通过自己实践觉得有效&#xff0c;然后有如下经验&#xff1a; 暂存满可能存在几个问题 1、暂存盘满 2、ps设置的内存可使用不够 解决办法&#xff1a; 1、编辑->首选项-&…

PS学习笔记-----提示暂存盘满了怎么办???

&#xff1a;&#xff1a;&#xff1a;&#xff1a; 编辑--------》首选项--------------》性能-------暂存盘-----》勾选较大的磁盘做暂存盘

C语言,指针易错点

1、封装函数&#xff0c;用指针实现字符串连接 #include <stdio.h> #include <string.h> void MyStrcat(char *dest,char *src) {int i;for(i0;*(desti);i);for(int j0;*(srcj);j)*(desti)*(srcj);*(desti)0; } int main(int argc, const char *argv[]) {char des…

LeetCode 0016. 最接近的三数之和

【LetMeFly】16.最接近的三数之和&#xff1a;排序 双指针 力扣题目链接&#xff1a;https://leetcode.cn/problems/3sum-closest/ 给你一个长度为 n 的整数数组 nums 和 一个目标值 target。请你从 nums 中选出三个整数&#xff0c;使它们的和与 target 最接近。 返回这三…

【unity之IMGUI实践】单例模式管理面板对象【一】

&#x1f468;‍&#x1f4bb;个人主页&#xff1a;元宇宙-秩沅 &#x1f468;‍&#x1f4bb; hallo 欢迎 点赞&#x1f44d; 收藏⭐ 留言&#x1f4dd; 加关注✅! &#x1f468;‍&#x1f4bb; 本文由 秩沅 原创 &#x1f468;‍&#x1f4bb; 收录于专栏&#xff1a;uni…

炸裂!三星Galaxy S10默认支持BTC和ETH,数千万潜在用户将体验区块链

本周四&#xff0c;三星公布了其最新旗舰手机Galaxy S10的首份官方说明&#xff0c;但仅简要提及其存储加密货币私钥的能力。 而来自韩国的朴槿萌&#xff08;Park Geun Mo&#xff09;成功在三星位于首尔的D’light旗舰店对该设备进行了测试&#xff08;这家科技巨头经常会在那…

[SSM]MyBatis的缓存与逆向工程

目录 十三、MyBatis的缓存 13.1一级缓存 13.2二级缓存 13.3MyBatis集成EhCache 十四、MyBatis的逆向工程 14.1逆向工程配置与生成 14.2测试 十三、MyBatis的缓存 缓存&#xff1a;cache 缓存的作用&#xff1a;通过减少IO的方式&#xff0c;来提高程序的执行效率。 myb…
最新文章